Torygreen

vip
Возраст 2.7 год
Максимальный уровень 0
Пока нет содержимого
nvidia сейчас больше, чем вся экономика Японии, и ваш счет за ИИ — это причина
каждый доллар, который вы тратите на ИИ прямо сейчас, проходит через чипы одной компании, на трех облаках, которые перепродают их с наценкой
> стартапы в области ИИ сжигают около 80% собранного капитала только на аренду вычислительных ресурсов
> я видел команды на стадии посева, платящие 700 тысяч долларов в месяц за одного поставщика чипов
> дата-центры работают на 12-18% мощности, в то время как ваш счет растет каждый квартал
вся индустрия просто согласилась встать в одну очередь и передать деньги тому же платному
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
толпа, считающая, что искусственный интеллект переоценен, никогда не пыталась купить h100 в этом квартале
провести неделю, пытаясь купить h100 прямо сейчас, означает: 12-месячная подписка на aws (24/7 использование заблокировано до того, как вы увидите хотя бы один gpu), очередь в gcp без ETA, lambda и coreweave оба распроданы, каждый меньший провайдер дает вам тот же ответ разными словами
строительство гиперскалеров измеряется в годах, нехватка cpu тормозит существующие gpu, а спрос продолжает расти, пока гиперскалеры оформляют разрешения
команды ai на стадии seed тратят 70-80% своего р
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Очевидно, Nvidia тихо посетила корейские компании по оборудованию электросетей, попросив их перепроектировать инфраструктуру дата-центров вокруг архитектуры постоянного тока 800 В.
Это признание того, что централизованная модель ИИ достигла физической стены, каждый новый выпуск чипов теперь требует обновления подстанции где-то в цепочке.
Глобальные дата-центры уже работают с загрузкой от 12 до 18 процентов. Майнинговые фермы криптовалют имеют мощные GPU, которые простаивают после слияния Ethereum. Потребительские игровые системы с 4090 стоят без дела на столах весь день.
Недостаток вычислитель
ETH3,17%
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
многие люди все еще строят архитектуру вокруг вычислительной зависимости, которая уже вышла из употребления
qwen3 32b, например, сейчас работает на распределенных общественных GPU, пайплайн-параллелизм выполняется по узлам, ни один оператор не контролирует, инференс без разрешения через открытый интернет
три слоя, все открыты: открытые веса (Alibaba выпустила их), вычисления без разрешения (общественное оборудование, без хранения), открытая транспортировка (без частных кластеров, без API-ворот разрешений). владение не применяется ни к одному из них
модель мышления, что инференс, совмести
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Google Cloud Next стартует на этой неделе, и каждый бычий участник гиперскейлера собирается радоваться тому же движению, которое исторически убивает маржу, на которую они ставили раньше: Google платил Nvidia наценку за каждый H100. Маржа течет в Санта-Клару.
Сейчас: Google ведет переговоры с Marvell о пользовательском кремнии и новой версии TPU, предназначенной для вывода. Капитальные затраты перемещаются внутрь компании.
Amazon сделала это с Graviton в 2018 году. Microsoft объявила о Maia в 2023. Каждый раз гиперскейлер переставал платить наценку своему поставщику, потому что эта наценка
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
мы все еще спорим о том, сколько дата-центров строить, в то время как запасы уже стоят у каждого на подъездной дорожке
ответ на расширение — планирование кампусов площадью 50 акров с многолетними циклами строительства
триллионы агентов совершают транзакции непрерывно, 24/7, против физических датчиков, машин и друг друга
я думаю о игровом ПК 4090, который простаивает в 2 часа ночи, о закрытом чипе Apple M на столе, о Tesla, припаркованной с четверга, и математика начинает выглядеть иначе
это темные вычисления, неиспользуемый запас, за который пользователь уже заплатил, лежащий на границ
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Оценка Figma снизилась, потому что Anthropic опубликовала лендинг-страницу в Твиттере.
> Что изменилось: название бренда и атмосфера.
> Что не изменилось: базовая модель, ценообразование API, качество вывода или то, как ваша команда дизайнеров действительно работает завтра.
Рынок только что провел весь уикенд в полном паническом состоянии по поводу маркетинга, а не технологий.
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
вот что-то интересное, с чем я столкнулся: 33% запланированных дата-центров в США уже поставляются прямо сейчас.
> остальные 67%: задержаны или полностью отменены
> meta строит 10 газовых электростанций только для питания одного объекта
> Китай удвоил свою вычислительную мощность для ИИ за 2 месяца без использования ни одного американского чипа
> +220% спроса на электроэнергию прогнозируется к 2030 году, при этом очередь разрешений тянется на годы
препятствие — физическое. разрешения, очереди на подключение к электросетям, сроки строительства.
стяжеры, объединяющие распределённые в
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Дарио нуждается в мифосе как в рве
Лаборатории закрывают пробелы в возможностях с помощью большего количества вычислений, улучшенной постобучением и более быстрыми циклами оценки
Открытые модели с весами, такие как llama, qwen и deepseek, действительно поставляются с возможностями, сопоставимыми с закрытыми моделями, через несколько месяцев, как бесплатные загрузки
Для вас это лучшая модель каждый квартал и никаких лабораторий, пытающихся заставить вас выбрать их максимальные планы
Ров — это децентрализованные вычисления, где тысячи GPU работают как один суперкомпьютер по всему Сингапу
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Вы платите OpenAI $20 за острый прогресс, а @Meta только что выпустила 1 модель, которая сделала последние 12 моделей OpenAI похожими на исправления ошибок
OpenAI выпускала обновления ежемесячно, объявляя каждое обновление и публикуя каждое бенчмарк-тестирование
Meta's Muse Spark запустилась и достигла оценок оценки, которых большинство людей не думали, что Meta сможет достичь
Хуже всего при запуске, молчание в течение нескольких месяцев, затем один релиз остановил всех на месте... вы приняли тишину за неудачу, а ежемесячные релизы — за прогресс
Двенадцать журналов изменений Сэма стал
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
самая сильная отдельная лаборатория больше не может одна держать фронтир.
разрыв в стоимости — это рынок, признающий это, и основатели, все еще читающие эталонные модели, читают неправильную страницу.
частная премия Anthropic — это рыночная цена на запас хода.
дельта измеряет, какая лаборатория менее заточена под структуру затрат под ними.
вычислительная инфраструктура — это системный слой: разрыв между тем, что фронтирные лаборатории платят за время H100, и тем, что весь рынок дата-центров держит в простое, — это минимальный уровень, который ни одна лаборатория не может достичь с верт
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Люди всё ещё считают, что программирование — это работа.
Это не так.
Код был просто интерфейсом, который мы использовали для выражения решений. Он был узким местом, а не ценностью.
Искусственный интеллект устраняет это узкое место.
Теперь ограничение смещается:
- Можете ли вы чётко определить проблему?
- Можете ли разбить её на решаемые части?
- Можете ли вы проверить, что результат действительно правильный?
Я заметил, что инженеры, которые испытывают трудности с ИИ, — это те, кто связывал свою личность с скоростью набора или памятью по синтаксису. Это никогда не было дефицитны
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
claude mythos обнаружил тысячи нулевых дней, потому что у него есть то, чего нет у вашей команды безопасности:
отсутствие заинтересованности в правильности кода
он читает целые кодовые базы холодным взглядом. он не понимает политику вашей организации, давление сроков или эго, связанные с реализацией
у модели нет причины пропускать сложные «человеческие» части... поэтому она хуже справляется с briefing'ом CISO, но непревзойденно в том, что действительно находит баги
anthropic заблокировал её, потому что одна модель впервые дала каждой кодовой базе честный аудит
ваша команда реагирования теперь
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Сэм Альтман — последний человек, который должен писать AI regulation, и он это прекрасно понимает.
Сэм призвал к «новому социальному контракту» между компаниями, занимающимися ИИ, и обществом, в то время как его компания выпускает gpt-5.4, o3 и агентов класса operator с темпом, за которым не может уследить ни один законодательный орган на Земле.
aws не может децентрализоваться, не пожертвовав собственными маржинальными доходами, и каждая «саморегулирующаяся рамка» в истории техноиндустрии заканчивалась тем, что одни и те же несколько организаций писали правила, которым они же и соглашались
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
«Бесконечные итерации» предполагают бесконительные вычисления.
Каждый вызов стоит денег, использует инфраструктуру другого человека и сжигает токены, независимо от того, блестящий результат или мусор.
Итерация — это только дешево, если вы уже знаете, что ищете.
> тот, у кого за плечами 10 лет вкуса, запускает 3 итерации и выпускает продукт.
> тот, у кого его нет, делает 300 итераций и всё равно не может понять, какой из них хороший.
и никто ещё не учёл этого:
чем больше AI-выводов, тем больше человеческой проверки нужно, так что 10-кратное количество черновиков — это 10-кратное количество люде
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
назвать отключение openclaw от Anthropic «rug» — это самое честное признание сообщества создателей ИИ о себе за последние месяцы
х harness openclaw позволял опытным пользователям запускать от $1k до $5k в день вычислений по плану за $200 в месяц.
одно продуктовое решение, и все, кто строил свою структуру затрат вокруг этого разрыва, получили новую цену за ночь
продавец контролирует счетчик... Anthropic, OpenAI, кто угодно.
у вас нет места за столом, когда меняется модель ценообразования
вас не «разводит» ваш молоток, вас «разводит» арендодатель
выжившие разработчики уже используют
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Сэм построил OpenAI на ОДНОМ предположении
запуск вашей собственной модели всегда будет слишком дорогим
Llama и Mistral разрушают его тезис и угрожают его бизнес-модели
Сэм это видит, читает те же утечки, что и вы... и всё равно не может перестроить
в тот момент, когда OpenAI откроет веса, они убьют ров, который оправдывает оценку, и каждый сможет запускать выводы локально без вызова API, без подписки, без события выручки для OpenAI
каждый форк и донастройка — это один клиент меньше, который платит маржу Сэма
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
Сэм Альтман поднял $122b , и никто не хочет покупать $600m из этого
$600m в акциях openai, лежащих на вторичном рынке без заявок
> банки отменяют комиссии просто чтобы переместить предложение
> продавцы конкурируют по цене, чтобы выйти
первичные рынки — это контролируемое распределение: венчурные капиталисты участвуют в раундах, когда таблица капиталов выглядит чистой
но вторичные рынки работают на добровольном спросе: никому не обязательно держать и никому не обязательно делать ставки
Anthropic превзошла свою последнюю оценку раунда, в то время как openai не может преодолеть $600m потолок.
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
ваш счет за облачные услуги скоро вырастет, а вы не изменили ни одной строки кода
claude пишет код, открывает приложения, находит баги, исправляет их, выпускает. без участия человека
каждый автономный агент — это постоянная сессия GPU
> человек-разработчик работает 8 часов в день. агенты работают 24
> 10 миллионов разработчиков x 24/7 = 240 миллионов GPU-часов в день, на которые никто не заложил бюджет
сам собирает триллионы для дата-центров, строительство которых занимает 3 года. они будут заполнены еще до завершения строительства
Посмотреть Оригинал
  • Награда
  • комментарий
  • Репост
  • Поделиться
  • Закрепить