Torygreen

vip
Вік 2.7 Рік
Піковий рівень 0
Контент поки що відсутній
громада, яка вважає, що штучний інтелект вже переобтяжений, ніколи не намагалася купити h100 цього кварталу
протягом тижня, намагаючись купити h100 зараз, означає: 12-місячна зобов’язання в aws (24/7 використання заблоковане до того, як ви побачите навіть один gpu), очікування в списку GCP без ETA, lambda і coreweave обидва розпродані, кожен менший провайдер дає вам ту саму відповідь різними словами
будівництво гіперскалерів вимірюється роками, дефіцит процесорів затримує існуючі gpu, а попит продовжує зростати, поки гіперскалери подають дозволи
команди штучного інтелекту на початковій с
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Очевидно, Nvidia тихо відвідала корейські компанії з обладнання для енергопостачання, просячи їх перепроектувати інфраструктуру дата-центрів навколо архітектури постійного струму 800 В.
Це визнання того, що централізована модель штучного інтелекту досягла фізичної межі, кожне нове покоління чипів тепер вимагає оновлення підстанції десь у ланцюжку.
Глобальні дата-центри вже працюють із завантаженням від 12 до 18 відсотків. Майнинг-ферми криптовалют мають потужні GPU, що залишаються без діла після злиття Ethereum. Споживацькі ігрові системи з 4090 стоять незадіяними на столах цілий день.
Недоста
ETH-0,9%
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Багато людей все ще проектують архітектуру навколо обчислювальної залежності, яка з часом зникла
qwen3 32b, наприклад, зараз працює на розподілених спільних GPU, конвеєрний паралелізм виконується між вузлами, жоден оператор не контролює, без дозволу інференція через відкритий інтернет
три рівні, всі відкриті: відкриті ваги (alibaba їх випустила), обчислення без дозволу (спільне обладнання, без опіки), відкритий транспорт (відсутність приватного кластера, відсутній API-обмежувач). власність не застосовується до жодного з них
модель мислення, що інференція, здатна до фронтиру, вимагає гіперскейл
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Google Cloud Next розпочинається цього тижня, і кожен бик гіперскейлера збирається радісно підтримати саме той крок, який історично знищує маржу, яку вони тримають
раніше: Google платив Nvidia націнку за кожен H100. Маржа йде до Санта-Клари.
зараз: Google веде переговори з Marvell щодо кастомного силікону та нової TPU-версії, спеціальної для інференції. капітальні витрати переміщуються всередину.
Amazon зробила це з Graviton у 2018 році. Microsoft оголосила про Maia у 2023. кожного разу гіперскейлер переставав платити націнку своєму постачальнику, бо ця націнка ставала найбільшим рядком
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Ми все ще сперечаємося про кількість дата-центрів, які потрібно побудувати, тоді як запас уже лежить у кожній проїзній частині
Відповідь на розгортання — планування кампусів площею 50 акрів на багаторічних циклах будівництва
Триліони агентів здійснюють транзакції безперервно, 24/7, проти фізичних датчиків, машин і один одного
Я думаю про ігровий ПК 4090, що стоїть без діла о 2-й ночі, про закритий чіп Apple M на столі, про Tesla, припарковану з четверга, і математика починає виглядати інакше
Це темна обчислювальна потужність, невикористаний запас, за який користувач уже заплатив, що ле
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Оцінка Figma знизилася через те, що Anthropic опублікував сторінку приземлення.
> Що змінилося: назва бренду та атмосфера.
> Що не змінилося: базова модель, ціни API, якість вихідних даних або те, як ваша команда дизайнерів фактично працюватиме завтра.
Ринок весь у вихідні переживав паніку всього тіла через маркетинг, а не технології.
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
ось дещо цікаве, з чим я натрапив: 33% запланованих дата-центрів у США вже зараз працюють.
> інші 67%: затримані або скасовані повністю
> meta будує 10 газових електростанцій лише для живлення одного об'єкта
> Китай подвоїв свою обчислювальну потужність для ШІ за 2 місяці без жодного американського чіпа
> +220% попит на електроенергію прогнозується до 2030 року, з чергою дозволів, що рухаються роками
проблема у фізиці. дозволи, черги підключення до електромереж, строки будівництва.
зшивачі, які агрегують розподілені обчислення на існуючій потужності, зовсім не чекають у цій черзі.
стелажі вже
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Даріо потребує міфос як рову
Лабораторії закривають прогалини у можливостях за допомогою більшої обчислювальної потужності, кращого пост-тренінгу та швидших циклів оцінки
Відкриті моделі з вагами, такі як llama, qwen і deepseek, постачаються з можливостями, що відповідають закритим моделям через кілька місяців, як безкоштовні завантаження
Для вас це краща модель кожного кварталу і жодна лабораторія не намагається змусити вас підлаштовуватися під їхні максимальні плани
Рув — це децентралізовані обчислення, де тисячі GPU працюють як один суперкомп’ютер у Сінгапурі, США, Норвегії тощо
У Даріо зал
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Ви платите OpenAI $20 за швидкий прорив, а @Meta щойно випустила 1 модель, яка зробила останні 12 моделей OpenAI схожими на виправлення багів
OpenAI випускає оновлення щомісяця, оголошуючи кожне оновлення та публікуючи кожен бенчмарк
Meta's Muse Spark запустилася в роботу і досягла оцінок eval, яких більшість людей не думали, що Meta зможе досягти
Гірше того, при запуску, мовчання кілька місяців, а потім один реліз зупинив усіх на місці... ви сприйняли мовчання за провал і щомісячні релізи за прогрес
Дванадцять змінних журналів Сема стали дванадцятьма сносками
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
найсильніша окрема лабораторія вже не може самостійно тримати фронтир.
валовий розрив — це ринок, який це визнає, і засновники, що все ще читають бенчмарки моделей, читають неправильну сторінку.
приватна премія Anthropic за вал — це ціна ринку, яка закладає запас ходу.
дельта вимірює, яка лабораторія менш застрягла у структурі витрат під ними.
інфраструктура обчислень — це шар систем: різниця між тим, що фронтир-лабораторії платять за час H100, і тим, що ринок агрегованих дата-центрів тримає вільним, — це підлога, яку жодна лабораторія не може досягти за допомогою вертикальної інтеграц
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Люди все ще вважають, що програмування — це робота.
Це не так.
Код був лише інтерфейсом, який ми використовували для вираження рішень. Це був вузький місце, а не цінність.
Штучний інтелект усуває це вузьке місце.
Зараз обмеження змінюється:
- Чи можете ви чітко визначити проблему?
- Чи можете розбити її на вирішувані частини?
- Чи можете ви перевірити, чи результат дійсно правильний?
Я помітив, що інженери, які мають труднощі з ШІ, — це ті, хто пов’язував свою ідентичність із швидкістю набору або пам’яттю синтаксису. Це ніколи не було дефіцитним ресурсом.
Визначення проблеми
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Клод Міфос виявив тисячі нульових днів, тому що у нього є одна річ, якої немає у вашій команді безпеки:
відсутність зацікавленості у правильності коду
він читає цілі кодові бази холоднокровно. він не розуміє політику вашої організації, тиск дедлайнів або его, що беруть участь у реалізації
у моделі немає причин пропускати важкі «людські» частини... тому вона гірша у підготовці доповідей для CISO, але неперевершена у тому, що дійсно знаходить помилки
Anthropic заблокувала її, бо одна модель вже зробила перший чесний аудит кожної кодової бази
ваша команда реагування тепер — це застаріле витратне
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Sem Altman — остання людина, якій варто писати регулювання для ШІ, і він це прекрасно знає.
Sem закликав до «нового social contract» між компаніями з ШІ та суспільством, тоді як його компанія випускає gpt-5.4, o3 та operator-class agents у темпі, який жоден законодавчий орган у світі не здатен відстежити.
aws не може децентралізуватися, не пожираючи власні маржі, і кожна «self-regulatory framework» в історії технологій закінчувалася тим самим: кількома сутностями, які писали правила, яких вони ж погоджувалися дотримуватися.
Якщо ви запускаєте свою модель на aws або azure, ви лише на один
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
ідея "безкінечних ітерацій" передбачає безмежні обчислення.
кожен виклик коштує грошей, проходить через інфраструктуру когось іншого і спалює токени, незалежно від того, чи вийшов результат геніальним чи сміттям.
ітерація є дешевою лише тоді, коли ви вже знаєте, що шукаєте.
> хтось із 10 роками досвіду створює 3 ітерації та відправляє.
> хтось без цього робить 300 і все ще не може зрозуміти, який з них хороший.
і ніхто ще не врахував цього у ціні:
чим більше виходів AI, тим більше людської перевірки потрібно, тож 10-кратні чорновики означають 10-кратну кількість людей, що їх перевіряють.
... к
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Називати закриття OpenClaw від Anthropic «киданням килима» — це найчесніше, що спільнота розробників штучного інтелекту сказала про себе за останні місяці.
Рамка OpenClaw дозволяла досвідченим користувачам запускати обчислення на суму від $1k до $5k на день за планом в $200 на місяць.
Одне продуктові рішення, і всі, хто будував свою структуру витрат навколо цієї різниці, отримали нову ціну за ніч.
Постачальник контролює лічильник... Anthropic, OpenAI, хто завгодно.
Ви не маєте голосу, коли змінюється модель ціноутворення.
Вас не «кидає» ваш молоток, вас «кидає» орендодавець.
Ті, хт
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
сам побудував openai на ОДНІЙ припущенні
запуск власної моделі завжди був би надто дорогим
llama і mistral руйнують його тезу і загрожують його бізнес-моделі
сам це бачить, читає ті самі витоки, що й ти... і все ще не може перебудувати
коли openai відкриє ваги, вони знищать захист, що виправдовує оцінку, і будь-хто зможе запускати інференс локально без API-запитів, без підписки, без події доходу для openai
кожен форк і доопрацювання — це один менший клієнт, що платить маржу саму
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Сем Альтман підняв $122b , і ніхто не хоче купувати $600m з цього
$600m у акціях OpenAI, що сидять на вторинному ринку без пропозицій
> банки скасовують комісії просто щоб перемістити пропозицію
> продавці конкурують за ціною, щоб вийти
Первинні ринки — це контрольоване розподілення: венчурні інвестори залучаються до раундів, коли капітальна таблиця виглядає чистою
Але вторинні ринки працюють на добровільному попиті: нікому не потрібно тримати і нікому не потрібно робити пропозицію
Anthropic перевищила свою останню оцінку раунду, тоді як OpenAI не може подолати $600m обмеження..
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
ваш рахунок за хмарні послуги скоро зросте, і ви не змінили жодного рядка коду
claude пише код, відкриває додатки, знаходить баги, виправляє їх, доставляє. без людського втручання
кожен автономний агент — це постійна сесія GPU
> людські розробники працюють 8 годин на день. агенти працюють 24
> 10М розробників x 24/7 = 240М GPU-годин на день, на які ніхто не заклав бюджет
сам збирає трильйони для дата-центрів, які будують 3 роки. вони будуть заповнені ще до завершення будівництва
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Інвестиція Саму $1T IPO — найсильніший аргумент на користь децентралізованих обчислень, але він ще цього не усвідомлює
Волл-стріт оцінює інтелектуальні активи так само, як нафтові родовища. величезні постійні витрати, довгострокова оренда кожного API-запиту
ця модель працює лише тоді, коли контроль залишається централізованим щодо обчислень, вагових коефіцієнтів моделі, доступу та цін
але інтелект починає вести себе як комунальна послуга, а історично комунальні послуги не залишаються закритими:
> попит на обчислення зростає швидше за пропозицію
> бездіяльні GPU, що залишаються невикористаними
Переглянути оригінал
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
  • Закріпити