Goldman Sachs: Що означає DeepSeek V4 для китайського штучного інтелекту?

Автор: Бао Йілонг, Wall Street Journal

Голден Сакс вважає, що сутність DeepSeek V4 полягає у підтримці більш складних застосувань штучного інтелекту за нижчою ціною, відкриваючи новий простір для масштабування AI-додатків.

24 квітня команда Голден Сакс Рональда Кеунга опублікувала аналітичний звіт, у якому новий відкритий вихідний код моделі V4 є продовженням орієнтованого на ефективність та відкритого шляху DeepSeek.

На технічному рівні модель V4 за рахунок оновлення архітектури значно знижує витрати на довгий контекстний вікно, а також явно робить ставку на китайські чипи Huawei. На ринковому рівні ця презентація прискорює загострення конкуренції китайських моделей AI, де програмні можливості, рівень виконання завдань та мультимодальність стануть ключовими факторами ціноутворення.

Голден Сакс зберігає рекомендації щодо секторів хмарних обчислень та датасервісних центрів, оскільки постійне покращення ефективності обчислювальних ресурсів сприятиме швидшій інтеграції AI-додатків, а зростання AI-агентів для бізнесу та AI-помічників для споживачів створить двонапрямний драйвер для підвищення цін на хмарні послуги.

Оновлення архітектури V4: менше пам’яті — довший контекст

DeepSeek V4 випущено у двох версіях: Pro та Flash.

Версія Pro — флагманська, з параметрами 1,6 трильйонів (активних параметрів 49 мільярдів); версія Flash — легша, з 284 мільярдами параметрів (активних 13 мільярдів). Обидві моделі підтримують довгий контекст до 1 мільйона слів, що відповідає провідним моделям США (SOTA), але зменшують обсяг пам’яті та кешу KV значно.

За даними звіту Голден Сакс, у сценарії з 1 мільйоном контексту, для обчислення слів-елементів token потрібно лише 27% FLOPs від DeepSeek V3.2, а кеш KV займає лише 10%; модель V4 Flash ще більш агресивна — FLOPs знижено до 10%, кеш KV — до 7%.

Цей приріст ефективності досягається за рахунок трьох ключових архітектурних інновацій:

  • Щодо механізму гібридної уваги, V4 вводить гібридну архітектуру стисненої розрідженої уваги (CSA) та сильно стисненої уваги (HCA). CSA спочатку стискає послідовність кешу KV перед обчисленням розрідженої уваги, тоді як HCA застосовує більш агресивне стиснення, зберігаючи щільну увагу, що разом значно зменшує тимчасову пам’ять для довгих входів.

  • Щодо стабільності тренування, V4 вводить механізм mHC, що підсилює стабільність передачі інформації через багатошарові мережі;

  • Також використовується Muon як основний оптимізатор тренування (частково збережено AdamW), щоб адаптуватися до складнішої архітектури мережі порівняно з V3 і покращити якість зближення під час тренування.

Голден Сакс зазначає, що ці покращення особливо важливі для довготривалих завдань, таких як довготривалі агентські сценарії, що вимагають обробки великого обсягу контексту.

Варто відзначити, що наразі DeepSeek зосереджений на базових текстових моделях, тоді як гіганти інтернету, такі як Alibaba, ByteDance, MiniMax та інші незалежні гравці, більше орієнтовані на мультимодальні або повномодальні підходи, що свідчить про явну диференціацію у шляхах дослідження AGI.

Вітчизняні чипи прискорюють впровадження, Huawei Ascend 950 готує ґрунт для зниження цін

Ще одним важливим сигналом від V4 є те, що DeepSeek чітко визначає масове виробництво супернод Huawei Ascend 950 як частину своєї комерційної стратегії.

DeepSeek прогнозує, що завдяки масовому постачанню супернодів Huawei Ascend 950 у другій половині 2026 року, ціна API для V4 Pro значно знизиться.

Згідно з аналітичним звітом Голден Сакс, ця заява має подвійне значення:

По-перше, конкуренція за ціною DeepSeek посилиться, створюючи умови для ширшого застосування; по-друге, на тлі обмеження постачання чипів, тренд перенесення провідних моделей AI у Китай на вітчизняні обчислювальні ресурси отримує підтвердження від провідних гравців.

З поточними цінами, даними Голден Сакс, ціна V4 Pro на основних API-платформах вже є конкурентоспроможною, і з розширенням внутрішніх обчислювальних ресурсів ця перевага, ймовірно, зросте ще більше до другої половини 2026 року.

Вітчизняна конкуренція моделей AI: диференціація

Відкритий вихідний код V4 швидко викликав нову хвилю активних розробок у китайському сегменті AI.

Згідно з аналізом Голден Сакс, серед недавніх нових моделей — Kimi K2.6, Qwen3.6-Max від Alibaba, Hy3 від Tencent, V2.5 від Xiaomi, а також очікуваний у травні MiniMax M3/Hailuo.

На думку Голден Сакс, ключовими факторами, що визначатимуть цінову політику моделей у майбутньому, стануть:

Успішність у програмуванні/виконанні завдань, де модель GLM від Zhipu займає провідні позиції у рейтингах кодування;** мультимодальні можливості, на які найбільше інвестують ByteDance, Alibaba та MiniMax.**

Звіт зазначає, що у двох груп гравців є явні переваги та недоліки:

Незалежні гравці AI, наприклад MiniMax, мають високу організаційну ефективність і короткий ланцюг прийняття рішень, тому навіть за дуже низьких цін на базові текстові API вони можуть отримувати 40% валового прибутку — за прогнозами Голден Сакс.** Великі інтернет-компанії, такі як ByteDance, Tencent, Alibaba, мають стабільний грошовий потік і краще підходять для інвестицій у інфраструктуру AI та хмарний сектор, з можливістю створення окремих команд для мотивації талантів, наприклад, команда ByteDance має власну систему стимулів.**

Важливо зазначити, що у звіті Голден Сакс цитуються новини про те, що Tencent та Alibaba ведуть переговори щодо інвестицій у DeepSeek на суму понад 20 мільярдів доларів, тоді як ринкова вартість Zhipu та MiniMax становить приблизно 53 і 31 мільярд доларів відповідно, що відображає боротьбу гігантів за домінування у високорівневих AI-можливостях.

Логіка пріоритетних напрямків: хмарні обчислення та дата-центри

Голден Сакс зберігає свою позицію щодо пріоритету сектору хмарних обчислень і дата-центрів у Китаї, аргументуючи це так:

Постійне зростання попиту на AI-Tokenи (слова) сприятиме збільшенню закупівель хмарних послуг;

Зростання корпоративних клієнтів та AI-агентів покращить цінову політику на хмарні сервіси та Tokenи;

Постійна проникність AI-помічників для споживачів створює додатковий попит.

На ринку корпоративних хмарних послуг Alibaba лідирує за обсягом зовнішніх доходів від AI-хмарних сервісів; на споживчому ринку ByteDance наразі має найбільше середньодобове використання Tokenів у чат-ботах, а загальний DAU застосунків AIGC у Китаї залишається високим, з річним зростанням у березні 2026 року на 36%.

Основні цінові цілі, які рекомендує Голден Сакс, — це China Unicom, Century Internet, Alibaba та Kingsoft Cloud, як ключові активи для отримання вигоди від розширення інфраструктури AI у Китаї.

Крім того, другий ешелон — це компанії у сферах електронної комерції та транспорту, третій — це активи, пов’язані з моделями AI, а четвертий — ігровий та розважальний сектори.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити