DeepSeek V4は今後数週間以内にリリースされる予定で、Huaweiのチップ上で完全に動作する可能性があります

4月4日付の米国テクノロジーメディアThe Informationの最新報道によると、中国のAIスタートアップDeepSeekがまもなく発表する次世代のフラッグシップモデルV4は、華為が自社開発したチップ上で完全に稼働する。これは、中国が半導体の自立化を進める上で重要なマイルストーンだと見られている。
V4は今後数週間以内にリリースされる見通しで、華為のチップ上で完全に稼働する。DeepSeekはそのために、華為およびチップ設計会社の寒武紀と数カ月間連携し、国産チップとの互換性を実現するため、モデルの基盤部分のコードを作り直した。
注目すべき点として、DeepSeekは今回V4の事前テストの権限をNVIDIAに対しては開放せず、国内のチップ企業のみを招いて初期の最適化に参加させた。業界の慣例を破る対応だ。
アリババ、字節跳動、テンセントなど中国のテック大手は、すでに華為の最新型Ascend950PRチップを事前に大量購入しており、総注文量は数十万個に達した。クラウドサービスを通じてV4を展開し、自社のAIアプリに統合する計画だ。需要の急増が同チップの価格を約20%押し上げている。
V4は混合エキスパート構造(MoE)を採用しており、総パラメータ数は約1兆。推論のたびに活性化されるのは約370億パラメータで、低遅延を維持しながら、テキスト、画像、コードの多モーダル入力に対応できる。
昨年、DeepSeekは低コストモデルV3とR1を発表し、世界のテック株が大幅に下落するなどの事態を引き起こした。これにより、市場は「米国のAI企業は数十億ドル規模の資金を投じて計算資源を調達する必要があるのか」と疑問を投げかけた。V4はそのため、国際的な注目を集めている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン