国産の光DeepSeek-V4がついにオープンソース化され、100万字超の長大なコンテキストを直接処理!


DeepSeek-V4は全く新しいアテンションメカニズムを導入し、トークン次元で圧縮を行い、DSA疎なアテンション(DeepSeek Sparse Attention)と組み合わせて、非常に長いコンテキストを処理する際の計算能力とメモリ消費を削減。
テストデータによると、Agentic Coding(エージェント化コーディング)評価において、V4-Proのパフォーマンスは業界で一般的に使用されているSonnet 4.5を上回り、Opus 4.6の非思考モードのレベルに近づいている。
さまざまな市場ニーズに対応して、DeepSeekは二重戦略を採用:Proバージョンは高難度の推論と世界知識を主に扱い、パラメータ数が少ないFlashバージョンは超低コストのAPI呼び出しを提供。
原文表示
post-image
post-image
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン