国产之光DeepSeek-V4刚刚开源,直接砸出100万字超长上下文!


DeepSeek-V4引入了全新的注意力机制并在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),降低了处理极长上下文时的算力和显存消耗。
测试数据显示,在Agentic Coding(代理化编程)评测中,V4-Pro的表现已优于业内常用的Sonnet 4.5,并接近Opus 4.6非思考模式的水平。
针对不同市场需求,DeepSeek实行了双线策略:Pro版本主攻高难度推理和世界知识,而参数量更小的Flash版本则负责提供极低成本的API调用。
post-image
post-image
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить