2026开年,DeepSeek的mHC架构又上了新台阶。



说起来,HC在宽度方向上一直存在扩展瓶颈——稳定性差、可扩展性受限。mHC就是来破这个局的。它不仅保持了transformer纵向堆叠的传统打法,关键是在横向打开了并行信息流的大门,让多流并行成为可能。

这意味着什么?模型既能竖着堆,也能横着铺。扩展维度从一维变成了二维。继续scaling,天花板又被推高了一截。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 转发
  • 分享
评论
0/400
Liquidation Oraclevip
· 01-01 19:07
哇 mHC 这套东西真的让人眼前一亮,二维扩展这思路确实野
回复0
Hash_Banditvip
· 01-01 18:54
说实话,2D缩放的想法听起来挺熟悉的……我们是不是在早期的ASIC集群中也试过类似的东西?水平吞吐量最终总会遇到热墙。猜猜这次DeepSeek是否真的找到了并行化的最佳点,还是又陷入了一如既往的炒作循环。
查看原文回复0
空投猎手王vip
· 01-01 18:37
哥们儿,这mHC要真能横着铺纵着堆,那就是二维薅羊毛的节奏啊,扩展性打开了得省多少gas费 DeepSeek这步棋下得可以,不过咱得看后续落地咋样,吹得再响也得等真实互动数据说话 之前那些架构优化最后还不是沦为空气币,这回不会又是一出戏吧
回复0
大空投不是梦vip
· 01-01 18:36
二维scaling啊,这下子真的不一样了,横纵都能拉,感觉天花板没完没了
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)