2026 mở đầu năm, kiến trúc mHC của DeepSeek lại đạt một bước tiến mới.
Nói về HC, nó luôn gặp phải giới hạn mở rộng theo chiều rộng — độ ổn định kém, khả năng mở rộng bị hạn chế. mHC chính là để phá vỡ giới hạn đó. Nó không chỉ giữ nguyên cách xếp chồng transformer theo chiều dọc truyền thống, mà còn mở ra cánh cửa cho luồng thông tin song song theo chiều ngang, làm cho đa luồng song song trở nên khả thi.
Điều này có ý nghĩa gì? Mô hình vừa có thể xếp chồng theo chiều dọc, vừa có thể trải theo chiều ngang. Độ mở rộng từ một chiều trở thành hai chiều. Tiếp tục mở rộng quy mô, giới hạn tối đa lại được nâng cao thêm một tầm.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
7 thích
Phần thưởng
7
5
Đăng lại
Retweed
Bình luận
0/400
CountdownToBroke
· 53phút trước
Lại một lần nữa họ lại ca ngợi kiến trúc, thực sự có thể phá vỡ thế cục hay chỉ là một vòng cắt lưỡi cày nữa
Xem bản gốcTrả lời0
LiquidationOracle
· 01-01 19:07
Wow mHC, bộ này thật sự làm người ta phải ngạc nhiên, ý tưởng mở rộng hai chiều này thực sự rất đột phá
Xem bản gốcTrả lời0
Hash_Bandit
· 01-01 18:54
NGL, thứ chia tỷ lệ 2D nghe có vẻ quen thuộc... Về cơ bản, chúng ta không thử điều này trở lại với phân cụm ASIC ban đầu sao? Thông lượng ngang cuối cùng luôn chạm vào các bức tường nhiệt. Đoán chúng ta sẽ xem liệu DeepSeek có thực sự phá vỡ điểm ngọt ngào song song lần này hay đó chỉ là chu kỳ cường điệu thông thường quay trở lại.
Xem bản gốcTrả lời0
AirdropHunterKing
· 01-01 18:37
Anh bạn, nếu mHC thực sự có thể mở rộng theo chiều ngang và xếp theo chiều dọc, thì đó chính là nhịp điệu khai thác hai chiều, khả năng mở rộng sẽ tiết kiệm được bao nhiêu phí gas
Bước đi của DeepSeek này được đấy, nhưng chúng ta phải xem cách thực thi sau này ra sao, dù có nói to đến đâu cũng phải chờ dữ liệu tương tác thực tế để nói chuyện
Những tối ưu hóa kiến trúc trước đó cuối cùng cũng chỉ là tiền ảo, lần này liệu có lại là một vở kịch nữa không
Xem bản gốcTrả lời0
AirdropDreamer
· 01-01 18:36
Hai chiều scaling rồi, lần này thật sự khác biệt, cả chiều ngang và chiều dọc đều có thể kéo, cảm giác giới hạn không ngừng mở rộng
2026 mở đầu năm, kiến trúc mHC của DeepSeek lại đạt một bước tiến mới.
Nói về HC, nó luôn gặp phải giới hạn mở rộng theo chiều rộng — độ ổn định kém, khả năng mở rộng bị hạn chế. mHC chính là để phá vỡ giới hạn đó. Nó không chỉ giữ nguyên cách xếp chồng transformer theo chiều dọc truyền thống, mà còn mở ra cánh cửa cho luồng thông tin song song theo chiều ngang, làm cho đa luồng song song trở nên khả thi.
Điều này có ý nghĩa gì? Mô hình vừa có thể xếp chồng theo chiều dọc, vừa có thể trải theo chiều ngang. Độ mở rộng từ một chiều trở thành hai chiều. Tiếp tục mở rộng quy mô, giới hạn tối đa lại được nâng cao thêm một tầm.