2026-01-06 15:21:29

Phiên bản kiến trúc chip siêu máy tính AI thế hệ mới chính thức ra mắt, các chỉ số hiệu suất đạt bước đột phá rõ rệt. So với phiên bản trước, chi phí trong giai đoạn suy luận đã giảm xuống một phần mười, đây là một bước ngoặt đối với tính kinh tế của việc triển khai mô hình quy mô lớn. Đồng thời, số lượng GPU cần thiết cho quá trình huấn luyện đã giảm 75%, nghĩa là doanh nghiệp có thể hoàn thành cùng một nhiệm vụ tính toán với ít phần cứng hơn. Hiệu quả năng lượng tăng gấp năm lần, điều này có nghĩa là tiêu thụ năng lượng và áp lực tản nhiệt dưới cùng một công suất tính toán đã giảm đáng kể.

Sáng tạo trong kiến trúc công nghệ cũng rất đáng chú ý — lần đầu tiên trong cấp độ rack đã triển khai khả năng tính toán bảo mật, băng thông kết nối giữa các GPU đạt mức đáng kinh ngạc 260 TB/s, mức độ truyền dữ liệu này đủ để hỗ trợ các kịch bản tính toán song song quy mô siêu lớn. Toàn bộ nền tảng đã được thiết kế lại hoàn toàn, loại bỏ các giải pháp cáp mềm và quạt truyền thống, thay vào đó sử dụng cách tổ chức phần cứng nhỏ gọn và hiệu quả hơn. Động cơ cốt lõi gồm sáu thành phần mô-đun, cung cấp khả năng tùy biến và mở rộng linh hoạt hơn. Việc ra mắt thế hệ sản phẩm này chắc chắn sẽ định hình lại cấu trúc chi phí và cách triển khai thị trường AI tính toán.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

21 thích

Phần thưởng
21
9
Đăng lại
Retweed

Bình luận

0/400

BtcDailyResearcher

· 01-09 14:58

Một phần mười chi phí? Lần này các bạn trong mỏ đào phải hoảng rồi --- 260TB/s băng thông... con số này nghe làm tôi chóng mặt, nhưng cảm giác lại sắp có người phải cắt giảm nhân sự rồi --- Hiệu quả năng lượng tăng gấp năm lần? Đây thật sự là cứu tinh đối với những người tiêu thụ điện, bắt đầu xem xét đổi chip rồi --- Lại một vòng lặp lại một vòng sắp xếp lại, tốc độ này thật sự khiến người ta không theo kịp --- GPU cần giảm 75%... Ồ, cổ phiếu của các nhà sản xuất card đồ họa có phải sẽ giảm không? --- Thiết kế module hóa nghe có vẻ ổn, chỉ sợ lại là chiêu trò marketing, phải xem điểm số thực tế mới tin --- Nếu thứ này thật sự mạnh như quảng cáo, thì cục diện thị trường tính toán AI sẽ thay đổi --- Giảm chi phí xuống còn một phần mười thật sự là phi lý, những chip mua sớm chắc chắn rất khó chịu --- Lần đầu tiên nghe về tính toán bảo mật cấp khung máy, cảm giác lại sắp bị cắt một đợt nữa rồi --- Nhanh chóng đẩy nhanh quá trình lặp lại, cảm giác mỗi ba tháng lại phải cập nhật một lần công nghệ rồi

Xem bản gốcTrả lời0

AirdropHermit

· 01-09 10:02

Trời ơi, chi phí chỉ bằng một phần mười à? Có phải sự thật không, cảm giác lần này sẽ phổ biến thôi Hiệu suất này tăng gấp năm lần đấy, những nhà đầu tư lớn chắc phải điên cuồng mua vào giá rẻ rồi 260TB/s...con số này nghe vô lý quá, thật sự chạy được như vậy không? Chi phí suy luận giảm thẳng xuống một phần mười, những công ty nhỏ cuối cùng cũng có cơ hội rồi GPU giảm 75% mà vẫn cùng sức tính toán, ai mà chịu nổi điều này Cấp độ rack vẫn có thể thực hiện tính toán bảo mật, kiến trúc này tính toán khá周到 nhỉ Không bắt kịp xu hướng lần này cảm giác sẽ lỗ đấy

Xem bản gốcTrả lời0

GateUser-6bc33122

· 01-07 00:38

Một phần mười chi phí? Giờ đây, khởi nghiệp với mô hình lớn thật sự có cơ hội rồi

Xem bản gốcTrả lời0

RektHunter

· 01-06 15:51

Trời ơi, chi phí suy luận giảm xuống còn một phần mười? Giờ các doanh nghiệp nhỏ cũng có thể chơi lớn với mô hình lớn rồi, những độc quyền về sức mạnh tính toán trước đây sắp bị phá vỡ Chỉ số 260TB/s thật là ấn tượng, giao tiếp giữa các GPU mượt quá... nhưng liệu có thực sự ổn định để chạy không Giảm 75% GPU là ý nghĩa gì, số tiền tiết kiệm được từ điện và phần cứng... thôi không nghĩ nữa, lại sắp tăng giá rồi Nếu thứ này thực sự mạnh như vậy, thì cục diện ngành sẽ thay đổi thôi

Xem bản gốcTrả lời0

SandwichTrader

· 01-06 15:50

Một phần mười chi phí? Giờ mô hình lớn thật sự bắt đầu cạnh tranh rồi --- Chỉ số 260TB/s nghe đã đã, nhưng làm mát có thể giải quyết được không --- GPU giảm 75%, điều này có ý nghĩa gì, các doanh nghiệp nhỏ và vừa cuối cùng cũng có thể chơi AI rồi? --- Vừa modular vừa tính toán bảo mật, cảm giác kiến trúc này không đơn giản như vậy đâu --- Hiệu quả năng lượng tăng gấp năm lần? Thì ra trước đó đều là lãng phí điện đúng không haha --- Nói về tái cấu trúc chi phí, chẳng phải để chiếm thị trường sao, đã là cách cũ rồi --- Thật sự là 260TB/s, tốc độ này chạy gì cũng bay đúng không --- Tôi tin chi phí giảm một phần mười, nhưng chi phí phần cứng phía trên có thực sự giảm không --- Bỏ qua giải pháp quạt gió, phương pháp làm mát mới có đáng tin cậy không, đừng lại gặp vấn đề nữa --- Cuối cùng cũng có người chú ý đến chi phí rồi, các phương án trước đó đắt chết rồi

Xem bản gốcTrả lời0

tokenomics_truther

· 01-06 15:44

260 TB/s？Con số này nghe có vẻ phi lý, nhưng nếu thực sự có thể giảm chi phí suy luận xuống một phần mười, thì cơ hội của thợ mỏ đã đến.

Xem bản gốcTrả lời0

MEVictim

· 01-06 15:41

Một phần mười chi phí? Nếu điều đó là thật thì đã sớm xuất hiện rồi, đừng lại là dữ liệu trên giấy tờ nữa

Xem bản gốcTrả lời0

OnchainArchaeologist

· 01-06 15:39

Một phần mười chi phí? Lần này khởi nghiệp với mô hình lớn không còn tốn nhiều tiền nữa, cuối cùng cũng có thể thở phào GPU giảm 75%, điều này có thật không... Chi phí doanh nghiệp giảm thẳng đứng Băng thông 260 TB/s quá khủng khiếp, lần này luồng dữ liệu không còn là điểm nghẽn nữa Hiệu quả năng lượng tăng gấp năm lần, tản nhiệt cuối cùng cũng không cần làm mát quá dữ dội nữa, quá tuyệt vời Thiết kế mô-đun có tính sáng tạo, không gian tùy chỉnh sau này rộng lớn Chi phí suy luận giảm xuống còn một phần mười, lần cập nhật này thực sự thay đổi quy tắc chơi game

Xem bản gốcTrả lời0