Tóm tắt Giám đốc điều hành Apple Tim Cook cảnh báo rằng Mac mini và Mac Studio có thể vẫn trong tình trạng thiếu hàng trong "vài tháng" sau khi nhu cầu dựa trên AI vượt xa dự báo của công ty. OpenClaw—nền tảng tác nhân AI mã nguồn mở hiện được OpenAI hỗ trợ—đã biến kiến trúc bộ nhớ thống nhất của Apple thành d

Decrypt

2026-05-03 13:06:21

Tóm tắt ngắn gọn

Giám đốc điều hành Apple Tim Cook cảnh báo rằng Mac mini và Mac Studio có thể vẫn trong tình trạng thiếu hàng trong “vài tháng” sau khi nhu cầu dựa trên AI vượt xa dự báo của công ty.
OpenClaw—nền tảng tác nhân AI mã nguồn mở hiện được OpenAI hậu thuẫn—đã biến kiến trúc bộ nhớ thống nhất của Apple thành phần cứng mặc định để chạy các mô hình AI lớn tại chỗ.
M4 Ultra của Apple hỗ trợ lên đến 192GB bộ nhớ thống nhất, cho phép các nhà phát triển chạy các mô hình không thể phù hợp trên bất kỳ GPU Nvidia tiêu dùng nào, vốn tối đa 32GB VRAM.

Mac mini của Apple luôn là chiếc máy tính để bàn im lặng, ít được chú ý ở phía sau của Apple Store. Thực tế, rẻ theo tiêu chuẩn của Apple, và phần lớn bị bỏ qua bởi cộng đồng AI. Rồi OpenClaw xuất hiện. Vào thứ Năm, Tim Cook nói với các nhà phân tích rằng Mac mini và Mac Studio đã hết hàng—và có thể sẽ duy trì tình trạng đó trong vài tháng. “Cả hai đều là nền tảng tuyệt vời cho AI và các công cụ tác nhân,” ông nói trong cuộc gọi báo cáo lợi nhuận Quý 2 năm 2026 của Apple, “và sự nhận thức của khách hàng về điều đó đang diễn ra nhanh hơn dự kiến của chúng tôi.” Dịch: Apple đã tính toán sai mức độ mong muốn của các nhà phát triển đối với những chiếc máy này, đặc biệt trong những thời điểm mà sự khan hiếm đang làm rối loạn thị trường.

Doanh thu Mac trong quý đạt 8,4 tỷ USD, tăng 6% so với cùng kỳ năm ngoái. Không phải là một kết quả quá ấn tượng—nhưng hạn chế về nguồn cung, chứ không phải cầu, mới là yếu tố giới hạn. Các cấu hình Mac mini và Mac Studio có RAM cao không chỉ bị trì hoãn; một số đã bị rút khỏi Apple Store hoàn toàn. Mac mini cơ bản giá 599 USD đã hết hàng tại Mỹ, không có dịch vụ giao hàng hoặc nhận tại cửa hàng. Các cấu hình nâng cấp với 64GB RAM đang hiển thị thời gian chờ từ 16 đến 18 tuần. Các mẫu Mac Studio với 512GB bộ nhớ thống nhất đã biến mất hoàn toàn khỏi cửa hàng. Các scalper trên eBay nhanh chóng bắt kịp, niêm yết các mẫu cơ bản gần như gấp đôi giá bán lẻ. Nguyên nhân chính của tất cả những điều này? OpenClaw và sự bùng nổ của AI Tác nhân đòi hỏi nhiều bộ nhớ.

Khung tác nhân AI mã nguồn mở—được xây dựng bởi Peter Steinberger và hiện được OpenAI hậu thuẫn sau một cuộc đấu giá với Meta—đã bùng nổ với hơn 323.000 sao trên GitHub và trở thành cách nhanh nhất để cá nhân và các nhóm nhỏ chạy các tác nhân AI bền vững tại chỗ. Và phần cứng tham khảo không chính thức để chạy nó gần như ngay lập tức trở thành Mac mini.

Tuy nhiên, đó không phải là kết quả của một chiến dịch marketing. Điều mà hầu hết mọi người bỏ qua khi nói về tình trạng thiếu Mac là Apple đã không còn liên quan đến các tác vụ AI nghiêm trọng trong nhiều năm. Trước khi phép màu của các Tác nhân AI trở nên phổ biến, mọi người phàn nàn rằng việc chạy các mô hình LLM, Stable Diffusion hoặc phần mềm AI gia đình khác rất chậm và gần như không thể sử dụng được. Một chiếc Mac M2 có hiệu năng tương đương với một GPU từ năm 2019. Việc Apple từ chối áp dụng CUDA hoặc sử dụng Nvidia, thay vào đó thúc đẩy công nghệ MLX của mình, khiến nó trở nên vô nghĩa đối với AI cũng như đối với game. Nvidia thống trị vì CUDA—khung lập trình GPU độc quyền của họ—là xương sống của việc huấn luyện và suy luận mô hình. Toàn bộ hệ thống AI được xây dựng dựa trên đó. Apple không có gì tương tự. Không ai muốn mua Mac để chạy suy luận tại chỗ. Nhưng CUDA có một bí mật bẩn: giới hạn VRAM. Ngay cả GPU Nvidia tiêu dùng tốt nhất, RTX 5090, cũng chỉ tối đa 32GB VRAM. Đó là giới hạn cứng. Một mô hình lớn hơn 32GB không thể chạy ở tốc độ tối đa trên card đó—nó tràn vào RAM hệ thống chậm hơn, chạy qua bus PCIe, và hiệu năng giảm sút. Để chạy một mô hình 70 tỷ tham số nghiêm túc trên phần cứng Nvidia, bạn cần nhiều GPU, một rack máy chủ, tiêu thụ điện năng lớn, và hàng nghìn đô la. Kiến trúc Bộ nhớ Thống nhất của Apple (UMA) giải quyết vấn đề này theo cách mà CUDA không thể. Trên Apple Silicon, CPU, GPU và Neural Engine đều chia sẻ cùng một vùng RAM vật lý. Không có VRAM riêng biệt. Không có bus PCIe để vượt qua. Một Mac mini với 64GB có thể tải một mô hình 70 tỷ tham số mà một RTX 5090 giá 1.800 USD đơn giản là từ chối chạm tới.

M4 Ultra—chip cung cấp năng lượng cho các cấu hình cao cấp của Mac Studio—hỗ trợ tối đa 192GB bộ nhớ thống nhất. Đủ để chạy các mô hình 100 tỷ tham số tại chỗ trên một máy duy nhất. Không cần máy chủ. Không cần hóa đơn đám mây hàng tháng. OpenClaw đã làm rõ điều này. Bởi vì nó chạy các tác nhân tại chỗ—kết nối với các tệp của bạn, ứng dụng của bạn, tin nhắn của bạn—người dùng cần những chiếc máy có thể xử lý tải suy luận mà không cần thuê dịch vụ tính toán từ đám mây. Một Mac mini với 32GB bộ nhớ thống nhất chạy thoải mái các mô hình 30 tỷ tham số. Một Mac Studio với 128GB xử lý các mô hình mà hầu hết các nhà phát triển không thể chạm tới mà không có một cụm GPU doanh nghiệp cách đây một năm. Một chiếc Mac chậm có khả năng chạy một mô hình AI mạnh mẽ còn tốt hơn nhiều so với một card Nvidia mạnh mẽ nhưng thậm chí không thể tải mô hình đó lên. Kết quả: các nhà phát triển bắt đầu mua Mac mini như cách họ từng mua Raspberry Pi—nhiều chiếc cùng lúc, xem như hạ tầng hơn là máy tính cá nhân. Chuỗi cung ứng của Apple chưa bao giờ được thiết kế cho mô hình đó. Cũng có một cuộc khan hiếm bộ nhớ rộng hơn đang làm trầm trọng thêm vấn đề. IDC dự đoán rằng tổng số máy tính cá nhân toàn cầu sẽ giảm 11,3% vào năm 2026, phần nào do thiếu chip bộ nhớ do nhu cầu của các máy chủ AI thúc đẩy. Apple hiện đang cạnh tranh cùng các nhà cung cấp RAM cho cùng nguồn cung cấp với các nhà hyperscaler xây dựng trung tâm dữ liệu. Cook nói rằng có thể mất “vài tháng” để cân bằng cung cầu cho Mac mini và Mac Studio. Một đợt nâng cấp chip M5 dự kiến sẽ ra mắt vào cuối năm 2026, có thể giảm bớt áp lực—nhưng người mua hiện tại vẫn phải chờ đợi hoặc trả giá cao cho scalper. Mac mini đã tạo ra sự cấp bách lớn hơn trong năm 2026 so với bất kỳ thời điểm nào trong 20 năm lịch sử của nó—và tất cả những gì nó cần là một chút giúp đỡ từ một dự án mã nguồn mở mà Apple hoàn toàn không liên quan để làm điều đó xảy ra.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.