Tín dụng hình ảnh: Được tạo bởi các công cụ Unbounded AI
Giám đốc điều hành Nvidia Huang Renxun đang cố gắng tạo cho ngành công nghiệp ấn tượng rằng AI ngang bằng với Nvidia.
Ngày nay, với sự bùng nổ của các mô hình ngôn ngữ lớn AI, chip GPU của Nvidia dành cho trí tuệ nhân tạo gần như là lựa chọn duy nhất để hoàn thành khóa đào tạo AI đòi hỏi sức mạnh tính toán cực cao.
Sự mất cân bằng cung cầu nghiêm trọng này đã khiến GPU của Nvidia trở nên khó tìm, thậm chí CEO OpenAI Sam Altman cũng phàn nàn rằng tình trạng thiếu chip đã ảnh hưởng đến sự phát triển của ChatGPT.
Huang Renxun hẳn rất vui khi nghe điều này. Vào năm 2023, do nhu cầu về AI, giá trị thị trường của Nvidia sẽ vượt quá một nghìn tỷ đô la Mỹ.
Tuy nhiên, một số người đang cố gắng phá vỡ thế "cô độc tìm cầu bại" của Nvidia trong lĩnh vực trí tuệ nhân tạo.
Vào thứ Tư, AMD (Advanced Semiconductor) đã chính thức phát hành chip hàng đầu hàng năm Instinct MI300 tại hội nghị ra mắt sản phẩm "trung tâm dữ liệu và trí tuệ nhân tạo" đầu tiên của mình, một siêu chip có thể so sánh dòng Grace Hopper của Nvidia.
Instinct MI300 có hai phiên bản: MI300X chỉ có GPU, được thiết kế đặc biệt để đào tạo mô hình AI và đóng gói 153 tỷ bóng bán dẫn; MI300A là APU tích hợp nhiều CPU, GPU và bộ nhớ băng thông cao (AMD đề xuất trong khái niệm sản phẩm năm 2011), được đóng gói với 146 tỷ bóng bán dẫn.
Việc phát hành Instinct MI300 có nghĩa là Nvidia không còn là lựa chọn duy nhất cho các công ty AI về sức mạnh tính toán. AMD thực sự đã thu hút được một số kỳ lân ngôi sao AI, chẳng hạn như Hugging Face, AMD sẽ tối ưu hóa mô hình cho CPU, GPU và phần cứng AI khác của mình.
Instinct MI300 mang tham vọng của AMD trong lĩnh vực trí tuệ nhân tạo. Giám đốc điều hành AMD Lisa Su gần đây cho biết: "Nếu bạn nhìn vào 5 năm nữa, bạn sẽ thấy trí tuệ nhân tạo trong mọi sản phẩm của AMD và nó sẽ trở thành động lực tăng trưởng lớn nhất".
AMD là đối thủ cũ của Nvidia, cuộc cạnh tranh giữa hai bên trên thị trường GPU đã kéo dài 17 năm và phần lớn thời gian kết thúc với phần thắng thuộc về Nvidia.
Và lần này, liệu AMD, vốn đã một thời khẳng định mình trên thị trường CPU, có thể sao chép kinh nghiệm thành công của mình sang thị trường GPU?
1.AMD muốn giành vương miện AI của Nvidia
AMD là hãng bán dẫn lâu đời nổi tiếng trên thế giới, được thành lập từ năm 1969. Theo dữ liệu xếp hạng các công ty bán dẫn toàn cầu do Gartner công bố năm nay, AMD đứng thứ bảy.
CPU là nơi sinh của AMD. Vào năm 1981, AMD đã nhận được sự cho phép của bộ xử lý dòng Intel X86 và trở thành công ty thứ hai trong ngành trong một cú trượt ngã trong thời kỳ tiền thưởng của kỷ nguyên PC, và công ty thứ hai trong ngành này đã làm điều đó trong nhiều thập kỷ.
Ngoài CPU, AMD đã từng bước thiết lập một cách bố trí chip hoàn chỉnh là "CPU + GPU + DPU + FPGA" thông qua việc mua bán và sáp nhập liên tục.
Một số vụ sáp nhập và mua lại quan trọng hơn bao gồm:
Tháng 7/2006, AMD chi 5,4 tỷ USD mua lại ATI, hãng đứng thứ 2 ngành GPU lúc bấy giờ, chính thức phát động cuộc cạnh tranh GPU với Nvidia;
Vào tháng 2 năm 2022, AMD đã chi 49,8 tỷ đô la Mỹ để hoàn tất việc mua lại nhà sản xuất FPGA Xilinx nhằm củng cố vị trí của họ trong mảng kinh doanh trung tâm dữ liệu;
Vào tháng 4 năm 2022, AMD đã công bố việc mua lại nhà sản xuất chip DPU Pensando với giá 1,9 tỷ đô la Mỹ để tiếp tục mở rộng hoạt động kinh doanh trung tâm dữ liệu của mình.
Cấu trúc kinh doanh của AMD được chia thành bốn lĩnh vực chính: trung tâm dữ liệu, máy khách, trò chơi và kinh doanh nhúng.
Trung tâm dữ liệu bao gồm tất cả doanh thu liên quan đến máy chủ của AMD; doanh thu từ khách hàng chủ yếu liên quan đến máy tính để bàn và máy tính cá nhân, từng là một trong những mảng kinh doanh cốt lõi của AMD, nhưng hiện tại tỷ trọng doanh thu không cao; mảng kinh doanh trò chơi chủ yếu liên quan đến sản phẩm GPU dòng, Sony, Microsoft là một khách hàng lớn ổn định, hoạt động kinh doanh nhúng chủ yếu đến từ hoạt động kinh doanh ban đầu của Xilinx.
Khi trí tuệ nhân tạo trở thành xu hướng, trung tâm dữ liệu trở thành mảng kinh doanh được các ông lớn điện toán đám mây coi trọng và đầu tư mạnh tay, đồng thời cũng là chiến trường của Nvidia, Intel và AMD.
Tại cuộc họp báo cáo tài chính Q1 năm 2023 trước đó, AMD đã nhấn mạnh rằng AI hiện là trọng tâm chiến lược đầu tiên của công ty và AMD cam kết xây dựng một ma trận sản phẩm AI đa dạng hơn.
Hôm qua, hội nghị ra mắt sản phẩm của AMD lần đầu tiên được tổ chức với chủ đề “trí tuệ nhân tạo và trung tâm dữ liệu”. Su Zifeng nhấn mạnh tại cuộc họp báo rằng được thúc đẩy bởi các mô hình ngôn ngữ quy mô lớn, cơ hội thị trường cho trí tuệ nhân tạo đang gia tăng và tiềm năng thị trường có thể tăng từ 30 tỷ USD hiện tại lên khoảng 150 tỷ USD vào năm 2027.
AMD không muốn bỏ lỡ bữa tiệc AI này, nhưng Nvidia là một ngọn núi cần phải vượt qua.
Trong báo cáo tài chính quý gần nhất, doanh thu kinh doanh trung tâm dữ liệu của AMD là 1,295 tỷ USD, so với 1,293 tỷ USD của quý trước, về cơ bản không tăng trưởng. Ngược lại, doanh thu kinh doanh trung tâm dữ liệu của Nvidia trong quý đầu năm nay đạt mức cao kỷ lục, tăng 14% so với cùng kỳ năm ngoái lên 4,28 tỷ USD, gấp hơn 3 lần so với AMD.
Theo quỹ phòng hộ định lượng Khaveen Investments, thị phần GPU trung tâm dữ liệu của Nvidia sẽ lên tới 88% vào năm 2022, AMD và Intel sẽ chia phần còn lại.
Mặc dù AMD là một người chơi lâu đời trên thị trường GPU, nhưng các dòng sản phẩm GPU trước đây của họ chủ yếu được sử dụng trong lĩnh vực xử lý hình ảnh và lý luận AI, trong khi đào tạo AI, đòi hỏi nhiều tính toán song song hơn, đã tham gia thị trường muộn hơn.
Việc phát hành Instinct MI300 đồng nghĩa với việc AMD đang muốn thay đổi sự thống trị của Nvidia trên thị trường đào tạo AI.
2. Tham gia chương trình đào tạo AI
Instinct MI300 là "APU" hiệu năng cao đầu tiên dành cho trung tâm dữ liệu - một khái niệm do AMD tiên phong.
Vào năm 2011 (năm thứ năm sau khi AMD mua lại ATI), AMD đã so sánh não trái và não phải của con người với CPU và GPU trong ý tưởng sản phẩm của mình và dựa trên điều này, họ đã đề xuất chiến lược sản phẩm không đồng nhất "CPU + GPU" và đặt tên là APU .
Tương tự như bộ não con người, AMD tin rằng não trái giống CPU hơn, chịu trách nhiệm xử lý thông tin logic, chẳng hạn như các hoạt động nối tiếp, số và số học, tư duy phân tích, hiểu, phân loại, sắp xếp, v.v., trong khi não phải giống GPU hơn, chịu trách nhiệm tính toán song song, nhiều Phương thức, tư duy sáng tạo và trí tưởng tượng, v.v.
Hình ảnh từ Huatai Research
Tuy nhiên, năm 2011, AMD đang ở đáy của "thập kỷ mất mát", dù là ở dòng CPU hay dòng GPU, hãng đều không sản xuất đủ những sản phẩm xuất sắc, việc phát triển APU cũng không khả quan.
Khi thời điểm đến tháng 3 năm 2020, AMD đã phát hành phiên bản vi kiến trúc CDNA mới, được thiết kế đặc biệt cho điện toán hiệu năng cao và điện toán AI trong trung tâm dữ liệu. Trước đó, GPU của AMD đã sử dụng cùng một kiến trúc để giải quyết nhu cầu của các tình huống chơi game và điện toán cùng một lúc, điều này không có lợi cho việc tối ưu hóa các tình huống khác nhau.
Các sản phẩm thuộc dòng Instinct được thiết kế cho điện toán hiệu năng cao HPC và điện toán AI. MI300 mới được phát hành hoàn toàn theo đuổi Grace Hopper của Nvidia về thông số kỹ thuật và hiệu suất.
Instinct MI300 áp dụng quy trình 5nm của TSMC và có hai phiên bản khác nhau: MI300X chỉ có GPU, được thiết kế để đào tạo mô hình AI và gói 153 tỷ bóng bán dẫn; MI300A là sự kết hợp của nhiều CPU, GPU và bộ nhớ băng thông cao APU gói 146 tỷ bóng bán dẫn .
AMD tuyên bố rằng Instinct MI300 có hiệu suất AI cao hơn 8 lần so với MI250 thế hệ trước, có thể giảm thời gian đào tạo của các mô hình AI rất lớn như ChatGPT và DALL-E từ hàng tháng xuống hàng tuần, tiết kiệm hàng triệu đô la tiền điện.
AMD đã trình diễn mẫu Falcon của MI300x chạy 40 tỷ thông số tại buổi họp báo, cho phép hãng viết một bài thơ về San Francisco. “Các mô hình ngày càng ngốn nhiều dung lượng hơn và bạn thực sự cần nhiều GPU để chạy các mô hình ngôn ngữ lớn mới nhất,” Su nói, đồng thời lưu ý rằng với nhiều bộ nhớ hơn trên chip AMD, các nhà phát triển sẽ không cần nhiều GPU.
AMD vẫn chưa công bố giá của MI300, nhưng ban quản lý đã tuyên bố trong cuộc gọi hội nghị thu nhập quý 2 năm tài chính 2020 rằng các sản phẩm trung tâm dữ liệu sẽ tiếp tục phong cách định giá hiệu quả về chi phí trước đây, tập trung vào việc mở cửa thị trường trước.
AMD hy vọng MI300 sẽ được ra mắt vào cuối năm nay và sẽ được cài đặt trong siêu máy tính exascale EI Capitan của Phòng thí nghiệm quốc gia Lawrence Livermore và các mô hình AI máy khách đám mây quy mô lớn khác.
Nhà phân tích Joseph Moore của Morgan Stanley đưa ra hướng dẫn lạc quan, nói rằng AMD đã nhận được "đơn đặt hàng ổn định" từ khách hàng và doanh thu liên quan đến AI của công ty vào năm 2024 dự kiến sẽ đạt 400 triệu USD và thậm chí có thể đạt 1,2 tỷ USD-mức kỳ vọng này gấp 12 lần nhiều như trước đây.
Tuy nhiên, mặc dù AMD gần như là công ty duy nhất có khả năng thách thức Nvidia, nhưng đó hẳn là một quá trình rất khó khăn.
3. Con hào của Nvidia
Sau khi sản phẩm của AMD ra mắt, thị trường vốn phản ứng rất tầm thường, giá cổ phiếu của AMD giảm hơn 3%, ngược lại, giá cổ phiếu của Nvidia tăng 3,9% và giá trị thị trường của nó lại vượt quá 1 nghìn tỷ đô la Mỹ.
Trong mắt các nhà đầu tư, con chip hàng năm MI300 của AMD dường như vẫn khó lay chuyển được nền tảng của Nvidia.
Ví dụ, AMD đã không tiết lộ tại hội nghị những khách hàng lớn nào đã nhận được hỗ trợ cho chip hàng năm của mình. Kevin Krewell, nhà phân tích chính tại TIRIAS Research, cho biết: "Tôi nghĩ rằng không có (khách hàng lớn) nào cho biết họ sẽ sử dụng MI300X hoặc MI300A, điều này có thể khiến Phố Wall thất vọng. Họ hy vọng rằng AMD sẽ thông báo rằng họ đã thực hiện một số Thiết kế- đã thay thế Nvidia một cách khôn ngoan."
Các khách hàng được tiết lộ hiện tại chỉ là Hugging Face kỳ lân quy mô lớn mã nguồn mở và Phòng thí nghiệm quốc gia Lawrence Livermore đã tiết lộ trước đó. Nhưng cả hai không có cùng mức độ lớn như những gã khổng lồ đám mây có nhu cầu lớn hơn đối với chip trung tâm dữ liệu.
Xét về hiệu suất của bản thân con chip, mặc dù MI300 vượt qua Nvidia ở một số thông số, chẳng hạn như số lượng bóng bán dẫn cao hơn 54 tỷ của A100, Nvidia có thể sớm bù đắp bằng các lần lặp lại sản phẩm.
Trên thực tế, Nvidia đã làm điều này rồi. Vào ngày 29 tháng 5, hai tuần trước hội nghị AMD, Nvidia đã chính thức ra mắt siêu chip GH200 Grace Hopper mới tại hội nghị trước triển lãm COMPUTEX 2023, với 200 tỷ bóng bán dẫn, cao hơn cả MI300.
Quan trọng hơn, Nvidia cũng thông báo rằng Google, Microsoft và Meta sẽ là những khách hàng lớn đầu tiên áp dụng siêu chip này.
**Ngoài bản thân sản phẩm xuất sắc, con hào bất khả xâm phạm khác của Nvidia là hệ sinh thái CUDA. **
NVIDIA đã phát hành hệ sinh thái CUDA vào năm 2007. Bằng cách sử dụng CUDA, các nhà phát triển có thể sử dụng GPU của Nvidia để xử lý điện toán nói chung, không chỉ xử lý đồ họa.
CUDA cung cấp một giao diện lập trình trực quan cho phép các nhà phát triển viết mã song song bằng C, C++, Python và các ngôn ngữ khác.
Bậc thầy AI Wu Enda từng nhận xét về điều này: "Trước khi CUDA xuất hiện, có thể không quá 100 người trên thế giới có thể sử dụng lập trình GPU. Sau khi có CUDA, việc sử dụng GPU đã trở thành một điều rất dễ dàng."
AMD đã ra mắt ROCm vào năm 2016 với mục tiêu thiết lập một hệ sinh thái có thể thay thế CUDA. Vào năm 2023, số lượng nhà phát triển CUDA sẽ đạt 4 triệu, bao gồm cả các khách hàng doanh nghiệp lớn như Adobe. Càng nhiều người dùng, độ bám dính càng tốt.. ROCm, vốn bắt đầu muộn, sẽ mất thời gian để xây dựng một hệ sinh thái dành cho nhà phát triển.
Nhà phân tích Anshel Sag của Moor Insights & Strategy cho biết: “Mặc dù AMD có khả năng cạnh tranh về hiệu suất phần cứng, nhưng mọi người vẫn không tin rằng các giải pháp phần mềm của AMD có thể cạnh tranh với Nvidia”.
Đây là một con hào độc đáo thuộc về Nvidia. Rất khó để AMD có thể bứt phá.
4. Thành công của AMD, có thể khó lặp lại
Đối với AMD, có lẽ điều ít sợ hãi nhất là đối mặt với thử thách.
Từ 2006 đến 2016 là "thập kỷ mất mát" của AMD. Trong giai đoạn này, hai đối thủ cạnh tranh lớn nhất của AMD, Intel và Nvidia, đang trải qua quá trình lặp lại sản phẩm theo Định luật Moore.
Intel thực hiện "chiến lược con lắc Tick-Tock" và thực hiện cập nhật lặp đi lặp lại sản phẩm lớn hai năm một lần (quy trình một năm, thiết kế kiến trúc vi mô một năm); Tăng gấp đôi hiệu suất trong 6 tháng - dưới sự hướng dẫn của công ty, sản phẩm sẽ được nâng cấp sáu tháng một lần.
AMD đã không theo kịp nhịp cập nhật sản phẩm của hai công ty hàng đầu trong ngành và sự phát triển của công ty đang trên bờ vực sụp đổ cho đến khi Su Zifeng đảm nhận vị trí CEO thứ năm của AMD vào năm 2014.
AMD mà Su Lifeng vừa tiếp quản là một mớ hỗn độn, thị trường máy tính xách tay của nó bị Intel chiếm lĩnh, thị trường điện thoại thông minh mới nổi bị chia cho Nvidia, Qualcomm và Samsung, thị phần máy chủ đã giảm từ 1/4 so với ban đầu xuống chỉ còn 2%. AMD đã phải sa thải khoảng một phần tư nhân viên của mình và giá cổ phiếu của nó dao động quanh mức 2 đô la, và các nhà phân tích cho rằng nó "không thể đầu tư được".
Vào thời điểm đó, CEO Ke Zaiqi của Intel đã nhận xét về AMD: "Công ty này sẽ không bao giờ quay trở lại nữa, vì vậy đừng bận tâm tập trung vào đối thủ cạnh tranh mới Qualcomm".
Nhưng câu chuyện sau đó thì ai cũng biết. Dưới sự lãnh đạo của Su Zifeng, AMD đã có một cuộc lội ngược dòng ngoạn mục trên thị trường CPU, không chỉ ăn mòn dần thị phần của Intel mà giá cổ phiếu của hãng này còn vượt qua cả Intel trong lịch sử vào tháng 2 năm 2022.
Sở dĩ AMD bứt phá được trên thị trường CPU là họ đã nắm bắt được những sai lầm chiến lược của đối thủ Intel.
Trong liên kết sản xuất chip, AMD và Intel đã chọn những con đường khác nhau. AMD đã thoái vốn mảng sản xuất chip vào năm 2009, thành lập liên doanh với xưởng đúc độc lập Gexin và chỉ tập trung vào thiết kế chip (Fabless), điều này cho phép AMD chọn xưởng đúc bên thứ ba độc lập (Foundry). Intel đã tích hợp thiết kế chip và sản xuất chip (IDM) kể từ khi thành lập.
Trong những ngày đầu phát triển của ngành công nghiệp bán dẫn, một IDM tích hợp theo chiều dọc cao như Intel là mô hình chủ đạo hơn. Người đồng sáng lập AMD, Jerry Sanders, cũng đã nói một câu nói nổi tiếng: “Real men has fas.” Nhưng trớ trêu thay, AMD lại có cơ hội hoàn thành cuộc phản công chính xác vì sau đó đã thoái vốn.
Sau năm 2014, quy trình sản xuất chip của Intel gặp khó khăn về kỹ thuật và năng suất của chip 10nm (tương đương với 7nm của TSMC) không tốt, dẫn đến việc sản xuất hàng loạt 10nm dự kiến ban đầu vào nửa cuối năm 2016 bị trì hoãn nhiều lần, và cuối cùng là phát hành vào nửa cuối năm 2019. Chiến lược Tick-Tock mà Intel đã kiên trì trước đây cũng đã bị loại bỏ vì lý do công nghệ xử lý.
Người sáng lập Intel Gordon Moore đã đề xuất Định luật Moore, nhưng Intel hiện đang phải chịu “lời nguyền của Định luật Moore”. Điều này cho phép AMD nắm bắt cơ hội để vượt lên.
Năm 2018, AMD lần đầu tiên hợp tác với GlobalFoundries để ra mắt kiến trúc Zen+ với quy trình 12nm, lần đầu tiên vượt qua Intel với quy trình 14nm. Thì đến năm 2019, AMD hợp tác với TSMC ra mắt kiến trúc Zen 2 tiến trình 7nm (tương đương 10nm của Intel), dẫn đầu Intel. Kể từ đó, Intel luôn tụt hậu so với AMD về quy trình sản xuất và đến tận bây giờ vẫn chưa cải thiện được.
Hôm nay, một kịch bản tương tự “con thứ thách sếp” dường như lại được tái hiện, nhưng chiến trường đã được đổi từ CPU sang GPU. Mặc dù AMD vẫn là AMD do "Su Ma" lãnh đạo, nhưng Nvidia do Huang Renxun lãnh đạo đã phổ biến hơn Intel hồi đó.
Tại Thung lũng Silicon, Huang Renxun được biết đến là một người năng nổ, thích mặc áo khoác da màu đen và luôn sẵn sàng chống trả, khi giá cổ phiếu tăng lên 100 USD, anh ta còn xăm logo Nvidia lên cánh tay.
Năm 2016, Huang Renxun không coi trọng AMD mà trực tiếp nhận xét rằng có khoảng cách "9 và 0" giữa Nvidia và AMD. Vào đầu năm 2019, AMD đã vội vã tung ra card đồ họa 7nm trước Nvidia, Huang Renxun bề ngoài dường như không quan tâm đến điều đó và nói thẳng rằng “card đồ họa này rất bình thường”.
Hôm nay, AMD một lần nữa thách thức Nvidia bằng những sản phẩm tốt hơn. Một bên là AMD tự mãn, một bên là Nvidia đang tìm cách đánh bại Dugu, một cuộc chiến GPU về trí tuệ nhân tạo mới bắt đầu.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
AMD tung ra thách thức chip AI, nhưng Nvidia vẫn đơn độc
Tác giả: Triệu Kiến
Nguồn: Gia Tử Quảng Nam
Giám đốc điều hành Nvidia Huang Renxun đang cố gắng tạo cho ngành công nghiệp ấn tượng rằng AI ngang bằng với Nvidia.
Ngày nay, với sự bùng nổ của các mô hình ngôn ngữ lớn AI, chip GPU của Nvidia dành cho trí tuệ nhân tạo gần như là lựa chọn duy nhất để hoàn thành khóa đào tạo AI đòi hỏi sức mạnh tính toán cực cao.
Sự mất cân bằng cung cầu nghiêm trọng này đã khiến GPU của Nvidia trở nên khó tìm, thậm chí CEO OpenAI Sam Altman cũng phàn nàn rằng tình trạng thiếu chip đã ảnh hưởng đến sự phát triển của ChatGPT.
Huang Renxun hẳn rất vui khi nghe điều này. Vào năm 2023, do nhu cầu về AI, giá trị thị trường của Nvidia sẽ vượt quá một nghìn tỷ đô la Mỹ.
Tuy nhiên, một số người đang cố gắng phá vỡ thế "cô độc tìm cầu bại" của Nvidia trong lĩnh vực trí tuệ nhân tạo.
Vào thứ Tư, AMD (Advanced Semiconductor) đã chính thức phát hành chip hàng đầu hàng năm Instinct MI300 tại hội nghị ra mắt sản phẩm "trung tâm dữ liệu và trí tuệ nhân tạo" đầu tiên của mình, một siêu chip có thể so sánh dòng Grace Hopper của Nvidia.
Instinct MI300 có hai phiên bản: MI300X chỉ có GPU, được thiết kế đặc biệt để đào tạo mô hình AI và đóng gói 153 tỷ bóng bán dẫn; MI300A là APU tích hợp nhiều CPU, GPU và bộ nhớ băng thông cao (AMD đề xuất trong khái niệm sản phẩm năm 2011), được đóng gói với 146 tỷ bóng bán dẫn.
Việc phát hành Instinct MI300 có nghĩa là Nvidia không còn là lựa chọn duy nhất cho các công ty AI về sức mạnh tính toán. AMD thực sự đã thu hút được một số kỳ lân ngôi sao AI, chẳng hạn như Hugging Face, AMD sẽ tối ưu hóa mô hình cho CPU, GPU và phần cứng AI khác của mình.
Instinct MI300 mang tham vọng của AMD trong lĩnh vực trí tuệ nhân tạo. Giám đốc điều hành AMD Lisa Su gần đây cho biết: "Nếu bạn nhìn vào 5 năm nữa, bạn sẽ thấy trí tuệ nhân tạo trong mọi sản phẩm của AMD và nó sẽ trở thành động lực tăng trưởng lớn nhất".
AMD là đối thủ cũ của Nvidia, cuộc cạnh tranh giữa hai bên trên thị trường GPU đã kéo dài 17 năm và phần lớn thời gian kết thúc với phần thắng thuộc về Nvidia.
Và lần này, liệu AMD, vốn đã một thời khẳng định mình trên thị trường CPU, có thể sao chép kinh nghiệm thành công của mình sang thị trường GPU?
1.AMD muốn giành vương miện AI của Nvidia
AMD là hãng bán dẫn lâu đời nổi tiếng trên thế giới, được thành lập từ năm 1969. Theo dữ liệu xếp hạng các công ty bán dẫn toàn cầu do Gartner công bố năm nay, AMD đứng thứ bảy.
CPU là nơi sinh của AMD. Vào năm 1981, AMD đã nhận được sự cho phép của bộ xử lý dòng Intel X86 và trở thành công ty thứ hai trong ngành trong một cú trượt ngã trong thời kỳ tiền thưởng của kỷ nguyên PC, và công ty thứ hai trong ngành này đã làm điều đó trong nhiều thập kỷ.
Ngoài CPU, AMD đã từng bước thiết lập một cách bố trí chip hoàn chỉnh là "CPU + GPU + DPU + FPGA" thông qua việc mua bán và sáp nhập liên tục.
Một số vụ sáp nhập và mua lại quan trọng hơn bao gồm:
Cấu trúc kinh doanh của AMD được chia thành bốn lĩnh vực chính: trung tâm dữ liệu, máy khách, trò chơi và kinh doanh nhúng.
Trung tâm dữ liệu bao gồm tất cả doanh thu liên quan đến máy chủ của AMD; doanh thu từ khách hàng chủ yếu liên quan đến máy tính để bàn và máy tính cá nhân, từng là một trong những mảng kinh doanh cốt lõi của AMD, nhưng hiện tại tỷ trọng doanh thu không cao; mảng kinh doanh trò chơi chủ yếu liên quan đến sản phẩm GPU dòng, Sony, Microsoft là một khách hàng lớn ổn định, hoạt động kinh doanh nhúng chủ yếu đến từ hoạt động kinh doanh ban đầu của Xilinx.
Tại cuộc họp báo cáo tài chính Q1 năm 2023 trước đó, AMD đã nhấn mạnh rằng AI hiện là trọng tâm chiến lược đầu tiên của công ty và AMD cam kết xây dựng một ma trận sản phẩm AI đa dạng hơn.
Hôm qua, hội nghị ra mắt sản phẩm của AMD lần đầu tiên được tổ chức với chủ đề “trí tuệ nhân tạo và trung tâm dữ liệu”. Su Zifeng nhấn mạnh tại cuộc họp báo rằng được thúc đẩy bởi các mô hình ngôn ngữ quy mô lớn, cơ hội thị trường cho trí tuệ nhân tạo đang gia tăng và tiềm năng thị trường có thể tăng từ 30 tỷ USD hiện tại lên khoảng 150 tỷ USD vào năm 2027.
AMD không muốn bỏ lỡ bữa tiệc AI này, nhưng Nvidia là một ngọn núi cần phải vượt qua.
Trong báo cáo tài chính quý gần nhất, doanh thu kinh doanh trung tâm dữ liệu của AMD là 1,295 tỷ USD, so với 1,293 tỷ USD của quý trước, về cơ bản không tăng trưởng. Ngược lại, doanh thu kinh doanh trung tâm dữ liệu của Nvidia trong quý đầu năm nay đạt mức cao kỷ lục, tăng 14% so với cùng kỳ năm ngoái lên 4,28 tỷ USD, gấp hơn 3 lần so với AMD.
Theo quỹ phòng hộ định lượng Khaveen Investments, thị phần GPU trung tâm dữ liệu của Nvidia sẽ lên tới 88% vào năm 2022, AMD và Intel sẽ chia phần còn lại.
Mặc dù AMD là một người chơi lâu đời trên thị trường GPU, nhưng các dòng sản phẩm GPU trước đây của họ chủ yếu được sử dụng trong lĩnh vực xử lý hình ảnh và lý luận AI, trong khi đào tạo AI, đòi hỏi nhiều tính toán song song hơn, đã tham gia thị trường muộn hơn.
Việc phát hành Instinct MI300 đồng nghĩa với việc AMD đang muốn thay đổi sự thống trị của Nvidia trên thị trường đào tạo AI.
2. Tham gia chương trình đào tạo AI
Instinct MI300 là "APU" hiệu năng cao đầu tiên dành cho trung tâm dữ liệu - một khái niệm do AMD tiên phong.
Vào năm 2011 (năm thứ năm sau khi AMD mua lại ATI), AMD đã so sánh não trái và não phải của con người với CPU và GPU trong ý tưởng sản phẩm của mình và dựa trên điều này, họ đã đề xuất chiến lược sản phẩm không đồng nhất "CPU + GPU" và đặt tên là APU .
Tương tự như bộ não con người, AMD tin rằng não trái giống CPU hơn, chịu trách nhiệm xử lý thông tin logic, chẳng hạn như các hoạt động nối tiếp, số và số học, tư duy phân tích, hiểu, phân loại, sắp xếp, v.v., trong khi não phải giống GPU hơn, chịu trách nhiệm tính toán song song, nhiều Phương thức, tư duy sáng tạo và trí tưởng tượng, v.v.
Tuy nhiên, năm 2011, AMD đang ở đáy của "thập kỷ mất mát", dù là ở dòng CPU hay dòng GPU, hãng đều không sản xuất đủ những sản phẩm xuất sắc, việc phát triển APU cũng không khả quan.
Khi thời điểm đến tháng 3 năm 2020, AMD đã phát hành phiên bản vi kiến trúc CDNA mới, được thiết kế đặc biệt cho điện toán hiệu năng cao và điện toán AI trong trung tâm dữ liệu. Trước đó, GPU của AMD đã sử dụng cùng một kiến trúc để giải quyết nhu cầu của các tình huống chơi game và điện toán cùng một lúc, điều này không có lợi cho việc tối ưu hóa các tình huống khác nhau.
Các sản phẩm thuộc dòng Instinct được thiết kế cho điện toán hiệu năng cao HPC và điện toán AI. MI300 mới được phát hành hoàn toàn theo đuổi Grace Hopper của Nvidia về thông số kỹ thuật và hiệu suất.
Instinct MI300 áp dụng quy trình 5nm của TSMC và có hai phiên bản khác nhau: MI300X chỉ có GPU, được thiết kế để đào tạo mô hình AI và gói 153 tỷ bóng bán dẫn; MI300A là sự kết hợp của nhiều CPU, GPU và bộ nhớ băng thông cao APU gói 146 tỷ bóng bán dẫn .
AMD tuyên bố rằng Instinct MI300 có hiệu suất AI cao hơn 8 lần so với MI250 thế hệ trước, có thể giảm thời gian đào tạo của các mô hình AI rất lớn như ChatGPT và DALL-E từ hàng tháng xuống hàng tuần, tiết kiệm hàng triệu đô la tiền điện.
AMD đã trình diễn mẫu Falcon của MI300x chạy 40 tỷ thông số tại buổi họp báo, cho phép hãng viết một bài thơ về San Francisco. “Các mô hình ngày càng ngốn nhiều dung lượng hơn và bạn thực sự cần nhiều GPU để chạy các mô hình ngôn ngữ lớn mới nhất,” Su nói, đồng thời lưu ý rằng với nhiều bộ nhớ hơn trên chip AMD, các nhà phát triển sẽ không cần nhiều GPU.
AMD vẫn chưa công bố giá của MI300, nhưng ban quản lý đã tuyên bố trong cuộc gọi hội nghị thu nhập quý 2 năm tài chính 2020 rằng các sản phẩm trung tâm dữ liệu sẽ tiếp tục phong cách định giá hiệu quả về chi phí trước đây, tập trung vào việc mở cửa thị trường trước.
AMD hy vọng MI300 sẽ được ra mắt vào cuối năm nay và sẽ được cài đặt trong siêu máy tính exascale EI Capitan của Phòng thí nghiệm quốc gia Lawrence Livermore và các mô hình AI máy khách đám mây quy mô lớn khác.
Nhà phân tích Joseph Moore của Morgan Stanley đưa ra hướng dẫn lạc quan, nói rằng AMD đã nhận được "đơn đặt hàng ổn định" từ khách hàng và doanh thu liên quan đến AI của công ty vào năm 2024 dự kiến sẽ đạt 400 triệu USD và thậm chí có thể đạt 1,2 tỷ USD-mức kỳ vọng này gấp 12 lần nhiều như trước đây.
Tuy nhiên, mặc dù AMD gần như là công ty duy nhất có khả năng thách thức Nvidia, nhưng đó hẳn là một quá trình rất khó khăn.
3. Con hào của Nvidia
Sau khi sản phẩm của AMD ra mắt, thị trường vốn phản ứng rất tầm thường, giá cổ phiếu của AMD giảm hơn 3%, ngược lại, giá cổ phiếu của Nvidia tăng 3,9% và giá trị thị trường của nó lại vượt quá 1 nghìn tỷ đô la Mỹ.
Trong mắt các nhà đầu tư, con chip hàng năm MI300 của AMD dường như vẫn khó lay chuyển được nền tảng của Nvidia.
Ví dụ, AMD đã không tiết lộ tại hội nghị những khách hàng lớn nào đã nhận được hỗ trợ cho chip hàng năm của mình. Kevin Krewell, nhà phân tích chính tại TIRIAS Research, cho biết: "Tôi nghĩ rằng không có (khách hàng lớn) nào cho biết họ sẽ sử dụng MI300X hoặc MI300A, điều này có thể khiến Phố Wall thất vọng. Họ hy vọng rằng AMD sẽ thông báo rằng họ đã thực hiện một số Thiết kế- đã thay thế Nvidia một cách khôn ngoan."
Các khách hàng được tiết lộ hiện tại chỉ là Hugging Face kỳ lân quy mô lớn mã nguồn mở và Phòng thí nghiệm quốc gia Lawrence Livermore đã tiết lộ trước đó. Nhưng cả hai không có cùng mức độ lớn như những gã khổng lồ đám mây có nhu cầu lớn hơn đối với chip trung tâm dữ liệu.
Trên thực tế, Nvidia đã làm điều này rồi. Vào ngày 29 tháng 5, hai tuần trước hội nghị AMD, Nvidia đã chính thức ra mắt siêu chip GH200 Grace Hopper mới tại hội nghị trước triển lãm COMPUTEX 2023, với 200 tỷ bóng bán dẫn, cao hơn cả MI300.
Quan trọng hơn, Nvidia cũng thông báo rằng Google, Microsoft và Meta sẽ là những khách hàng lớn đầu tiên áp dụng siêu chip này.
**Ngoài bản thân sản phẩm xuất sắc, con hào bất khả xâm phạm khác của Nvidia là hệ sinh thái CUDA. **
NVIDIA đã phát hành hệ sinh thái CUDA vào năm 2007. Bằng cách sử dụng CUDA, các nhà phát triển có thể sử dụng GPU của Nvidia để xử lý điện toán nói chung, không chỉ xử lý đồ họa.
CUDA cung cấp một giao diện lập trình trực quan cho phép các nhà phát triển viết mã song song bằng C, C++, Python và các ngôn ngữ khác.
Bậc thầy AI Wu Enda từng nhận xét về điều này: "Trước khi CUDA xuất hiện, có thể không quá 100 người trên thế giới có thể sử dụng lập trình GPU. Sau khi có CUDA, việc sử dụng GPU đã trở thành một điều rất dễ dàng."
AMD đã ra mắt ROCm vào năm 2016 với mục tiêu thiết lập một hệ sinh thái có thể thay thế CUDA. Vào năm 2023, số lượng nhà phát triển CUDA sẽ đạt 4 triệu, bao gồm cả các khách hàng doanh nghiệp lớn như Adobe. Càng nhiều người dùng, độ bám dính càng tốt.. ROCm, vốn bắt đầu muộn, sẽ mất thời gian để xây dựng một hệ sinh thái dành cho nhà phát triển.
Nhà phân tích Anshel Sag của Moor Insights & Strategy cho biết: “Mặc dù AMD có khả năng cạnh tranh về hiệu suất phần cứng, nhưng mọi người vẫn không tin rằng các giải pháp phần mềm của AMD có thể cạnh tranh với Nvidia”.
Đây là một con hào độc đáo thuộc về Nvidia. Rất khó để AMD có thể bứt phá.
4. Thành công của AMD, có thể khó lặp lại
Đối với AMD, có lẽ điều ít sợ hãi nhất là đối mặt với thử thách.
Từ 2006 đến 2016 là "thập kỷ mất mát" của AMD. Trong giai đoạn này, hai đối thủ cạnh tranh lớn nhất của AMD, Intel và Nvidia, đang trải qua quá trình lặp lại sản phẩm theo Định luật Moore.
Intel thực hiện "chiến lược con lắc Tick-Tock" và thực hiện cập nhật lặp đi lặp lại sản phẩm lớn hai năm một lần (quy trình một năm, thiết kế kiến trúc vi mô một năm); Tăng gấp đôi hiệu suất trong 6 tháng - dưới sự hướng dẫn của công ty, sản phẩm sẽ được nâng cấp sáu tháng một lần.
AMD đã không theo kịp nhịp cập nhật sản phẩm của hai công ty hàng đầu trong ngành và sự phát triển của công ty đang trên bờ vực sụp đổ cho đến khi Su Zifeng đảm nhận vị trí CEO thứ năm của AMD vào năm 2014.
AMD mà Su Lifeng vừa tiếp quản là một mớ hỗn độn, thị trường máy tính xách tay của nó bị Intel chiếm lĩnh, thị trường điện thoại thông minh mới nổi bị chia cho Nvidia, Qualcomm và Samsung, thị phần máy chủ đã giảm từ 1/4 so với ban đầu xuống chỉ còn 2%. AMD đã phải sa thải khoảng một phần tư nhân viên của mình và giá cổ phiếu của nó dao động quanh mức 2 đô la, và các nhà phân tích cho rằng nó "không thể đầu tư được".
Vào thời điểm đó, CEO Ke Zaiqi của Intel đã nhận xét về AMD: "Công ty này sẽ không bao giờ quay trở lại nữa, vì vậy đừng bận tâm tập trung vào đối thủ cạnh tranh mới Qualcomm".
Nhưng câu chuyện sau đó thì ai cũng biết. Dưới sự lãnh đạo của Su Zifeng, AMD đã có một cuộc lội ngược dòng ngoạn mục trên thị trường CPU, không chỉ ăn mòn dần thị phần của Intel mà giá cổ phiếu của hãng này còn vượt qua cả Intel trong lịch sử vào tháng 2 năm 2022.
Sở dĩ AMD bứt phá được trên thị trường CPU là họ đã nắm bắt được những sai lầm chiến lược của đối thủ Intel.
Trong liên kết sản xuất chip, AMD và Intel đã chọn những con đường khác nhau. AMD đã thoái vốn mảng sản xuất chip vào năm 2009, thành lập liên doanh với xưởng đúc độc lập Gexin và chỉ tập trung vào thiết kế chip (Fabless), điều này cho phép AMD chọn xưởng đúc bên thứ ba độc lập (Foundry). Intel đã tích hợp thiết kế chip và sản xuất chip (IDM) kể từ khi thành lập.
Trong những ngày đầu phát triển của ngành công nghiệp bán dẫn, một IDM tích hợp theo chiều dọc cao như Intel là mô hình chủ đạo hơn. Người đồng sáng lập AMD, Jerry Sanders, cũng đã nói một câu nói nổi tiếng: “Real men has fas.” Nhưng trớ trêu thay, AMD lại có cơ hội hoàn thành cuộc phản công chính xác vì sau đó đã thoái vốn.
Sau năm 2014, quy trình sản xuất chip của Intel gặp khó khăn về kỹ thuật và năng suất của chip 10nm (tương đương với 7nm của TSMC) không tốt, dẫn đến việc sản xuất hàng loạt 10nm dự kiến ban đầu vào nửa cuối năm 2016 bị trì hoãn nhiều lần, và cuối cùng là phát hành vào nửa cuối năm 2019. Chiến lược Tick-Tock mà Intel đã kiên trì trước đây cũng đã bị loại bỏ vì lý do công nghệ xử lý.
Người sáng lập Intel Gordon Moore đã đề xuất Định luật Moore, nhưng Intel hiện đang phải chịu “lời nguyền của Định luật Moore”. Điều này cho phép AMD nắm bắt cơ hội để vượt lên.
Năm 2018, AMD lần đầu tiên hợp tác với GlobalFoundries để ra mắt kiến trúc Zen+ với quy trình 12nm, lần đầu tiên vượt qua Intel với quy trình 14nm. Thì đến năm 2019, AMD hợp tác với TSMC ra mắt kiến trúc Zen 2 tiến trình 7nm (tương đương 10nm của Intel), dẫn đầu Intel. Kể từ đó, Intel luôn tụt hậu so với AMD về quy trình sản xuất và đến tận bây giờ vẫn chưa cải thiện được.
Hôm nay, một kịch bản tương tự “con thứ thách sếp” dường như lại được tái hiện, nhưng chiến trường đã được đổi từ CPU sang GPU. Mặc dù AMD vẫn là AMD do "Su Ma" lãnh đạo, nhưng Nvidia do Huang Renxun lãnh đạo đã phổ biến hơn Intel hồi đó.
Tại Thung lũng Silicon, Huang Renxun được biết đến là một người năng nổ, thích mặc áo khoác da màu đen và luôn sẵn sàng chống trả, khi giá cổ phiếu tăng lên 100 USD, anh ta còn xăm logo Nvidia lên cánh tay.
Hôm nay, AMD một lần nữa thách thức Nvidia bằng những sản phẩm tốt hơn. Một bên là AMD tự mãn, một bên là Nvidia đang tìm cách đánh bại Dugu, một cuộc chiến GPU về trí tuệ nhân tạo mới bắt đầu.