Delapan tahun yang lalu, Zhongxing mengalami henti jantung.
Pada 16 April 2018, sebuah perintah dari Biro Keamanan dan Industri Departemen Perdagangan AS membuat Zhongxing Communications, perusahaan perangkat komunikasi terbesar keempat di dunia dengan 80.000 karyawan dan pendapatan tahunan lebih dari seribu miliar, berhenti beroperasi dalam semalam. Isi perintahnya sangat sederhana: selama tujuh tahun ke depan, melarang perusahaan AS menjual suku cadang, barang, perangkat lunak, dan teknologi apa pun kepada Zhongxing.
Tanpa chip Qualcomm, stasiun basis berhenti produksi. Tanpa lisensi Android dari Google, ponsel tidak memiliki sistem yang bisa digunakan. Tiga puluh tiga hari kemudian, Zhongxing mengeluarkan pengumuman bahwa kegiatan utama perusahaan sudah tidak dapat dilanjutkan.
Namun, Zhongxing akhirnya bertahan, tetapi dengan harga 1,4 miliar dolar AS.
Denda sebesar 1 miliar dolar AS dibayar sekaligus; jaminan sebesar 400 juta dolar disetorkan ke rekening escrow bank AS. Selain itu, seluruh manajemen diganti, dan tim pengawas kepatuhan dari pihak AS didatangkan untuk mengawasi. Sepanjang tahun 2018, Zhongxing mengalami kerugian bersih sebesar 7 miliar yuan RMB, dan pendapatannya anjlok 21,4% dibanding tahun sebelumnya.
Ketua Dewan Direksi Zhongxing saat itu, Yin Yimin, menulis dalam surat internal: “Kita berada dalam industri yang kompleks dan sangat bergantung pada rantai pasokan global.” Kalimat ini, saat itu, terdengar sebagai refleksi sekaligus keputusasaan.
Delapan tahun kemudian, pada 26 Februari 2026, unicorn AI China DeepSeek mengumumkan bahwa model multimodal besar V4 yang akan dirilis akan secara prioritas bekerja sama secara mendalam dengan produsen chip domestik, dan untuk pertama kalinya merealisasikan seluruh proses dari pra-pelatihan hingga fine-tuning tanpa bergantung pada Nvidia.
Dengan kata lain: kita tidak lagi bergantung pada Nvidia.
Begitu berita ini keluar, reaksi pasar pertama adalah keraguan. Nvidia menguasai lebih dari 90% pangsa pasar chip pelatihan AI global. Mengabaikan Nvidia, secara bisnis, apakah masuk akal?
Namun, di balik pilihan DeepSeek, tersembunyi sebuah masalah yang lebih besar daripada logika bisnis: sejauh mana AI China benar-benar membutuhkan kemandirian kekuatan komputasi?
Apa yang sebenarnya terhambat?
Banyak orang mengira, larangan chip menghambat hardware. Tapi yang benar-benar membuat perusahaan AI China merasa tercekik adalah sesuatu yang disebut CUDA.
CUDA, singkatan dari Compute Unified Device Architecture, adalah platform komputasi paralel dan model pemrograman yang diperkenalkan Nvidia pada tahun 2006. Ia memungkinkan pengembang langsung memanfaatkan kekuatan GPU Nvidia untuk mempercepat berbagai tugas komputasi kompleks.
Sebelum era AI tiba, ini hanyalah alat untuk kalangan geek tertentu. Tapi saat gelombang pembelajaran mendalam melanda, CUDA menjadi fondasi seluruh industri AI.
Pelatihan model besar AI secara esensial adalah operasi matriks dalam jumlah besar. Dan inilah yang paling dikuasai GPU.
Dengan strategi yang sudah direncanakan lebih dari satu dekade sebelumnya, Nvidia menggunakan CUDA untuk membangun rangkaian lengkap alat dari perangkat keras dasar hingga aplikasi tingkat atas bagi pengembang AI di seluruh dunia. Saat ini, semua kerangka kerja AI utama di dunia, dari TensorFlow milik Google hingga PyTorch milik Meta, sangat terkait erat dengan CUDA.
Seorang mahasiswa doktoral di bidang AI, sejak hari pertama masuk, belajar, memprogram, dan melakukan eksperimen dalam lingkungan CUDA. Setiap baris kode yang dia tulis, memperkuat benteng Nvidia.
Hingga tahun 2025, ekosistem CUDA telah memiliki lebih dari 4,5 juta pengembang, mencakup lebih dari 3.000 aplikasi yang dipercepat GPU, dan lebih dari 40.000 perusahaan di seluruh dunia menggunakan CUDA. Angka ini berarti lebih dari 90% pengembang AI di dunia terikat dalam ekosistem Nvidia.
Kehebatan CUDA terletak pada sifatnya yang seperti roda berputar. Semakin banyak pengembang yang menggunakannya, semakin banyak alat, pustaka, dan kode yang dihasilkan, sehingga ekosistem menjadi semakin makmur; ekosistem yang makmur akan menarik lebih banyak pengembang lagi. Begitu roda ini mulai berputar, hampir tidak mungkin dihentikan.
Hasilnya, Nvidia menjual alat paling mahal kepada Anda, sekaligus menetapkan satu-satunya posisi untuk menambang. Ingin beralih ke alat lain? Silakan. Tapi, Anda harus menulis ulang semua pengalaman, alat, dan kode yang dikumpulkan selama puluhan tahun oleh ratusan ribu otak cerdas di seluruh dunia dalam posisi tersebut.
Siapa yang harus membayar biaya ini?
Jadi, ketika pada 7 Oktober 2022, BIS memberlakukan pembatasan pertama yang membatasi ekspor A100 dan H100 Nvidia ke China, perusahaan AI China pertama kali merasakan kekakuan seperti yang dialami Zhongxing. Nvidia kemudian meluncurkan versi khusus untuk China, A800 dan H800, yang mengurangi bandwidth antar chip, dan secara paksa mempertahankan pasokan.
Namun, hanya setahun kemudian, pada 17 Oktober 2023, pembatasan kedua kembali diperketat, A800 dan H800 juga dilarang, dan 13 perusahaan China dimasukkan ke dalam daftar entitas. Nvidia harus meluncurkan versi H20 yang lebih dipotong lagi. Hingga Desember 2024, pembatasan terakhir selama masa pemerintahan Biden diberlakukan, bahkan ekspor H20 pun dibatasi secara ketat.
Tiga gelombang pembatasan, semakin ketat.
Tapi, kali ini, arah ceritanya berbeda sama sekali dari Zhongxing.
Perlawanan Asimetris
Di bawah larangan, semua orang mengira bahwa mimpi model besar AI China akan berakhir di situ.
Tapi mereka salah. Menghadapi blokade, perusahaan China tidak memilih untuk langsung melawan secara frontal, melainkan memulai sebuah perlawanan. Tempat pertama yang mereka serang bukan chip, melainkan algoritma.
Antara akhir 2024 dan 2025, perusahaan AI China secara kolektif beralih ke satu arah teknologi: model ahli campuran.
Secara sederhana, ini adalah membagi satu model besar menjadi banyak model kecil yang disebut ahli, yang hanya diaktifkan saat diperlukan, bukan mengaktifkan seluruh model sekaligus.
DeepSeek V3 adalah contoh utama dari pendekatan ini. Memiliki 671 miliar parameter, tetapi saat melakukan inferensi, hanya mengaktifkan 37 miliar, yaitu sekitar 5,5% dari total. Dari segi biaya pelatihan, menggunakan 2.048 GPU Nvidia H800, selama 58 hari, dengan total biaya sekitar 5,576 juta dolar AS. Sebagai perbandingan, perkiraan biaya pelatihan GPT-4 sekitar 78 juta dolar AS. Perbedaan skala yang besar.
Optimisasi algoritma secara ekstrem ini langsung tercermin pada harga. Harga API DeepSeek, untuk input satu juta token, hanya 0,028 hingga 0,28 dolar AS, dan outputnya sekitar 0,42 dolar. Sebaliknya, biaya input GPT-4 sekitar 5 dolar, dan outputnya 15 dolar. Claude Opus bahkan lebih mahal, dengan biaya input 15 dolar dan output 75 dolar. Jika dihitung, DeepSeek 25 hingga 75 kali lebih murah dari Claude.
Perbedaan harga ini mendapatkan respons besar di pasar pengembang global. Pada Februari 2026, dalam tiga minggu, volume panggilan per minggu untuk model AI di platform penggabungan API terbesar dunia, OpenRouter, di China melonjak 127%, melampaui Amerika Serikat untuk pertama kalinya. Setahun sebelumnya, pangsa pasar model China di OpenRouter kurang dari 2%. Setelah satu tahun, meningkat 421%, mendekati 60%.
Di balik data ini, tersembunyi sebuah perubahan struktural yang mudah diabaikan. Mulai paruh kedua 2025, skenario utama aplikasi AI beralih dari sekadar chat ke Agent. Dalam skenario Agent, konsumsi token untuk satu tugas 10 hingga 100 kali lipat lebih besar daripada chat sederhana. Ketika konsumsi token meningkat secara eksponensial, harga menjadi faktor penentu utama. Model China yang menawarkan nilai terbaik, tepat berada di momen ini.
Tapi masalahnya, penurunan biaya inferensi tidak menyelesaikan masalah utama pelatihan. Jika sebuah model besar tidak dapat terus dilatih dan diperbarui dengan data terbaru, kemampuannya akan cepat menurun. Dan pelatihan tetap menjadi lubang hitam kekuatan komputasi yang tak terelakkan.
Lalu, dari mana asal “alat” pelatihan itu?
Transformasi Cadangan
Di kota kecil Xinghua, Jiangsu, terkenal dengan baja tahan karat dan makanan sehat, sebelumnya tidak ada kaitannya dengan AI. Tapi pada 2025, sebuah jalur produksi server kekuatan komputasi domestik sepanjang 148 meter dibangun dan mulai beroperasi di sana, dari penandatanganan kontrak hingga produksi hanya membutuhkan 180 hari.
Inti dari jalur produksi ini adalah dua chip domestik sepenuhnya: prosesor Longxin 3C6000 dan kartu akselerator Tai Chu Yuan Qi T100 AI. Longxin 3C6000 dikembangkan sepenuhnya dari arsitektur instruksi hingga mikroarsitektur secara mandiri. Tai Chu Yuan Qi berasal dari pusat superkomputasi Wuxi dan tim Tsinghua University, menggunakan arsitektur heterogen multi-core.
Saat jalur produksi ini beroperasi penuh, satu server dapat diproduksi setiap 5 menit. Total investasi jalur ini adalah 1,1 miliar yuan, dengan kapasitas tahunan sekitar 100.000 unit.
Yang lebih penting, cluster ribuan chip domestik ini sudah mulai menangani pelatihan model besar yang sesungguhnya.
Pada Januari 2026, Zhiyuan AI bekerja sama dengan Huawei merilis GLM-Image, model generasi terbaru untuk gambar yang sepenuhnya dilatih menggunakan chip domestik, dan merupakan model SOTA yang sepenuhnya bergantung pada chip domestik dari awal hingga akhir. Pada Februari, model “Xingchen” milik China Telecom, yang bernilai ratusan miliar yuan, menyelesaikan pelatihan lengkap di pool kekuatan komputasi domestik di Lingang, Shanghai.
Contoh-contoh ini membuktikan satu hal: chip domestik, sudah mampu digunakan tidak hanya untuk inferensi, tetapi juga untuk pelatihan. Ini adalah perubahan kualitas. Inferensi hanya membutuhkan menjalankan model yang sudah dilatih, sehingga persyaratan chip relatif lebih rendah; sedangkan pelatihan membutuhkan penanganan data dalam jumlah besar, perhitungan gradien yang kompleks, dan pembaruan parameter, yang menuntut kekuatan komputasi chip, bandwidth koneksi, dan ekosistem perangkat lunak yang jauh lebih tinggi.
Kekuatan utama yang menangani tugas ini adalah chip seri Ascend dari Huawei. Hingga akhir 2025, jumlah pengembang ekosistem Ascend telah melampaui 4 juta, lebih dari 3.000 mitra, dan 43 model besar industri telah selesai pra-pelatihan di atas Ascend, serta lebih dari 200 model sumber terbuka telah diadaptasi. Pada MWC 2026, Huawei juga meluncurkan secara perdana di pasar internasional platform kekuatan komputasi baru, SuperPoD.
FP16 dari Ascend 910B sudah setara dengan Nvidia A100. Meskipun masih ada jarak, sudah berubah dari tidak bisa digunakan menjadi bisa digunakan, dan dari bisa digunakan menuju ke praktis. Pengembangan ekosistem tidak bisa menunggu chip benar-benar sempurna; harus dimulai secara besar-besaran saat kapasitas sudah cukup, dan kebutuhan bisnis nyata digunakan untuk mendorong iterasi chip dan perangkat lunak. Target penggunaan server kekuatan komputasi domestik oleh ByteDance, Tencent, dan Baidu pada 2026 diperkirakan akan berlipat ganda dibanding tahun sebelumnya. Data dari Kementerian Industri dan Teknologi Informasi menunjukkan bahwa skala komputasi pintar China telah mencapai 1590 EFLOPS. Tahun 2026, menjadi tahun tonggak utama dalam penyebaran skala kekuatan komputasi domestik.
Krisis listrik di AS dan ekspansi keluar China
Awal 2026, negara bagian Virginia yang menampung sebagian besar lalu lintas data pusat data global, menghentikan persetujuan pembangunan pusat data baru. Georgia mengikuti, dan penghentian persetujuan berlanjut hingga 2027. Illinois dan Michigan juga mengeluarkan langkah pembatasan.
Menurut data dari International Energy Agency, pada 2024, konsumsi listrik pusat data di AS telah mencapai 183 TWh, sekitar 4% dari total konsumsi listrik nasional. Diperkirakan, angka ini akan berlipat ganda menjadi 426 TWh pada 2030, dan pangsa konsumsi listriknya bisa menembus 12%. CEO Arm bahkan memprediksi bahwa pada 2030, pusat data AI akan mengkonsumsi 20% hingga 25% dari listrik di AS.
Jaringan listrik di AS sudah tidak mampu menanggung beban. Jaringan PJM yang melayani 13 negara bagian di Timur AS menghadapi kekurangan kapasitas sebesar 6 GW. Pada 2033, kekurangan kapasitas listrik secara keseluruhan di AS diperkirakan mencapai 175 GW, setara dengan konsumsi listrik dari 130 juta rumah tangga. Biaya listrik grosir di daerah pusat data meningkat 267% dibanding lima tahun lalu.
Batas akhir kekuatan komputasi adalah energi. Dan dalam dimensi energi ini, jarak antara China dan AS bahkan lebih besar daripada chip, hanya saja arahnya berbalik.
Produksi listrik tahunan China sebesar 10,4 triliun kWh, sedangkan AS hanya 4,2 triliun kWh, dan China 2,5 kali lipat dari AS. Lebih penting lagi, listrik untuk kebutuhan rumah tangga di China hanya sekitar 15% dari total konsumsi listrik, sedangkan di AS, proporsi ini mencapai 36%. Ini berarti China memiliki cadangan listrik industri yang jauh lebih besar untuk dialokasikan ke pembangunan kekuatan komputasi.
Dalam hal tarif listrik, perusahaan AI di kawasan pusat data di AS membayar sekitar 0,12 hingga 0,15 dolar AS per kWh, sementara tarif listrik industri di wilayah barat China sekitar 0,03 dolar AS, hanya seperempat hingga seperlima dari tarif di AS.
Pertumbuhan kapasitas listrik China sudah mencapai tujuh kali lipat dari AS.
Saat AS menghadapi krisis listrik, AI China secara diam-diam mulai menembus pasar internasional. Tapi kali ini, yang diekspor bukan produk, bukan pabrik, melainkan Token.
Token, unit terkecil dalam pengolahan informasi model AI, sedang menjadi komoditas digital baru. Token ini diproduksi di pabrik kekuatan komputasi China, kemudian dikirim melalui kabel bawah laut ke seluruh dunia.
Data distribusi pengguna DeepSeek sangat menunjukkan hal ini: 30,7% pengguna berasal dari China, 13,6% dari India, 6,9% dari Indonesia, 4,3% dari AS, dan 3,2% dari Prancis. Mendukung 37 bahasa, sangat populer di pasar baru seperti Brasil. Ada 26.000 perusahaan di seluruh dunia yang membuka akun, dan 3.200 lembaga yang mengadopsi versi perusahaan.
Pada 2025, 58% startup AI baru memasukkan DeepSeek ke dalam tumpukan teknologi mereka. Di China, DeepSeek menguasai 89% pangsa pasar. Sementara di negara-negara lain yang terkena sanksi, pangsa pasar berkisar antara 40% hingga 60%.
Gambaran ini sangat mirip dengan perang lain tentang kemandirian industri empat puluh tahun lalu.
Pada 1986 di Tokyo, di bawah tekanan besar dari AS, pemerintah Jepang menandatangani “Perjanjian Semikonduktor Jepang-AS”. Ada tiga ketentuan utama: membuka pasar semikonduktor Jepang, dengan pangsa pasar chip AS di Jepang harus mencapai lebih dari 20%; melarang ekspor semikonduktor Jepang di bawah harga pokok; dan mengenakan tarif penalti 100% untuk chip Jepang yang diekspor senilai 300 juta dolar AS. Pada saat yang sama, AS menolak akuisisi Fujitsu terhadap Fairchild Semiconductor.
Saat itu, industri semikonduktor Jepang sedang berada di puncaknya. Pada 1988, Jepang menguasai 51% pangsa pasar semikonduktor global, sementara AS hanya 36,8%. Sepuluh perusahaan semikonduktor terbesar di dunia didominasi Jepang: NEC di posisi kedua, Toshiba ketiga, Hitachi kelima, Fujitsu ketujuh, Mitsubishi kedelapan, dan Panasonic kesembilan. Pada 1985, Intel mengalami kerugian sebesar 173 juta dolar AS dalam perang semikonduktor AS-Jepang, hampir bangkrut.
Namun, setelah perjanjian ini, semuanya berubah.
AS menggunakan investigasi 301 dan berbagai cara lain untuk melakukan tekanan penuh terhadap perusahaan semikonduktor Jepang. Mereka juga mendukung Samsung dan Hynix di Korea Selatan, dengan harga yang lebih rendah, untuk mengganggu pasar Jepang. Pangsa pasar DRAM Jepang dari 80% turun menjadi 10%. Pada 2017, pangsa pasar IC Jepang tersisa hanya 7%. Raksasa yang dulu tak terkalahkan, terpecah belah, diakuisisi, atau meninggalkan pasar dalam kerugian tanpa henti.
Tragedi semikonduktor Jepang adalah mereka puas menjadi produsen terbaik dalam sistem distribusi global yang didominasi kekuatan eksternal tunggal, tanpa pernah membangun ekosistem mandiri sendiri. Ketika gelombang surut, mereka menyadari bahwa selain memproduksi, mereka tidak memiliki apa-apa.
Industri AI China saat ini berada di persimpangan jalan yang serupa, tetapi sama sekali berbeda.
Yang sama adalah, kita juga menghadapi tekanan besar dari luar. Tiga gelombang pembatasan chip, bertingkat-tingkat, dan hambatan ekosistem CUDA yang masih tinggi.
Yang berbeda adalah, kali ini, kita memilih jalan yang lebih sulit. Dari optimisasi algoritma secara ekstrem, melampaui chip domestik dari inference ke pelatihan, hingga akumulasi 4 juta pengembang di ekosistem Ascend, dan ekspansi Token ke pasar global. Setiap langkah di jalan ini membangun ekosistem industri mandiri yang belum pernah dimiliki Jepang dulu.
Epilog
Pada 27 Februari 2026, tiga laporan keuangan dari perusahaan chip AI domestik dirilis secara bersamaan.
Cambricon, pendapatan melonjak 453%, pertama kalinya meraih laba tahunan. Moore Threads, pendapatan naik 243%, tetapi rugi bersih 1 miliar dolar. Muxi, pendapatan naik 121%, rugi bersih hampir 800 juta dolar.
Separuhnya adalah api, separuhnya adalah lautan.
Api adalah kehausan ekstrem pasar. Kekosongan 95% yang ditinggalkan Jensen Huang, perlahan diisi oleh angka pendapatan dari perusahaan-perusahaan lokal ini, satu per satu. Apapun performa dan ekosistemnya, pasar membutuhkan pilihan kedua selain Nvidia. Ini adalah peluang struktural langka yang terbuka lebar karena geopolitik.
Lautan adalah biaya besar pembangunan ekosistem. Setiap kerugian adalah biaya nyata yang dikeluarkan untuk mengejar ekosistem CUDA. Investasi R&D, subsidi perangkat lunak, dan biaya tenaga kerja engineer yang ditempatkan langsung di lapangan untuk menyelesaikan masalah kompilasi satu per satu. Kerugian ini bukan karena manajemen buruk, melainkan sebagai “pajak perang” yang harus dibayar untuk membangun ekosistem mandiri.
Ketiga laporan keuangan ini, lebih jujur daripada laporan industri mana pun, merekam gambaran nyata dari perang kekuatan komputasi ini. Bukan kemenangan yang gemilang, melainkan pertempuran sengit, di mana darah mengalir dan semangat bertempur tetap menyala.
Namun, bentuk perang ini benar-benar telah berubah. Delapan tahun lalu, kita membahas tentang “apakah bisa bertahan hidup”. Sekarang, kita membahas tentang “berapa besar biaya yang harus dikeluarkan untuk bertahan hidup”.
Biaya itu sendiri adalah kemajuan.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Perang Balasan Kekuatan AI Tiongkok
Pertempuran Balasan Kekuatan Komputasi AI China
Delapan tahun yang lalu, Zhongxing mengalami henti jantung.
Pada 16 April 2018, sebuah perintah dari Biro Keamanan dan Industri Departemen Perdagangan AS membuat Zhongxing Communications, perusahaan perangkat komunikasi terbesar keempat di dunia dengan 80.000 karyawan dan pendapatan tahunan lebih dari seribu miliar, berhenti beroperasi dalam semalam. Isi perintahnya sangat sederhana: selama tujuh tahun ke depan, melarang perusahaan AS menjual suku cadang, barang, perangkat lunak, dan teknologi apa pun kepada Zhongxing.
Tanpa chip Qualcomm, stasiun basis berhenti produksi. Tanpa lisensi Android dari Google, ponsel tidak memiliki sistem yang bisa digunakan. Tiga puluh tiga hari kemudian, Zhongxing mengeluarkan pengumuman bahwa kegiatan utama perusahaan sudah tidak dapat dilanjutkan.
Namun, Zhongxing akhirnya bertahan, tetapi dengan harga 1,4 miliar dolar AS.
Denda sebesar 1 miliar dolar AS dibayar sekaligus; jaminan sebesar 400 juta dolar disetorkan ke rekening escrow bank AS. Selain itu, seluruh manajemen diganti, dan tim pengawas kepatuhan dari pihak AS didatangkan untuk mengawasi. Sepanjang tahun 2018, Zhongxing mengalami kerugian bersih sebesar 7 miliar yuan RMB, dan pendapatannya anjlok 21,4% dibanding tahun sebelumnya.
Ketua Dewan Direksi Zhongxing saat itu, Yin Yimin, menulis dalam surat internal: “Kita berada dalam industri yang kompleks dan sangat bergantung pada rantai pasokan global.” Kalimat ini, saat itu, terdengar sebagai refleksi sekaligus keputusasaan.
Delapan tahun kemudian, pada 26 Februari 2026, unicorn AI China DeepSeek mengumumkan bahwa model multimodal besar V4 yang akan dirilis akan secara prioritas bekerja sama secara mendalam dengan produsen chip domestik, dan untuk pertama kalinya merealisasikan seluruh proses dari pra-pelatihan hingga fine-tuning tanpa bergantung pada Nvidia.
Dengan kata lain: kita tidak lagi bergantung pada Nvidia.
Begitu berita ini keluar, reaksi pasar pertama adalah keraguan. Nvidia menguasai lebih dari 90% pangsa pasar chip pelatihan AI global. Mengabaikan Nvidia, secara bisnis, apakah masuk akal?
Namun, di balik pilihan DeepSeek, tersembunyi sebuah masalah yang lebih besar daripada logika bisnis: sejauh mana AI China benar-benar membutuhkan kemandirian kekuatan komputasi?
Apa yang sebenarnya terhambat?
Banyak orang mengira, larangan chip menghambat hardware. Tapi yang benar-benar membuat perusahaan AI China merasa tercekik adalah sesuatu yang disebut CUDA.
CUDA, singkatan dari Compute Unified Device Architecture, adalah platform komputasi paralel dan model pemrograman yang diperkenalkan Nvidia pada tahun 2006. Ia memungkinkan pengembang langsung memanfaatkan kekuatan GPU Nvidia untuk mempercepat berbagai tugas komputasi kompleks.
Sebelum era AI tiba, ini hanyalah alat untuk kalangan geek tertentu. Tapi saat gelombang pembelajaran mendalam melanda, CUDA menjadi fondasi seluruh industri AI.
Pelatihan model besar AI secara esensial adalah operasi matriks dalam jumlah besar. Dan inilah yang paling dikuasai GPU.
Dengan strategi yang sudah direncanakan lebih dari satu dekade sebelumnya, Nvidia menggunakan CUDA untuk membangun rangkaian lengkap alat dari perangkat keras dasar hingga aplikasi tingkat atas bagi pengembang AI di seluruh dunia. Saat ini, semua kerangka kerja AI utama di dunia, dari TensorFlow milik Google hingga PyTorch milik Meta, sangat terkait erat dengan CUDA.
Seorang mahasiswa doktoral di bidang AI, sejak hari pertama masuk, belajar, memprogram, dan melakukan eksperimen dalam lingkungan CUDA. Setiap baris kode yang dia tulis, memperkuat benteng Nvidia.
Hingga tahun 2025, ekosistem CUDA telah memiliki lebih dari 4,5 juta pengembang, mencakup lebih dari 3.000 aplikasi yang dipercepat GPU, dan lebih dari 40.000 perusahaan di seluruh dunia menggunakan CUDA. Angka ini berarti lebih dari 90% pengembang AI di dunia terikat dalam ekosistem Nvidia.
Kehebatan CUDA terletak pada sifatnya yang seperti roda berputar. Semakin banyak pengembang yang menggunakannya, semakin banyak alat, pustaka, dan kode yang dihasilkan, sehingga ekosistem menjadi semakin makmur; ekosistem yang makmur akan menarik lebih banyak pengembang lagi. Begitu roda ini mulai berputar, hampir tidak mungkin dihentikan.
Hasilnya, Nvidia menjual alat paling mahal kepada Anda, sekaligus menetapkan satu-satunya posisi untuk menambang. Ingin beralih ke alat lain? Silakan. Tapi, Anda harus menulis ulang semua pengalaman, alat, dan kode yang dikumpulkan selama puluhan tahun oleh ratusan ribu otak cerdas di seluruh dunia dalam posisi tersebut.
Siapa yang harus membayar biaya ini?
Jadi, ketika pada 7 Oktober 2022, BIS memberlakukan pembatasan pertama yang membatasi ekspor A100 dan H100 Nvidia ke China, perusahaan AI China pertama kali merasakan kekakuan seperti yang dialami Zhongxing. Nvidia kemudian meluncurkan versi khusus untuk China, A800 dan H800, yang mengurangi bandwidth antar chip, dan secara paksa mempertahankan pasokan.
Namun, hanya setahun kemudian, pada 17 Oktober 2023, pembatasan kedua kembali diperketat, A800 dan H800 juga dilarang, dan 13 perusahaan China dimasukkan ke dalam daftar entitas. Nvidia harus meluncurkan versi H20 yang lebih dipotong lagi. Hingga Desember 2024, pembatasan terakhir selama masa pemerintahan Biden diberlakukan, bahkan ekspor H20 pun dibatasi secara ketat.
Tiga gelombang pembatasan, semakin ketat.
Tapi, kali ini, arah ceritanya berbeda sama sekali dari Zhongxing.
Perlawanan Asimetris
Di bawah larangan, semua orang mengira bahwa mimpi model besar AI China akan berakhir di situ.
Tapi mereka salah. Menghadapi blokade, perusahaan China tidak memilih untuk langsung melawan secara frontal, melainkan memulai sebuah perlawanan. Tempat pertama yang mereka serang bukan chip, melainkan algoritma.
Antara akhir 2024 dan 2025, perusahaan AI China secara kolektif beralih ke satu arah teknologi: model ahli campuran.
Secara sederhana, ini adalah membagi satu model besar menjadi banyak model kecil yang disebut ahli, yang hanya diaktifkan saat diperlukan, bukan mengaktifkan seluruh model sekaligus.
DeepSeek V3 adalah contoh utama dari pendekatan ini. Memiliki 671 miliar parameter, tetapi saat melakukan inferensi, hanya mengaktifkan 37 miliar, yaitu sekitar 5,5% dari total. Dari segi biaya pelatihan, menggunakan 2.048 GPU Nvidia H800, selama 58 hari, dengan total biaya sekitar 5,576 juta dolar AS. Sebagai perbandingan, perkiraan biaya pelatihan GPT-4 sekitar 78 juta dolar AS. Perbedaan skala yang besar.
Optimisasi algoritma secara ekstrem ini langsung tercermin pada harga. Harga API DeepSeek, untuk input satu juta token, hanya 0,028 hingga 0,28 dolar AS, dan outputnya sekitar 0,42 dolar. Sebaliknya, biaya input GPT-4 sekitar 5 dolar, dan outputnya 15 dolar. Claude Opus bahkan lebih mahal, dengan biaya input 15 dolar dan output 75 dolar. Jika dihitung, DeepSeek 25 hingga 75 kali lebih murah dari Claude.
Perbedaan harga ini mendapatkan respons besar di pasar pengembang global. Pada Februari 2026, dalam tiga minggu, volume panggilan per minggu untuk model AI di platform penggabungan API terbesar dunia, OpenRouter, di China melonjak 127%, melampaui Amerika Serikat untuk pertama kalinya. Setahun sebelumnya, pangsa pasar model China di OpenRouter kurang dari 2%. Setelah satu tahun, meningkat 421%, mendekati 60%.
Di balik data ini, tersembunyi sebuah perubahan struktural yang mudah diabaikan. Mulai paruh kedua 2025, skenario utama aplikasi AI beralih dari sekadar chat ke Agent. Dalam skenario Agent, konsumsi token untuk satu tugas 10 hingga 100 kali lipat lebih besar daripada chat sederhana. Ketika konsumsi token meningkat secara eksponensial, harga menjadi faktor penentu utama. Model China yang menawarkan nilai terbaik, tepat berada di momen ini.
Tapi masalahnya, penurunan biaya inferensi tidak menyelesaikan masalah utama pelatihan. Jika sebuah model besar tidak dapat terus dilatih dan diperbarui dengan data terbaru, kemampuannya akan cepat menurun. Dan pelatihan tetap menjadi lubang hitam kekuatan komputasi yang tak terelakkan.
Lalu, dari mana asal “alat” pelatihan itu?
Transformasi Cadangan
Di kota kecil Xinghua, Jiangsu, terkenal dengan baja tahan karat dan makanan sehat, sebelumnya tidak ada kaitannya dengan AI. Tapi pada 2025, sebuah jalur produksi server kekuatan komputasi domestik sepanjang 148 meter dibangun dan mulai beroperasi di sana, dari penandatanganan kontrak hingga produksi hanya membutuhkan 180 hari.
Inti dari jalur produksi ini adalah dua chip domestik sepenuhnya: prosesor Longxin 3C6000 dan kartu akselerator Tai Chu Yuan Qi T100 AI. Longxin 3C6000 dikembangkan sepenuhnya dari arsitektur instruksi hingga mikroarsitektur secara mandiri. Tai Chu Yuan Qi berasal dari pusat superkomputasi Wuxi dan tim Tsinghua University, menggunakan arsitektur heterogen multi-core.
Saat jalur produksi ini beroperasi penuh, satu server dapat diproduksi setiap 5 menit. Total investasi jalur ini adalah 1,1 miliar yuan, dengan kapasitas tahunan sekitar 100.000 unit.
Yang lebih penting, cluster ribuan chip domestik ini sudah mulai menangani pelatihan model besar yang sesungguhnya.
Pada Januari 2026, Zhiyuan AI bekerja sama dengan Huawei merilis GLM-Image, model generasi terbaru untuk gambar yang sepenuhnya dilatih menggunakan chip domestik, dan merupakan model SOTA yang sepenuhnya bergantung pada chip domestik dari awal hingga akhir. Pada Februari, model “Xingchen” milik China Telecom, yang bernilai ratusan miliar yuan, menyelesaikan pelatihan lengkap di pool kekuatan komputasi domestik di Lingang, Shanghai.
Contoh-contoh ini membuktikan satu hal: chip domestik, sudah mampu digunakan tidak hanya untuk inferensi, tetapi juga untuk pelatihan. Ini adalah perubahan kualitas. Inferensi hanya membutuhkan menjalankan model yang sudah dilatih, sehingga persyaratan chip relatif lebih rendah; sedangkan pelatihan membutuhkan penanganan data dalam jumlah besar, perhitungan gradien yang kompleks, dan pembaruan parameter, yang menuntut kekuatan komputasi chip, bandwidth koneksi, dan ekosistem perangkat lunak yang jauh lebih tinggi.
Kekuatan utama yang menangani tugas ini adalah chip seri Ascend dari Huawei. Hingga akhir 2025, jumlah pengembang ekosistem Ascend telah melampaui 4 juta, lebih dari 3.000 mitra, dan 43 model besar industri telah selesai pra-pelatihan di atas Ascend, serta lebih dari 200 model sumber terbuka telah diadaptasi. Pada MWC 2026, Huawei juga meluncurkan secara perdana di pasar internasional platform kekuatan komputasi baru, SuperPoD.
FP16 dari Ascend 910B sudah setara dengan Nvidia A100. Meskipun masih ada jarak, sudah berubah dari tidak bisa digunakan menjadi bisa digunakan, dan dari bisa digunakan menuju ke praktis. Pengembangan ekosistem tidak bisa menunggu chip benar-benar sempurna; harus dimulai secara besar-besaran saat kapasitas sudah cukup, dan kebutuhan bisnis nyata digunakan untuk mendorong iterasi chip dan perangkat lunak. Target penggunaan server kekuatan komputasi domestik oleh ByteDance, Tencent, dan Baidu pada 2026 diperkirakan akan berlipat ganda dibanding tahun sebelumnya. Data dari Kementerian Industri dan Teknologi Informasi menunjukkan bahwa skala komputasi pintar China telah mencapai 1590 EFLOPS. Tahun 2026, menjadi tahun tonggak utama dalam penyebaran skala kekuatan komputasi domestik.
Krisis listrik di AS dan ekspansi keluar China
Awal 2026, negara bagian Virginia yang menampung sebagian besar lalu lintas data pusat data global, menghentikan persetujuan pembangunan pusat data baru. Georgia mengikuti, dan penghentian persetujuan berlanjut hingga 2027. Illinois dan Michigan juga mengeluarkan langkah pembatasan.
Menurut data dari International Energy Agency, pada 2024, konsumsi listrik pusat data di AS telah mencapai 183 TWh, sekitar 4% dari total konsumsi listrik nasional. Diperkirakan, angka ini akan berlipat ganda menjadi 426 TWh pada 2030, dan pangsa konsumsi listriknya bisa menembus 12%. CEO Arm bahkan memprediksi bahwa pada 2030, pusat data AI akan mengkonsumsi 20% hingga 25% dari listrik di AS.
Jaringan listrik di AS sudah tidak mampu menanggung beban. Jaringan PJM yang melayani 13 negara bagian di Timur AS menghadapi kekurangan kapasitas sebesar 6 GW. Pada 2033, kekurangan kapasitas listrik secara keseluruhan di AS diperkirakan mencapai 175 GW, setara dengan konsumsi listrik dari 130 juta rumah tangga. Biaya listrik grosir di daerah pusat data meningkat 267% dibanding lima tahun lalu.
Batas akhir kekuatan komputasi adalah energi. Dan dalam dimensi energi ini, jarak antara China dan AS bahkan lebih besar daripada chip, hanya saja arahnya berbalik.
Produksi listrik tahunan China sebesar 10,4 triliun kWh, sedangkan AS hanya 4,2 triliun kWh, dan China 2,5 kali lipat dari AS. Lebih penting lagi, listrik untuk kebutuhan rumah tangga di China hanya sekitar 15% dari total konsumsi listrik, sedangkan di AS, proporsi ini mencapai 36%. Ini berarti China memiliki cadangan listrik industri yang jauh lebih besar untuk dialokasikan ke pembangunan kekuatan komputasi.
Dalam hal tarif listrik, perusahaan AI di kawasan pusat data di AS membayar sekitar 0,12 hingga 0,15 dolar AS per kWh, sementara tarif listrik industri di wilayah barat China sekitar 0,03 dolar AS, hanya seperempat hingga seperlima dari tarif di AS.
Pertumbuhan kapasitas listrik China sudah mencapai tujuh kali lipat dari AS.
Saat AS menghadapi krisis listrik, AI China secara diam-diam mulai menembus pasar internasional. Tapi kali ini, yang diekspor bukan produk, bukan pabrik, melainkan Token.
Token, unit terkecil dalam pengolahan informasi model AI, sedang menjadi komoditas digital baru. Token ini diproduksi di pabrik kekuatan komputasi China, kemudian dikirim melalui kabel bawah laut ke seluruh dunia.
Data distribusi pengguna DeepSeek sangat menunjukkan hal ini: 30,7% pengguna berasal dari China, 13,6% dari India, 6,9% dari Indonesia, 4,3% dari AS, dan 3,2% dari Prancis. Mendukung 37 bahasa, sangat populer di pasar baru seperti Brasil. Ada 26.000 perusahaan di seluruh dunia yang membuka akun, dan 3.200 lembaga yang mengadopsi versi perusahaan.
Pada 2025, 58% startup AI baru memasukkan DeepSeek ke dalam tumpukan teknologi mereka. Di China, DeepSeek menguasai 89% pangsa pasar. Sementara di negara-negara lain yang terkena sanksi, pangsa pasar berkisar antara 40% hingga 60%.
Gambaran ini sangat mirip dengan perang lain tentang kemandirian industri empat puluh tahun lalu.
Pada 1986 di Tokyo, di bawah tekanan besar dari AS, pemerintah Jepang menandatangani “Perjanjian Semikonduktor Jepang-AS”. Ada tiga ketentuan utama: membuka pasar semikonduktor Jepang, dengan pangsa pasar chip AS di Jepang harus mencapai lebih dari 20%; melarang ekspor semikonduktor Jepang di bawah harga pokok; dan mengenakan tarif penalti 100% untuk chip Jepang yang diekspor senilai 300 juta dolar AS. Pada saat yang sama, AS menolak akuisisi Fujitsu terhadap Fairchild Semiconductor.
Saat itu, industri semikonduktor Jepang sedang berada di puncaknya. Pada 1988, Jepang menguasai 51% pangsa pasar semikonduktor global, sementara AS hanya 36,8%. Sepuluh perusahaan semikonduktor terbesar di dunia didominasi Jepang: NEC di posisi kedua, Toshiba ketiga, Hitachi kelima, Fujitsu ketujuh, Mitsubishi kedelapan, dan Panasonic kesembilan. Pada 1985, Intel mengalami kerugian sebesar 173 juta dolar AS dalam perang semikonduktor AS-Jepang, hampir bangkrut.
Namun, setelah perjanjian ini, semuanya berubah.
AS menggunakan investigasi 301 dan berbagai cara lain untuk melakukan tekanan penuh terhadap perusahaan semikonduktor Jepang. Mereka juga mendukung Samsung dan Hynix di Korea Selatan, dengan harga yang lebih rendah, untuk mengganggu pasar Jepang. Pangsa pasar DRAM Jepang dari 80% turun menjadi 10%. Pada 2017, pangsa pasar IC Jepang tersisa hanya 7%. Raksasa yang dulu tak terkalahkan, terpecah belah, diakuisisi, atau meninggalkan pasar dalam kerugian tanpa henti.
Tragedi semikonduktor Jepang adalah mereka puas menjadi produsen terbaik dalam sistem distribusi global yang didominasi kekuatan eksternal tunggal, tanpa pernah membangun ekosistem mandiri sendiri. Ketika gelombang surut, mereka menyadari bahwa selain memproduksi, mereka tidak memiliki apa-apa.
Industri AI China saat ini berada di persimpangan jalan yang serupa, tetapi sama sekali berbeda.
Yang sama adalah, kita juga menghadapi tekanan besar dari luar. Tiga gelombang pembatasan chip, bertingkat-tingkat, dan hambatan ekosistem CUDA yang masih tinggi.
Yang berbeda adalah, kali ini, kita memilih jalan yang lebih sulit. Dari optimisasi algoritma secara ekstrem, melampaui chip domestik dari inference ke pelatihan, hingga akumulasi 4 juta pengembang di ekosistem Ascend, dan ekspansi Token ke pasar global. Setiap langkah di jalan ini membangun ekosistem industri mandiri yang belum pernah dimiliki Jepang dulu.
Epilog
Pada 27 Februari 2026, tiga laporan keuangan dari perusahaan chip AI domestik dirilis secara bersamaan.
Cambricon, pendapatan melonjak 453%, pertama kalinya meraih laba tahunan. Moore Threads, pendapatan naik 243%, tetapi rugi bersih 1 miliar dolar. Muxi, pendapatan naik 121%, rugi bersih hampir 800 juta dolar.
Separuhnya adalah api, separuhnya adalah lautan.
Api adalah kehausan ekstrem pasar. Kekosongan 95% yang ditinggalkan Jensen Huang, perlahan diisi oleh angka pendapatan dari perusahaan-perusahaan lokal ini, satu per satu. Apapun performa dan ekosistemnya, pasar membutuhkan pilihan kedua selain Nvidia. Ini adalah peluang struktural langka yang terbuka lebar karena geopolitik.
Lautan adalah biaya besar pembangunan ekosistem. Setiap kerugian adalah biaya nyata yang dikeluarkan untuk mengejar ekosistem CUDA. Investasi R&D, subsidi perangkat lunak, dan biaya tenaga kerja engineer yang ditempatkan langsung di lapangan untuk menyelesaikan masalah kompilasi satu per satu. Kerugian ini bukan karena manajemen buruk, melainkan sebagai “pajak perang” yang harus dibayar untuk membangun ekosistem mandiri.
Ketiga laporan keuangan ini, lebih jujur daripada laporan industri mana pun, merekam gambaran nyata dari perang kekuatan komputasi ini. Bukan kemenangan yang gemilang, melainkan pertempuran sengit, di mana darah mengalir dan semangat bertempur tetap menyala.
Namun, bentuk perang ini benar-benar telah berubah. Delapan tahun lalu, kita membahas tentang “apakah bisa bertahan hidup”. Sekarang, kita membahas tentang “berapa besar biaya yang harus dikeluarkan untuk bertahan hidup”.
Biaya itu sendiri adalah kemajuan.