Penyediaan data menjadi kendala dalam pengembangan AI, data on-chain memimpin era baru DataFi.

Bottleneck Baru dalam Pengembangan Kecerdasan Buatan: Data Menjadi Tantangan Utama

Dengan cepatnya peningkatan skala dan kemampuan komputasi model kecerdasan buatan, sebuah masalah kunci yang lama diabaikan mulai muncul ke permukaan—pasokan data. Saat ini, industri AI menghadapi sebuah kontradiksi struktural: model dan daya komputasi telah membentuk sistem pasar yang matang, tetapi produksi, pembersihan, verifikasi, dan perdagangan data masih berada di tahap awal. Dalam sepuluh tahun ke depan, fokus pengembangan AI akan beralih dari model dan daya komputasi ke pembangunan infrastruktur data.

Dilema Data di Industri AI

Sejak revolusi pembelajaran mendalam, ukuran parameter model AI telah melonjak dari jutaan ke triliunan, dan permintaan daya komputasi meningkat secara eksponensial. Namun, pertumbuhan "data organik" berkualitas tinggi yang dihasilkan manusia telah mendekati batas. Sebagai contoh, untuk data teks, total jumlah teks berkualitas tinggi yang dapat diakses di internet sekitar 10^12 kata, sementara melatih model dengan seratus miliar parameter membutuhkan sekitar 10^13 kata data. Ini berarti kolam data yang ada hanya dapat mendukung pelatihan sejumlah kecil model dengan ukuran yang sama.

Lebih parah lagi, proporsi konten yang diulang dan berkualitas rendah melebihi 60%, yang lebih lanjut memperketat pasokan data yang efektif. Ketika model mulai menggunakan konten yang dihasilkan AI dalam jumlah besar, "pencemaran data" yang mengakibatkan penurunan kinerja model telah menjadi kekhawatiran di industri. Akar dari kontradiksi ini terletak pada: industri AI telah lama memandang data sebagai "sumber daya gratis", bukan sebagai "aset strategis" yang perlu dibudidayakan dengan hati-hati.

Data On-Chain: Materi Pelatihan Ideal untuk AI

Dalam konteks ini, data on-chain dari jaringan blockchain menunjukkan nilai unik. Dibandingkan dengan data internet tradisional, data on-chain memiliki keaslian dan kredibilitas yang alami:

  1. Sinyal niat yang nyata: Data on-chain mencatat perilaku keputusan yang dibuat pengguna dengan uang sungguhan, secara langsung mencerminkan penilaian terhadap nilai proyek dan strategi alokasi dana.

  2. Rantai perilaku yang dapat dilacak: Transparansi blockchain memungkinkan perilaku pengguna dapat dilacak secara lengkap, membentuk "rantai perilaku" yang koheren, membantu AI membangun profil pengguna yang akurat.

  3. Akses terbuka: Data on-chain terbuka untuk semua pengembang, dapat diakses tanpa izin, menyediakan sumber data dengan hambatan rendah untuk pelatihan model AI.

Namun, data on-chain juga menghadapi tantangan: mereka ada dalam bentuk "log peristiwa" yang tidak terstruktur, dan memerlukan pemrosesan yang kompleks agar dapat digunakan oleh model AI. Saat ini, "rasio transformasi terstruktur" data on-chain kurang dari 5%, dengan banyak sinyal bernilai tinggi yang terpendam di dalam informasi yang terfragmentasi.

Membangun "Sistem Operasi Cerdas" untuk Data di Blockchain

Untuk mengatasi masalah fragmentasi data di blockchain, industri sedang mengeksplorasi pembangunan "sistem operasi pintar di blockchain" yang dirancang khusus untuk AI. Tujuan utama dari sistem semacam ini adalah untuk mengubah sinyal blockchain yang terdistribusi menjadi data yang terstruktur, dapat diverifikasi, dan siap untuk AI secara waktu nyata. Ini terutama mencakup beberapa komponen kunci berikut:

  1. Standar Data Terbuka: Menyatukan format data dari berbagai blockchain dan protokol, sehingga AI dapat langsung "memahami" dunia di dalam rantai.

  2. Mekanisme verifikasi terdesentralisasi: Menggunakan mekanisme konsensus blockchain untuk memastikan keaslian dan integritas data.

  3. Lapisan Ketersediaan Data Berperforma Tinggi: Mencapai pemrosesan data secara real-time di dalam rantai dan transmisi latensi rendah melalui algoritma dan arsitektur yang dioptimalkan.

  4. Protokol Penilaian Data: Mengembangkan model AI untuk secara otomatis mengevaluasi kualitas dataset, menyediakan patokan harga untuk pasar perdagangan data.

Menuju Era DataFi

Tujuan akhir dari upaya ini adalah mendorong industri AI memasuki era DataFi—data akan menjadi "modal" yang dapat dinilai, diperdagangkan, dan ditingkatkan nilainya. Di era baru ini, data akan memiliki empat atribut inti:

  1. Terstruktur: Sinyal asli di blockchain diubah menjadi data terstruktur yang dapat langsung digunakan oleh AI.

  2. Dapat Digabungkan: Data dari sumber yang berbeda dapat digabungkan seperti blok Lego, memperluas batasan aplikasi.

  3. Dapat diverifikasi: Keaslian data dapat dilacak dan diverifikasi melalui catatan di blockchain.

  4. Dapat direalisasikan: Penyedia data dapat mengubah data berkualitas tinggi langsung menjadi pendapatan.

Penutup: Revolusi Data Memimpin Era Baru AI

Evolusi AI pada dasarnya adalah evolusi infrastruktur data. Dari keterbatasan data yang dihasilkan oleh manusia hingga penemuan nilai data di blockchain, dari sinyal yang terfragmentasi hingga aset yang terstruktur, generasi baru infrastruktur data sedang membentuk kembali logika dasar industri AI. Di era DataFi yang akan datang, data akan menjadi jembatan yang menghubungkan AI dengan dunia nyata, mendorong munculnya berbagai aplikasi inovatif.

Ketika data akhirnya diberikan nilai yang seharusnya, AI dapat benar-benar melepaskan kekuatan untuk mengubah dunia. Aplikasi AI generasi berikutnya tidak hanya memerlukan model yang kuat, tetapi juga data berkualitas tinggi dan dapat diandalkan sebagai dukungan. Membangun ekosistem data seperti itu akan menjadi tugas inti industri AI dalam sepuluh tahun ke depan.

READY0.06%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • Posting ulang
  • Bagikan
Komentar
0/400
SigmaBrainvip
· 12jam yang lalu
Drifting kereta jenazah didasarkan pada data.
Lihat AsliBalas0
BoredWatchervip
· 08-08 00:30
Data jauh lebih harum daripada paket masakan.
Lihat AsliBalas0
ChainComedianvip
· 08-06 13:10
Data tidak cukup, GPT juga harus lapar.
Lihat AsliBalas0
airdrop_whisperervip
· 08-06 11:21
Cepat atau lambat, data akan menjadi aset termahal.
Lihat AsliBalas0
MeltdownSurvivalistvip
· 08-06 11:18
Sudah sering dibicarakan, data adalah kunci utama.
Lihat AsliBalas0
LiquidityHuntervip
· 08-06 11:17
Pada akhirnya, itu semua tetap tentang mengonsumsi data dan bermain dengan batasan baru.
Lihat AsliBalas0
FarmHoppervip
· 08-06 11:11
Sial, sumber data hampir bertarung secara langsung.
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)