Judul asli: "AI sebagai mesin, manusia sebagai setir"
Menulis: Vitalik, pendiri Ethereum
Compile: Bai Shui, Golden Finance
Jika Anda bertanya kepada orang-orang aspek apa dari struktur demokrasi yang mereka sukai, apakah itu pemerintah, tempat kerja, atau DAO berbasis blockchain, Anda akan sering mendengar argumen yang sama: mereka menghindari konsentrasi kekuasaan, mereka memberi pengguna jaminan kuat bahwa tidak ada yang dapat sepenuhnya mengubah arah sistem sesuka hati, dan mereka dapat membuat keputusan berkualitas lebih tinggi dengan mengumpulkan pandangan dan kebijaksanaan banyak orang.
Jika Anda bertanya kepada orang-orang tentang aspek-aspek mana dari struktur demokrasi yang tidak disukai mereka, mereka sering memberikan keluhan yang sama: pemilih biasa kurang terlatih karena setiap pemilih hanya memiliki peluang kecil untuk memengaruhi hasil, sedikit pemilih yang berpikir secara berkualitas tinggi dalam pengambilan keputusan, dan Anda sering mendapatkan partisipasi rendah (membuat sistem rentan terhadap serangan) atau sebenarnya terpusat, karena setiap orang secara default mempercayai dan menggandakan pandangan dari orang-orang berpengaruh.
Tujuan artikel ini adalah untuk mengeksplorasi paradigma yang mungkin dapat menggunakan KI untuk mendapatkan manfaat dari struktur demokratis tanpa dampak negatif. 'KI adalah mesin, manusia adalah setir'. Manusia hanya memberikan sedikit informasi ke sistem, mungkin hanya beberapa ratus, tetapi semuanya dipertimbangkan secara matang dan berkualitas tinggi. KI menganggap data ini sebagai 'fungsi tujuan' dan membuat sejumlah besar keputusan tanpa lelah, berupaya untuk mencapai tujuan tersebut. Secara khusus, artikel ini akan membahas pertanyaan menarik: apakah kita dapat melakukannya tanpa menempatkan satu KI tunggal di pusatnya, tetapi bergantung pada pasar terbuka kompetitif di mana setiap KI (atau hibrida manusia-mesin) dapat berpartisipasi secara bebas?
Daftar
Mengapa tidak membiarkan AI mengambil alih langsung?
Futarchy
Memurnikan daya penilaian manusia
Pendanaan mendalam
Menambahkan privasi
Keuntungan dari desain mesin + kemudi
Mengapa tidak membiarkan AI bertanggung jawab secara langsung?
Cara termudah untuk memasukkan preferensi manusia ke dalam mekanisme berbasis AI adalah dengan membuat model AI dan meminta manusia entah bagaimana memasukkan preferensi mereka ke dalamnya. Ada cara mudah untuk melakukan ini: Anda cukup memasukkan file teks yang berisi daftar instruksi orang ke dalam prompt sistem. Anda kemudian dapat menggunakan salah satu dari banyak "kerangka kerja AI proxy" untuk memberikan akses AI ke internet, memberikannya kunci ke aset organisasi dan profil media sosial Anda, dan selesai.
Setelah beberapa iterasi, ini mungkin cukup untuk banyak kasus penggunaan, dan saya sepenuhnya berharap bahwa dalam waktu dekat kita akan melihat banyak struktur yang melibatkan instruksi membaca AI yang diberikan oleh grup (atau bahkan membaca obrolan grup secara real time) dan mengambil tindakan.
Struktur ini tidak ideal sebagai mekanisme tata kelola sebagai lembaga jangka panjang. Atribut berharga yang harus dimiliki lembaga jangka panjang adalah kredibilitas dan netralitas. Dalam posting saya memperkenalkan konsep ini, saya mencantumkan empat atribut berharga netralitas yang kredibel:
Jangan menuliskan orang atau hasil tertentu ke dalam mekanisme
Open source dan dapat diverifikasi secara publik
Menjaga kesederhanaan
Jangan sering mengubah
LLM (atau agen AI) memenuhi 0/4. Model ini pasti mengkodekan sejumlah besar orang tertentu dan preferensi hasil selama pelatihannya. Kadang-kadang ini mengarah pada arah preferensi AI yang mengejutkan, misalnya, melihat sebuah studi baru-baru ini yang menunjukkan bahwa LLM utama menghargai kehidupan di Pakistan lebih dari kehidupan di Amerika Serikat (!!). )。 Ini bisa berbobot terbuka, tetapi itu jauh dari open source; Kami tidak benar-benar tahu iblis apa yang bersembunyi di kedalaman model. Ini kebalikan dari sederhana: kompleksitas Kolmogorov dari LLM adalah puluhan miliar bit, kira-kira setara dengan semua undang-undang AS (federal + negara bagian + lokal) digabungkan. Dan karena AI berkembang sangat cepat, Anda harus mengubahnya setiap tiga bulan.
Untuk alasan ini, saya mendukung pendekatan lain yang dieksplorasi dalam banyak kasus penggunaan, yaitu membuat mekanisme sederhana menjadi aturan permainan, di mana AI menjadi pemain. Itulah wawasan yang membuat pasar begitu efisien: aturan adalah sistem hak milik yang relatif bodoh, kasus marginal diputuskan oleh sistem pengadilan yang lambat dalam mengakumulasi dan menyesuaikan preseden, sementara semua informasi berasal dari pengusaha yang beroperasi 'di pinggiran'.
Seorang "pemain game" tunggal bisa menjadi LLM, kelompok LLM yang berinteraksi satu sama lain dan memanggil berbagai layanan internet, berbagai kombinasi AI + manusia, dan banyak konstruksi lainnya; sebagai perancang mekanisme, Anda tidak perlu tahu. Tujuan idealnya adalah memiliki mekanisme yang bisa berjalan secara otomatis - jika tujuan mekanisme itu adalah memilih apa yang akan didanai, maka seharusnya sebisa mungkin seperti imbalan blok Bitcoin atau Ethereum.
Keuntungan dari metode ini adalah:
Ini menghindari memasukkan model tunggal apa pun ke dalam mekanisme; sebaliknya, Anda akan mendapatkan pasar terbuka yang terdiri dari banyak peserta dan arsitektur yang berbeda, masing-masing dengan biasnya sendiri. Model terbuka, model tertutup, agen kolektif, manusia + AI campuran, robot, monyet tak terbatas, semuanya adil; mekanisme ini tidak akan mendiskriminasi siapa pun.
Mekanisme ini adalah sumber terbuka. Meskipun pemain tidak, tapi permainan adalah sumber terbuka - dan ini adalah pola yang telah cukup dipahami (misalnya, partai politik dan pasar beroperasi dengan cara ini)
Mekanismenya sederhana, sehingga ada relatif sedikit jalan bagi perancang mekanisme untuk mengkodekan bias mereka sendiri ke dalam desain
Mekanisme ini tidak akan berubah, bahkan dari sekarang hingga titik aneh, arsitektur peserta inti perlu diredesain setiap tiga bulan sekali.
Tujuan dari mekanisme bimbingan adalah untuk secara setia mencerminkan tujuan mendasar peserta. Ini hanya memerlukan sedikit informasi, namun harus berkualitas tinggi.
Anda dapat menganggap mekanisme ini memanfaatkan ketidaksimetrisan antara penyajian jawaban dan verifikasi jawaban. Ini mirip dengan Sudoku yang sulit untuk dipecahkan, tetapi sangat mudah untuk memverifikasi apakah solusinya benar. Anda (i) membuat pasar terbuka, membiarkan pemain bertindak sebagai 'solver', dan kemudian (ii) menjaga mekanisme yang dijalankan oleh manusia untuk menjalankan tugas verifikasi solusi yang diajukan jauh lebih sederhana.
Futarchy
Futarchy awalnya diusulkan oleh Robin Hanson, yang berarti 'bertaruh pada nilai, tetapi bertaruh pada keyakinan'. Mekanisme pemungutan suara memilih serangkaian tujuan (bisa berupa tujuan apa pun, asalkan dapat diukur), kemudian menggabungkannya menjadi ukuran M. Ketika Anda perlu membuat keputusan (untuk kesederhanaan, kita anggap itu adalah YA/TIDAK), Anda akan membuat pasar berjangka: Anda meminta orang bertaruh (i) apakah akan memilih YA atau TIDAK, (ii) jika memilih YA, maka nilai M, jika tidak nol, (iii) jika memilih TIDAK, maka nilai M, jika tidak nol. Dengan tiga variabel ini, Anda dapat menentukan apakah pasar menganggap YA atau TIDAK lebih menguntungkan bagi nilai M.
"Harga saham perusahaan" (atau, dalam kasus cryptocurrency, harga token) adalah metrik yang paling sering dikutip karena mudah dipahami dan diukur, tetapi mekanismenya dapat mendukung berbagai metrik: pengguna aktif bulanan, median kebahagiaan yang dilaporkan sendiri untuk kelompok tertentu, beberapa metrik desentralisasi yang dapat diukur, dll.
Futarchy awalnya ditemukan sebelum era kecerdasan buatan. Namun, Futarchy secara alami sesuai dengan paradigma 'penyelesaian kompleks, validasi sederhana' yang dijelaskan di bagian sebelumnya, dan para pedagang dalam Futarchy juga bisa menjadi kecerdasan buatan (atau kombinasi manusia + kecerdasan buatan). Peran 'penyelesaian' (pedagang pasar prediksi) adalah menentukan bagaimana setiap rencana dalam setiap proposal akan mempengaruhi nilai indikator di masa depan. Ini sulit. Jika penyelesaian benar, mereka akan menghasilkan uang, jika tidak, mereka akan kehilangan uang. Validasi (orang yang memberikan suara pada indikator, yang jika mereka menyadari indikator dimanipulasi atau menjadi usang, akan menyesuaikan indikator, dan menentukan nilai aktual indikator pada waktu tertentu di masa depan) hanya perlu menjawab pertanyaan yang lebih sederhana 'berapa nilai indikator saat ini?'
Menyaring penilaian manusia
Distilasi manusia adalah jenis mekanisme yang bekerja seperti berikut. Ada sejumlah besar (bayangkan: 100 万个) pertanyaan yang perlu dijawab. Contoh alami termasuk:
Seberapa banyak penghargaan yang harus diterima oleh setiap orang dalam daftar ini untuk kontribusi terhadap suatu proyek atau tugas?
Manakah dari komentar ini yang melanggar aturan platform media sosial (atau sub-komunitas)?
Manakah dari alamat Ethereum yang diberikan mewakili orang yang sebenarnya dan unik?
Manakah dari objek-objek fisik ini yang memberikan kontribusi positif atau negatif terhadap estetika lingkungannya?
Anda memiliki tim yang dapat menjawab pertanyaan-pertanyaan ini, tetapi dengan biaya yang membutuhkan banyak energi untuk setiap jawaban. Anda hanya meminta tim menjawab sedikit pertanyaan (misalnya, jika ada 1 juta item dalam daftar total, tim mungkin hanya akan menjawab 100 item). Anda bahkan dapat mengajukan pertanyaan secara tidak langsung kepada tim: jangan bertanya 'Berapa persen total kredit yang seharusnya diterima oleh Alice?', tetapi tanyakan 'Apakah Alice atau Bob seharusnya menerima lebih banyak kredit, dan seberapa banyak lipatannya?'. Saat merancang mekanisme juri, Anda dapat menggunakan kembali mekanisme yang telah terbukti dalam dunia nyata, seperti komite alokasi dana, pengadilan (menentukan nilai putusan), evaluasi, dan tentu saja, peserta juri juga dapat menggunakan alat penelitian kecerdasan buatan yang inovatif untuk membantu mereka menemukan jawaban.
Anda kemudian mengizinkan siapa pun untuk mengirimkan daftar jawaban numerik ke seluruh rangkaian pertanyaan (misalnya, memberikan perkiraan berapa banyak kredit yang harus diterima setiap peserta untuk seluruh daftar). Peserta didorong untuk menggunakan kecerdasan buatan untuk menyelesaikan tugas ini, tetapi mereka dapat menggunakan teknologi apa pun: kecerdasan buatan, hibrida manusia-mesin, kecerdasan buatan yang memiliki akses ke pencarian internet dan mampu secara mandiri mempekerjakan manusia lain atau pekerja kecerdasan buatan, monyet yang ditingkatkan secara cybernetic, dll.
Setelah penyedia daftar lengkap dan juri mengirimkan jawabannya, daftar lengkap akan diperiksa berdasarkan jawaban juri, dan beberapa kombinasi dari daftar lengkap yang paling kompatibel dengan jawaban juri akan diambil sebagai jawaban akhir.
Mekanisme penilaian manusia yang distilasi berbeda dengan futarki, tetapi memiliki beberapa kesamaan penting:
Dalam futarki, 'solver' akan membuat prediksi, dan 'data real' yang menjadi dasar prediksi mereka (untuk memberi imbalan atau hukuman pada solver) adalah oracle yang mengeluarkan nilai indikator, dijalankan oleh juri.
Dalam penilaian manusia yang distilasi, 'Solver' akan memberikan jawaban untuk sejumlah besar pertanyaan, dan 'data real' yang menjadi dasar prediksi mereka adalah sebagian kecil jawaban berkualitas tinggi dari juri pada pertanyaan-pertanyaan ini.
Contoh mainan untuk menyaring penilaian manusia untuk distribusi kredit, lihat kode Python di sini. Skrip meminta Anda untuk bertindak sebagai juri dan menyertakan daftar lengkap yang dihasilkan AI (dan dihasilkan manusia) beberapa pra-termasuk dalam kode. Mekanisme ini mengidentifikasi kombinasi linier yang paling cocok untuk daftar lengkap jawaban juri. Dalam hal ini, kombinasi yang menang adalah 0,199 * jawaban Claude + 0,801 * jawaban Deepseek; Kombinasi ini lebih sesuai dengan jawaban juri daripada model tunggal mana pun. Koefisien ini juga akan menjadi hadiah bagi committer.
Dalam contoh "mengalahkan Sauron" ini, aspek "manusia sebagai kemudi" dimanifestasikan di dua tempat. Pertama, penilaian manusia berkualitas tinggi diterapkan pada setiap pertanyaan, meskipun ini masih menggunakan juri sebagai evaluator kinerja "teknokratis". Kedua, ada mekanisme pemungutan suara implisit yang memutuskan apakah "mengalahkan Sauron" adalah tujuan yang tepat (sebagai lawan dari, katakanlah, mencoba membentuk aliansi dengan Sauron, atau memberinya semua wilayah timur sungai kunci tertentu sebagai konsesi perdamaian). Ada kasus penggunaan suling lainnya dari penilaian manusia di mana tugas juri lebih langsung dilakukan dengan nilai-nilai: bayangkan, misalnya, platform media sosial terdesentralisasi (atau sub-komunitas) di mana tugas juri adalah menandai posting forum yang dipilih secara acak sebagai mematuhi atau tidak mengikuti aturan komunitas.
Dalam paradigma penilaian manusia yang menguap, ada beberapa variabel terbuka:
Bagaimana pengambilan sampel dilakukan? Peran pengirim daftar lengkap adalah memberikan sejumlah besar jawaban; Peran juri adalah memberikan jawaban berkualitas tinggi. Kita perlu memilih juri sedemikian rupa sehingga kemampuan model untuk mencocokkan jawaban juri adalah indikasi terbesar dari kinerja keseluruhannya. Beberapa pertimbangan meliputi:
Trade-off keahlian versus bias: Juri yang terampil sering mengkhususkan diri dalam bidang keahlian mereka, jadi biarkan mereka memilih apa yang akan dinilai, dan Anda akan mendapatkan masukan berkualitas lebih tinggi. Di sisi lain, terlalu banyak pilihan dapat menyebabkan bias (juri menyukai konten dari orang-orang yang mereka asosiasikan) atau kelemahan dalam pengambilan sampel (beberapa konten secara sistematis tidak dinilai)
Anti-Goodhart: Akan ada konten yang mencoba "bermain" dengan mekanik AI, misalnya, di mana kontributor menghasilkan banyak kode yang terlihat mengesankan tetapi tidak berguna. Ini berarti bahwa juri dapat mendeteksi ini, tetapi model AI statis tidak akan melakukannya kecuali mereka berusaha keras. Salah satu cara yang mungkin untuk menangkap perilaku ini adalah dengan menambahkan mekanisme tantangan di mana individu dapat menandai upaya tersebut, menjamin penilaian juri pada mereka (dan dengan demikian memberi insentif kepada pengembang AI untuk memastikan bahwa mereka ditangkap dengan benar). Jika juri setuju, pelapor akan diberi hadiah, dan jika juri tidak setuju, denda akan dibayarkan.
Fungsi penilaian apa yang Anda gunakan? Satu ide yang digunakan dalam pilot Deep Grant saat ini adalah bertanya kepada juri, "Haruskah A atau B mendapatkan lebih banyak kredit, dan berapa banyak?" Fungsi penilaian adalah score(x) = sum((log(x[B]) - log(x[A]) - log(juror_ratio)) ** 2 untuk (A, B, juri \ _ratio) di juri \ _answers): Artinya, untuk setiap jawaban juri, ia menanyakan seberapa jauh tingkat dalam daftar lengkap dari tingkat yang diberikan oleh juri dan menambahkan penalti sebanding dengan kuadrat jarak (dalam ruang logaritmik). Ini untuk menunjukkan bahwa ada banyak ruang desain untuk fungsi penilaian, dan pilihan fungsi penilaian terkait dengan pilihan pertanyaan mana yang akan diajukan kepada juri Anda.
Bagaimana Anda memberi penghargaan kepada penyerahkan daftar lengkap? Idealnya, Anda ingin memberi beberapa peserta hadiah non-nol secara teratur untuk menghindari mekanisme monopoli, tetapi Anda juga ingin memenuhi atribut berikut: peserta tidak dapat meningkatkan hadiah dengan mengirimkan beberapa kali kumpulan jawaban yang sama (atau sedikit dimodifikasi). Metode yang menjanjikan adalah dengan menghitung kombinasi linier dari daftar lengkap yang paling cocok dengan jawaban juri (koefisien non-negatif dan jumlahnya 1), dan menggunakan koefisien yang sama untuk membagi hadiah. Mungkin ada metode lain.
Secara keseluruhan, tujuannya adalah mengadopsi mekanisme penilaian manusia yang terbukti efektif, minim bias, dan telah teruji waktu (misalnya, bayangkan struktur konfrontasi sistem pengadilan di mana dua pihak yang berselisih memiliki banyak informasi tetapi bias, sementara hakim memiliki sedikit informasi tetapi mungkin tidak memihak), dan menggunakan pasar kecerdasan buatan terbuka sebagai indikator prediksi yang masuk akal, tinggi dalam ketepatan, dan biaya sangat rendah untuk mekanisme tersebut (ini mirip dengan cara kerja model prediksi besar 'distilasi').
Pendanaan Mendalam
Pembiayaan mendalam adalah menerapkan penilaian distilasi manusia untuk mengisi pertanyaan "Berapa persentase kredit X milik Y?" Masalah pembobotan di bagian atas grafik.
Cara termudah untuk melakukannya adalah dengan mengilustrasikannya secara langsung dengan sebuah contoh:
Output contoh pendanaan kedalaman dua tingkat: Asal usul pemikiran Ethereum. Silakan lihat kode Python di sini.
Tujuan di sini adalah untuk mengakui kontribusi filosofis terhadap Ethereum. Mari kita lihat contoh:
Simulasi tingkat pendanaan mendalam yang ditampilkan di sini memberikan 20,5% kredit kepada gerakan kripto-punk, dan 9,2% kepada progresivisme teknologi.
Di setiap simpul, Anda mengajukan pertanyaan: sejauh mana itu merupakan kontribusi asli (dan karena itu layak mendapat kredit untuk dirinya sendiri), dan sejauh mana itu merupakan rekombinasi dari pengaruh hulu lainnya? Untuk gerakan cypherpunk, ini 40% baru dan 60% tergantung.
Kemudian, Anda dapat melihat dampak dari aliran ini: liberalisme kecil pemerintahan dan anarkisme telah memenangkan 17,3% dukungan untuk gerakan cypherpunk, tetapi demokrasi langsung Swiss hanya mendapatkan 5%.
Perhatikan, bagaimanapun, bahwa pemerintahan kecil liberal dan anarkisme juga mengilhami filosofi moneter Bitcoin, sehingga mempengaruhi filosofi Ethereum dalam dua cara.
Untuk menghitung kontribusi total libertarianisme kecil-kemerdekaan dan anarkisme terhadap Ethereum, Anda perlu mengalikan setiap tepi di setiap jalur, kemudian menambahkan jalur tersebut: 0.205 * 0.6 * 0.173 + 0.195 * 0.648 * 0.201 ~= 0.0466. Oleh karena itu, jika Anda harus menyumbang $100 untuk memberikan penghargaan kepada semua orang yang berkontribusi pada filsafat Ethereum, berdasarkan putaran pendanaan simulasi ini, penganut libertarianisme kecil-kemerdekaan dan anarkisme akan menerima $4.66.
Metode ini bertujuan untuk diterapkan dalam bidang-bidang di mana orang bekerja di atas dasar pekerjaan sebelumnya dan strukturnya sangat jelas. Dunia akademis (pikirkan: mengutip gambar) dan perangkat lunak sumber terbuka (pikirkan: dependensi pustaka dan fork) adalah dua contoh alami.
Tujuan dari sistem pendanaan mendalam yang berfungsi dengan baik adalah untuk membuat dan memelihara grafik global di mana setiap penyandang dana yang tertarik untuk mendukung proyek tertentu akan dapat mengirim dana ke alamat yang mewakili node tersebut, dan dana tersebut akan secara otomatis menyebar ke dependensi mereka (dan rekursi ke dependensi mereka, dll.) berdasarkan bobot tepi grafik.
Anda dapat membayangkan protokol terdesentralisasi yang menggunakan perangkat pendanaan dalam bawaan untuk mengeluarkan tokennya: tata kelola terdesentralisasi dalam protokol akan memilih juri, yang akan menjalankan mekanisme pendanaan dalam, karena protokol secara otomatis mengeluarkan token dan menyimpannya ke node yang sesuai dengan dirinya sendiri. Dengan demikian, protokol secara terprogram memberi penghargaan kepada semua kontributor langsung dan tidak langsungnya, mengingatkan pada bagaimana imbalan blok Bitcoin atau Ethereum memberi penghargaan kepada satu jenis kontributor tertentu (penambang). Dengan mempengaruhi bobot tepi, juri dapat terus-menerus menentukan jenis kontribusi yang dihargainya. Mekanisme ini dapat berfungsi sebagai alternatif berkelanjutan yang terdesentralisasi dan jangka panjang untuk penambangan, penjualan, atau airdrop satu kali.
Peningkatan privasi
Secara umum, untuk membuat penilaian yang tepat tentang pertanyaan dalam contoh di atas, Anda harus memiliki akses ke informasi pribadi: log obrolan internal organisasi Anda, pesan yang dikirim secara diam-diam oleh anggota komunitas, dan sebagainya. Salah satu manfaat menggunakan hanya satu AI, terutama di lingkungan yang lebih kecil, adalah lebih dapat diterima bagi satu AI untuk mengakses informasi daripada mengeksposnya kepada semua orang.
Agar penilaian manusia distilasi atau pendanaan mendalam untuk bekerja dalam kasus ini, kita dapat mencoba menggunakan kriptografi untuk memberikan akses AI ke informasi pribadi dengan aman. Idenya adalah menggunakan (MPC) komputasi multi-pihak, (FHE) enkripsi homomorfik sepenuhnya, (TEE) lingkungan eksekusi tepercaya, atau mekanisme serupa untuk memberikan informasi pribadi, tetapi hanya jika satu-satunya outputnya adalah "komit daftar lengkap" yang langsung masuk ke mekanik.
Jika Anda melakukannya, maka Anda harus membatasi serangkaian mekanisme untuk model AI (bukan manusia atau kombinasi AI + manusia, karena Anda tidak dapat membuat manusia melihat data) dan khusus untuk model yang berjalan pada beberapa substrat tertentu (misalnya, MPC, FHE, perangkat keras tepercaya). Salah satu arah penelitian utama adalah menemukan versi praktis yang efektif dan cukup bermakna dalam waktu dekat.
Keuntungan desain mesin + setir
Ada banyak manfaat yang menjanjikan untuk desain semacam itu. Sejauh ini manfaat yang paling penting adalah bahwa mereka memungkinkan DAO untuk dibangun, memberikan pemilih manusia mengontrol arah, tetapi mereka tidak akan macet oleh terlalu banyak keputusan. Mereka mencapai kompromi di mana setiap orang tidak harus membuat keputusan N, tetapi mereka memiliki kekuatan untuk melampaui hanya membuat keputusan (bagaimana delegasi biasanya bekerja) dan lebih memperoleh preferensi kaya yang sulit untuk diungkapkan secara langsung.
Selain itu, mekanisme seperti itu tampaknya memiliki karakteristik pemulusan insentif. Yang saya maksud dengan "perataan insentif" di sini adalah kombinasi dari dua faktor:
Difusi: Setiap tindakan tunggal yang diambil oleh mekanisme pemungutan suara tidak akan berdampak berlebihan pada kepentingan peserta tunggal.
Kekacauan: Hubungan antara keputusan pemungutan suara dan bagaimana mereka memengaruhi kepentingan peserta menjadi lebih kompleks dan sulit dihitung.
Istilah kebingungan dan difusi di sini diambil dari kriptografi, yang merupakan sifat kunci dari keamanan fungsi kriptografi dan hash.
Contoh bagus dari insentif yang halus di dunia nyata saat ini adalah aturan hukum: Pihak pemerintah tidak secara berkala mengambil tindakan dalam bentuk 'memberikan 2 miliar dolar AS kepada perusahaan Alice', 'menghukum perusahaan Bob dengan denda 1 miliar dolar AS', tetapi melalui aturan yang dirancang untuk diterapkan secara merata pada sejumlah besar peserta, dan kemudian diinterpretasikan oleh peserta lain. Ketika pendekatan ini berhasil, manfaatnya adalah mengurangi korupsi dan bentuk-bentuk suap secara signifikan. Namun, ketika aturan ini dilanggar (yang sering terjadi dalam praktik), masalah ini segera menjadi sangat besar.
AI jelas akan menjadi bagian penting di masa depan, dan ini akan menjadi bagian penting dari tata kelola di masa depan. Namun, jika Anda melibatkan AI dalam tata kelola, ini memiliki risiko yang jelas: AI memiliki bias, mungkin disengaja dihancurkan selama proses pelatihan, dan perkembangan teknologi AI begitu cepat sehingga 'membiarkan AI berkuasa' mungkin pada kenyataannya berarti 'membiarkan orang yang bertanggung jawab atas peningkatan AI berkuasa'. Distilasi penilaian manusia menyediakan jalan alternatif untuk maju, memungkinkan kita untuk menggunakan kekuatan AI secara terbuka di pasar bebas, sambil tetap mempertahankan kendali demokratis manusia.
Terima kasih khusus kepada Devansh Mehta, Davide Crapis, dan Julian Zawistowski atas umpan balik dan peninjauan, serta diskusi dengan Tina Zhen, Shaw Walters, dan orang lain.
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
Vitalik's New Article: Paradigma Baru Pengaturan di Masa Depan 'Mesin AI + Kemudi Manusia'
Judul asli: "AI sebagai mesin, manusia sebagai setir"
Menulis: Vitalik, pendiri Ethereum
Compile: Bai Shui, Golden Finance
Jika Anda bertanya kepada orang-orang aspek apa dari struktur demokrasi yang mereka sukai, apakah itu pemerintah, tempat kerja, atau DAO berbasis blockchain, Anda akan sering mendengar argumen yang sama: mereka menghindari konsentrasi kekuasaan, mereka memberi pengguna jaminan kuat bahwa tidak ada yang dapat sepenuhnya mengubah arah sistem sesuka hati, dan mereka dapat membuat keputusan berkualitas lebih tinggi dengan mengumpulkan pandangan dan kebijaksanaan banyak orang.
Jika Anda bertanya kepada orang-orang tentang aspek-aspek mana dari struktur demokrasi yang tidak disukai mereka, mereka sering memberikan keluhan yang sama: pemilih biasa kurang terlatih karena setiap pemilih hanya memiliki peluang kecil untuk memengaruhi hasil, sedikit pemilih yang berpikir secara berkualitas tinggi dalam pengambilan keputusan, dan Anda sering mendapatkan partisipasi rendah (membuat sistem rentan terhadap serangan) atau sebenarnya terpusat, karena setiap orang secara default mempercayai dan menggandakan pandangan dari orang-orang berpengaruh.
Tujuan artikel ini adalah untuk mengeksplorasi paradigma yang mungkin dapat menggunakan KI untuk mendapatkan manfaat dari struktur demokratis tanpa dampak negatif. 'KI adalah mesin, manusia adalah setir'. Manusia hanya memberikan sedikit informasi ke sistem, mungkin hanya beberapa ratus, tetapi semuanya dipertimbangkan secara matang dan berkualitas tinggi. KI menganggap data ini sebagai 'fungsi tujuan' dan membuat sejumlah besar keputusan tanpa lelah, berupaya untuk mencapai tujuan tersebut. Secara khusus, artikel ini akan membahas pertanyaan menarik: apakah kita dapat melakukannya tanpa menempatkan satu KI tunggal di pusatnya, tetapi bergantung pada pasar terbuka kompetitif di mana setiap KI (atau hibrida manusia-mesin) dapat berpartisipasi secara bebas?
Daftar
Mengapa tidak membiarkan AI mengambil alih langsung?
Futarchy
Memurnikan daya penilaian manusia
Pendanaan mendalam
Menambahkan privasi
Keuntungan dari desain mesin + kemudi
Mengapa tidak membiarkan AI bertanggung jawab secara langsung?
Cara termudah untuk memasukkan preferensi manusia ke dalam mekanisme berbasis AI adalah dengan membuat model AI dan meminta manusia entah bagaimana memasukkan preferensi mereka ke dalamnya. Ada cara mudah untuk melakukan ini: Anda cukup memasukkan file teks yang berisi daftar instruksi orang ke dalam prompt sistem. Anda kemudian dapat menggunakan salah satu dari banyak "kerangka kerja AI proxy" untuk memberikan akses AI ke internet, memberikannya kunci ke aset organisasi dan profil media sosial Anda, dan selesai.
Setelah beberapa iterasi, ini mungkin cukup untuk banyak kasus penggunaan, dan saya sepenuhnya berharap bahwa dalam waktu dekat kita akan melihat banyak struktur yang melibatkan instruksi membaca AI yang diberikan oleh grup (atau bahkan membaca obrolan grup secara real time) dan mengambil tindakan.
Struktur ini tidak ideal sebagai mekanisme tata kelola sebagai lembaga jangka panjang. Atribut berharga yang harus dimiliki lembaga jangka panjang adalah kredibilitas dan netralitas. Dalam posting saya memperkenalkan konsep ini, saya mencantumkan empat atribut berharga netralitas yang kredibel:
Jangan menuliskan orang atau hasil tertentu ke dalam mekanisme
Open source dan dapat diverifikasi secara publik
Menjaga kesederhanaan
Jangan sering mengubah
LLM (atau agen AI) memenuhi 0/4. Model ini pasti mengkodekan sejumlah besar orang tertentu dan preferensi hasil selama pelatihannya. Kadang-kadang ini mengarah pada arah preferensi AI yang mengejutkan, misalnya, melihat sebuah studi baru-baru ini yang menunjukkan bahwa LLM utama menghargai kehidupan di Pakistan lebih dari kehidupan di Amerika Serikat (!!). )。 Ini bisa berbobot terbuka, tetapi itu jauh dari open source; Kami tidak benar-benar tahu iblis apa yang bersembunyi di kedalaman model. Ini kebalikan dari sederhana: kompleksitas Kolmogorov dari LLM adalah puluhan miliar bit, kira-kira setara dengan semua undang-undang AS (federal + negara bagian + lokal) digabungkan. Dan karena AI berkembang sangat cepat, Anda harus mengubahnya setiap tiga bulan.
Untuk alasan ini, saya mendukung pendekatan lain yang dieksplorasi dalam banyak kasus penggunaan, yaitu membuat mekanisme sederhana menjadi aturan permainan, di mana AI menjadi pemain. Itulah wawasan yang membuat pasar begitu efisien: aturan adalah sistem hak milik yang relatif bodoh, kasus marginal diputuskan oleh sistem pengadilan yang lambat dalam mengakumulasi dan menyesuaikan preseden, sementara semua informasi berasal dari pengusaha yang beroperasi 'di pinggiran'.
Seorang "pemain game" tunggal bisa menjadi LLM, kelompok LLM yang berinteraksi satu sama lain dan memanggil berbagai layanan internet, berbagai kombinasi AI + manusia, dan banyak konstruksi lainnya; sebagai perancang mekanisme, Anda tidak perlu tahu. Tujuan idealnya adalah memiliki mekanisme yang bisa berjalan secara otomatis - jika tujuan mekanisme itu adalah memilih apa yang akan didanai, maka seharusnya sebisa mungkin seperti imbalan blok Bitcoin atau Ethereum.
Keuntungan dari metode ini adalah:
Ini menghindari memasukkan model tunggal apa pun ke dalam mekanisme; sebaliknya, Anda akan mendapatkan pasar terbuka yang terdiri dari banyak peserta dan arsitektur yang berbeda, masing-masing dengan biasnya sendiri. Model terbuka, model tertutup, agen kolektif, manusia + AI campuran, robot, monyet tak terbatas, semuanya adil; mekanisme ini tidak akan mendiskriminasi siapa pun.
Mekanisme ini adalah sumber terbuka. Meskipun pemain tidak, tapi permainan adalah sumber terbuka - dan ini adalah pola yang telah cukup dipahami (misalnya, partai politik dan pasar beroperasi dengan cara ini)
Mekanismenya sederhana, sehingga ada relatif sedikit jalan bagi perancang mekanisme untuk mengkodekan bias mereka sendiri ke dalam desain
Mekanisme ini tidak akan berubah, bahkan dari sekarang hingga titik aneh, arsitektur peserta inti perlu diredesain setiap tiga bulan sekali.
Tujuan dari mekanisme bimbingan adalah untuk secara setia mencerminkan tujuan mendasar peserta. Ini hanya memerlukan sedikit informasi, namun harus berkualitas tinggi.
Anda dapat menganggap mekanisme ini memanfaatkan ketidaksimetrisan antara penyajian jawaban dan verifikasi jawaban. Ini mirip dengan Sudoku yang sulit untuk dipecahkan, tetapi sangat mudah untuk memverifikasi apakah solusinya benar. Anda (i) membuat pasar terbuka, membiarkan pemain bertindak sebagai 'solver', dan kemudian (ii) menjaga mekanisme yang dijalankan oleh manusia untuk menjalankan tugas verifikasi solusi yang diajukan jauh lebih sederhana.
Futarchy
Futarchy awalnya diusulkan oleh Robin Hanson, yang berarti 'bertaruh pada nilai, tetapi bertaruh pada keyakinan'. Mekanisme pemungutan suara memilih serangkaian tujuan (bisa berupa tujuan apa pun, asalkan dapat diukur), kemudian menggabungkannya menjadi ukuran M. Ketika Anda perlu membuat keputusan (untuk kesederhanaan, kita anggap itu adalah YA/TIDAK), Anda akan membuat pasar berjangka: Anda meminta orang bertaruh (i) apakah akan memilih YA atau TIDAK, (ii) jika memilih YA, maka nilai M, jika tidak nol, (iii) jika memilih TIDAK, maka nilai M, jika tidak nol. Dengan tiga variabel ini, Anda dapat menentukan apakah pasar menganggap YA atau TIDAK lebih menguntungkan bagi nilai M.
"Harga saham perusahaan" (atau, dalam kasus cryptocurrency, harga token) adalah metrik yang paling sering dikutip karena mudah dipahami dan diukur, tetapi mekanismenya dapat mendukung berbagai metrik: pengguna aktif bulanan, median kebahagiaan yang dilaporkan sendiri untuk kelompok tertentu, beberapa metrik desentralisasi yang dapat diukur, dll.
Futarchy awalnya ditemukan sebelum era kecerdasan buatan. Namun, Futarchy secara alami sesuai dengan paradigma 'penyelesaian kompleks, validasi sederhana' yang dijelaskan di bagian sebelumnya, dan para pedagang dalam Futarchy juga bisa menjadi kecerdasan buatan (atau kombinasi manusia + kecerdasan buatan). Peran 'penyelesaian' (pedagang pasar prediksi) adalah menentukan bagaimana setiap rencana dalam setiap proposal akan mempengaruhi nilai indikator di masa depan. Ini sulit. Jika penyelesaian benar, mereka akan menghasilkan uang, jika tidak, mereka akan kehilangan uang. Validasi (orang yang memberikan suara pada indikator, yang jika mereka menyadari indikator dimanipulasi atau menjadi usang, akan menyesuaikan indikator, dan menentukan nilai aktual indikator pada waktu tertentu di masa depan) hanya perlu menjawab pertanyaan yang lebih sederhana 'berapa nilai indikator saat ini?'
Menyaring penilaian manusia
Distilasi manusia adalah jenis mekanisme yang bekerja seperti berikut. Ada sejumlah besar (bayangkan: 100 万个) pertanyaan yang perlu dijawab. Contoh alami termasuk:
Seberapa banyak penghargaan yang harus diterima oleh setiap orang dalam daftar ini untuk kontribusi terhadap suatu proyek atau tugas?
Manakah dari komentar ini yang melanggar aturan platform media sosial (atau sub-komunitas)?
Manakah dari alamat Ethereum yang diberikan mewakili orang yang sebenarnya dan unik?
Manakah dari objek-objek fisik ini yang memberikan kontribusi positif atau negatif terhadap estetika lingkungannya?
Anda memiliki tim yang dapat menjawab pertanyaan-pertanyaan ini, tetapi dengan biaya yang membutuhkan banyak energi untuk setiap jawaban. Anda hanya meminta tim menjawab sedikit pertanyaan (misalnya, jika ada 1 juta item dalam daftar total, tim mungkin hanya akan menjawab 100 item). Anda bahkan dapat mengajukan pertanyaan secara tidak langsung kepada tim: jangan bertanya 'Berapa persen total kredit yang seharusnya diterima oleh Alice?', tetapi tanyakan 'Apakah Alice atau Bob seharusnya menerima lebih banyak kredit, dan seberapa banyak lipatannya?'. Saat merancang mekanisme juri, Anda dapat menggunakan kembali mekanisme yang telah terbukti dalam dunia nyata, seperti komite alokasi dana, pengadilan (menentukan nilai putusan), evaluasi, dan tentu saja, peserta juri juga dapat menggunakan alat penelitian kecerdasan buatan yang inovatif untuk membantu mereka menemukan jawaban.
Anda kemudian mengizinkan siapa pun untuk mengirimkan daftar jawaban numerik ke seluruh rangkaian pertanyaan (misalnya, memberikan perkiraan berapa banyak kredit yang harus diterima setiap peserta untuk seluruh daftar). Peserta didorong untuk menggunakan kecerdasan buatan untuk menyelesaikan tugas ini, tetapi mereka dapat menggunakan teknologi apa pun: kecerdasan buatan, hibrida manusia-mesin, kecerdasan buatan yang memiliki akses ke pencarian internet dan mampu secara mandiri mempekerjakan manusia lain atau pekerja kecerdasan buatan, monyet yang ditingkatkan secara cybernetic, dll.
Setelah penyedia daftar lengkap dan juri mengirimkan jawabannya, daftar lengkap akan diperiksa berdasarkan jawaban juri, dan beberapa kombinasi dari daftar lengkap yang paling kompatibel dengan jawaban juri akan diambil sebagai jawaban akhir.
Mekanisme penilaian manusia yang distilasi berbeda dengan futarki, tetapi memiliki beberapa kesamaan penting:
Dalam futarki, 'solver' akan membuat prediksi, dan 'data real' yang menjadi dasar prediksi mereka (untuk memberi imbalan atau hukuman pada solver) adalah oracle yang mengeluarkan nilai indikator, dijalankan oleh juri.
Dalam penilaian manusia yang distilasi, 'Solver' akan memberikan jawaban untuk sejumlah besar pertanyaan, dan 'data real' yang menjadi dasar prediksi mereka adalah sebagian kecil jawaban berkualitas tinggi dari juri pada pertanyaan-pertanyaan ini.
Contoh mainan untuk menyaring penilaian manusia untuk distribusi kredit, lihat kode Python di sini. Skrip meminta Anda untuk bertindak sebagai juri dan menyertakan daftar lengkap yang dihasilkan AI (dan dihasilkan manusia) beberapa pra-termasuk dalam kode. Mekanisme ini mengidentifikasi kombinasi linier yang paling cocok untuk daftar lengkap jawaban juri. Dalam hal ini, kombinasi yang menang adalah 0,199 * jawaban Claude + 0,801 * jawaban Deepseek; Kombinasi ini lebih sesuai dengan jawaban juri daripada model tunggal mana pun. Koefisien ini juga akan menjadi hadiah bagi committer.
Dalam contoh "mengalahkan Sauron" ini, aspek "manusia sebagai kemudi" dimanifestasikan di dua tempat. Pertama, penilaian manusia berkualitas tinggi diterapkan pada setiap pertanyaan, meskipun ini masih menggunakan juri sebagai evaluator kinerja "teknokratis". Kedua, ada mekanisme pemungutan suara implisit yang memutuskan apakah "mengalahkan Sauron" adalah tujuan yang tepat (sebagai lawan dari, katakanlah, mencoba membentuk aliansi dengan Sauron, atau memberinya semua wilayah timur sungai kunci tertentu sebagai konsesi perdamaian). Ada kasus penggunaan suling lainnya dari penilaian manusia di mana tugas juri lebih langsung dilakukan dengan nilai-nilai: bayangkan, misalnya, platform media sosial terdesentralisasi (atau sub-komunitas) di mana tugas juri adalah menandai posting forum yang dipilih secara acak sebagai mematuhi atau tidak mengikuti aturan komunitas.
Dalam paradigma penilaian manusia yang menguap, ada beberapa variabel terbuka:
Bagaimana pengambilan sampel dilakukan? Peran pengirim daftar lengkap adalah memberikan sejumlah besar jawaban; Peran juri adalah memberikan jawaban berkualitas tinggi. Kita perlu memilih juri sedemikian rupa sehingga kemampuan model untuk mencocokkan jawaban juri adalah indikasi terbesar dari kinerja keseluruhannya. Beberapa pertimbangan meliputi:
Trade-off keahlian versus bias: Juri yang terampil sering mengkhususkan diri dalam bidang keahlian mereka, jadi biarkan mereka memilih apa yang akan dinilai, dan Anda akan mendapatkan masukan berkualitas lebih tinggi. Di sisi lain, terlalu banyak pilihan dapat menyebabkan bias (juri menyukai konten dari orang-orang yang mereka asosiasikan) atau kelemahan dalam pengambilan sampel (beberapa konten secara sistematis tidak dinilai)
Anti-Goodhart: Akan ada konten yang mencoba "bermain" dengan mekanik AI, misalnya, di mana kontributor menghasilkan banyak kode yang terlihat mengesankan tetapi tidak berguna. Ini berarti bahwa juri dapat mendeteksi ini, tetapi model AI statis tidak akan melakukannya kecuali mereka berusaha keras. Salah satu cara yang mungkin untuk menangkap perilaku ini adalah dengan menambahkan mekanisme tantangan di mana individu dapat menandai upaya tersebut, menjamin penilaian juri pada mereka (dan dengan demikian memberi insentif kepada pengembang AI untuk memastikan bahwa mereka ditangkap dengan benar). Jika juri setuju, pelapor akan diberi hadiah, dan jika juri tidak setuju, denda akan dibayarkan.
Fungsi penilaian apa yang Anda gunakan? Satu ide yang digunakan dalam pilot Deep Grant saat ini adalah bertanya kepada juri, "Haruskah A atau B mendapatkan lebih banyak kredit, dan berapa banyak?" Fungsi penilaian adalah score(x) = sum((log(x[B]) - log(x[A]) - log(juror_ratio)) ** 2 untuk (A, B, juri \ _ratio) di juri \ _answers): Artinya, untuk setiap jawaban juri, ia menanyakan seberapa jauh tingkat dalam daftar lengkap dari tingkat yang diberikan oleh juri dan menambahkan penalti sebanding dengan kuadrat jarak (dalam ruang logaritmik). Ini untuk menunjukkan bahwa ada banyak ruang desain untuk fungsi penilaian, dan pilihan fungsi penilaian terkait dengan pilihan pertanyaan mana yang akan diajukan kepada juri Anda.
Bagaimana Anda memberi penghargaan kepada penyerahkan daftar lengkap? Idealnya, Anda ingin memberi beberapa peserta hadiah non-nol secara teratur untuk menghindari mekanisme monopoli, tetapi Anda juga ingin memenuhi atribut berikut: peserta tidak dapat meningkatkan hadiah dengan mengirimkan beberapa kali kumpulan jawaban yang sama (atau sedikit dimodifikasi). Metode yang menjanjikan adalah dengan menghitung kombinasi linier dari daftar lengkap yang paling cocok dengan jawaban juri (koefisien non-negatif dan jumlahnya 1), dan menggunakan koefisien yang sama untuk membagi hadiah. Mungkin ada metode lain.
Secara keseluruhan, tujuannya adalah mengadopsi mekanisme penilaian manusia yang terbukti efektif, minim bias, dan telah teruji waktu (misalnya, bayangkan struktur konfrontasi sistem pengadilan di mana dua pihak yang berselisih memiliki banyak informasi tetapi bias, sementara hakim memiliki sedikit informasi tetapi mungkin tidak memihak), dan menggunakan pasar kecerdasan buatan terbuka sebagai indikator prediksi yang masuk akal, tinggi dalam ketepatan, dan biaya sangat rendah untuk mekanisme tersebut (ini mirip dengan cara kerja model prediksi besar 'distilasi').
Pendanaan Mendalam
Pembiayaan mendalam adalah menerapkan penilaian distilasi manusia untuk mengisi pertanyaan "Berapa persentase kredit X milik Y?" Masalah pembobotan di bagian atas grafik.
Cara termudah untuk melakukannya adalah dengan mengilustrasikannya secara langsung dengan sebuah contoh:
Output contoh pendanaan kedalaman dua tingkat: Asal usul pemikiran Ethereum. Silakan lihat kode Python di sini.
Tujuan di sini adalah untuk mengakui kontribusi filosofis terhadap Ethereum. Mari kita lihat contoh:
Simulasi tingkat pendanaan mendalam yang ditampilkan di sini memberikan 20,5% kredit kepada gerakan kripto-punk, dan 9,2% kepada progresivisme teknologi.
Di setiap simpul, Anda mengajukan pertanyaan: sejauh mana itu merupakan kontribusi asli (dan karena itu layak mendapat kredit untuk dirinya sendiri), dan sejauh mana itu merupakan rekombinasi dari pengaruh hulu lainnya? Untuk gerakan cypherpunk, ini 40% baru dan 60% tergantung.
Kemudian, Anda dapat melihat dampak dari aliran ini: liberalisme kecil pemerintahan dan anarkisme telah memenangkan 17,3% dukungan untuk gerakan cypherpunk, tetapi demokrasi langsung Swiss hanya mendapatkan 5%.
Perhatikan, bagaimanapun, bahwa pemerintahan kecil liberal dan anarkisme juga mengilhami filosofi moneter Bitcoin, sehingga mempengaruhi filosofi Ethereum dalam dua cara.
Untuk menghitung kontribusi total libertarianisme kecil-kemerdekaan dan anarkisme terhadap Ethereum, Anda perlu mengalikan setiap tepi di setiap jalur, kemudian menambahkan jalur tersebut: 0.205 * 0.6 * 0.173 + 0.195 * 0.648 * 0.201 ~= 0.0466. Oleh karena itu, jika Anda harus menyumbang $100 untuk memberikan penghargaan kepada semua orang yang berkontribusi pada filsafat Ethereum, berdasarkan putaran pendanaan simulasi ini, penganut libertarianisme kecil-kemerdekaan dan anarkisme akan menerima $4.66.
Metode ini bertujuan untuk diterapkan dalam bidang-bidang di mana orang bekerja di atas dasar pekerjaan sebelumnya dan strukturnya sangat jelas. Dunia akademis (pikirkan: mengutip gambar) dan perangkat lunak sumber terbuka (pikirkan: dependensi pustaka dan fork) adalah dua contoh alami.
Tujuan dari sistem pendanaan mendalam yang berfungsi dengan baik adalah untuk membuat dan memelihara grafik global di mana setiap penyandang dana yang tertarik untuk mendukung proyek tertentu akan dapat mengirim dana ke alamat yang mewakili node tersebut, dan dana tersebut akan secara otomatis menyebar ke dependensi mereka (dan rekursi ke dependensi mereka, dll.) berdasarkan bobot tepi grafik.
Anda dapat membayangkan protokol terdesentralisasi yang menggunakan perangkat pendanaan dalam bawaan untuk mengeluarkan tokennya: tata kelola terdesentralisasi dalam protokol akan memilih juri, yang akan menjalankan mekanisme pendanaan dalam, karena protokol secara otomatis mengeluarkan token dan menyimpannya ke node yang sesuai dengan dirinya sendiri. Dengan demikian, protokol secara terprogram memberi penghargaan kepada semua kontributor langsung dan tidak langsungnya, mengingatkan pada bagaimana imbalan blok Bitcoin atau Ethereum memberi penghargaan kepada satu jenis kontributor tertentu (penambang). Dengan mempengaruhi bobot tepi, juri dapat terus-menerus menentukan jenis kontribusi yang dihargainya. Mekanisme ini dapat berfungsi sebagai alternatif berkelanjutan yang terdesentralisasi dan jangka panjang untuk penambangan, penjualan, atau airdrop satu kali.
Peningkatan privasi
Secara umum, untuk membuat penilaian yang tepat tentang pertanyaan dalam contoh di atas, Anda harus memiliki akses ke informasi pribadi: log obrolan internal organisasi Anda, pesan yang dikirim secara diam-diam oleh anggota komunitas, dan sebagainya. Salah satu manfaat menggunakan hanya satu AI, terutama di lingkungan yang lebih kecil, adalah lebih dapat diterima bagi satu AI untuk mengakses informasi daripada mengeksposnya kepada semua orang.
Agar penilaian manusia distilasi atau pendanaan mendalam untuk bekerja dalam kasus ini, kita dapat mencoba menggunakan kriptografi untuk memberikan akses AI ke informasi pribadi dengan aman. Idenya adalah menggunakan (MPC) komputasi multi-pihak, (FHE) enkripsi homomorfik sepenuhnya, (TEE) lingkungan eksekusi tepercaya, atau mekanisme serupa untuk memberikan informasi pribadi, tetapi hanya jika satu-satunya outputnya adalah "komit daftar lengkap" yang langsung masuk ke mekanik.
Jika Anda melakukannya, maka Anda harus membatasi serangkaian mekanisme untuk model AI (bukan manusia atau kombinasi AI + manusia, karena Anda tidak dapat membuat manusia melihat data) dan khusus untuk model yang berjalan pada beberapa substrat tertentu (misalnya, MPC, FHE, perangkat keras tepercaya). Salah satu arah penelitian utama adalah menemukan versi praktis yang efektif dan cukup bermakna dalam waktu dekat.
Keuntungan desain mesin + setir
Ada banyak manfaat yang menjanjikan untuk desain semacam itu. Sejauh ini manfaat yang paling penting adalah bahwa mereka memungkinkan DAO untuk dibangun, memberikan pemilih manusia mengontrol arah, tetapi mereka tidak akan macet oleh terlalu banyak keputusan. Mereka mencapai kompromi di mana setiap orang tidak harus membuat keputusan N, tetapi mereka memiliki kekuatan untuk melampaui hanya membuat keputusan (bagaimana delegasi biasanya bekerja) dan lebih memperoleh preferensi kaya yang sulit untuk diungkapkan secara langsung.
Selain itu, mekanisme seperti itu tampaknya memiliki karakteristik pemulusan insentif. Yang saya maksud dengan "perataan insentif" di sini adalah kombinasi dari dua faktor:
Difusi: Setiap tindakan tunggal yang diambil oleh mekanisme pemungutan suara tidak akan berdampak berlebihan pada kepentingan peserta tunggal.
Kekacauan: Hubungan antara keputusan pemungutan suara dan bagaimana mereka memengaruhi kepentingan peserta menjadi lebih kompleks dan sulit dihitung.
Istilah kebingungan dan difusi di sini diambil dari kriptografi, yang merupakan sifat kunci dari keamanan fungsi kriptografi dan hash.
Contoh bagus dari insentif yang halus di dunia nyata saat ini adalah aturan hukum: Pihak pemerintah tidak secara berkala mengambil tindakan dalam bentuk 'memberikan 2 miliar dolar AS kepada perusahaan Alice', 'menghukum perusahaan Bob dengan denda 1 miliar dolar AS', tetapi melalui aturan yang dirancang untuk diterapkan secara merata pada sejumlah besar peserta, dan kemudian diinterpretasikan oleh peserta lain. Ketika pendekatan ini berhasil, manfaatnya adalah mengurangi korupsi dan bentuk-bentuk suap secara signifikan. Namun, ketika aturan ini dilanggar (yang sering terjadi dalam praktik), masalah ini segera menjadi sangat besar.
AI jelas akan menjadi bagian penting di masa depan, dan ini akan menjadi bagian penting dari tata kelola di masa depan. Namun, jika Anda melibatkan AI dalam tata kelola, ini memiliki risiko yang jelas: AI memiliki bias, mungkin disengaja dihancurkan selama proses pelatihan, dan perkembangan teknologi AI begitu cepat sehingga 'membiarkan AI berkuasa' mungkin pada kenyataannya berarti 'membiarkan orang yang bertanggung jawab atas peningkatan AI berkuasa'. Distilasi penilaian manusia menyediakan jalan alternatif untuk maju, memungkinkan kita untuk menggunakan kekuatan AI secara terbuka di pasar bebas, sambil tetap mempertahankan kendali demokratis manusia.
Terima kasih khusus kepada Devansh Mehta, Davide Crapis, dan Julian Zawistowski atas umpan balik dan peninjauan, serta diskusi dengan Tina Zhen, Shaw Walters, dan orang lain.