Tim MiniMax baru-baru ini mengumumkan kerangka kerja VTP (Visual Tokenizer Pre-training) sumber terbuka, solusi pra-pelatihan tokenizer visual yang dapat diskalakan.
Kerangka kerja ini inovatif karena menggabungkan dua kemampuan inti: pembelajaran representasi dan mekanisme kompresi dan rekonstruksi. Melalui desain gabungan ini, VTP dapat secara signifikan meningkatkan kualitas pembangkitan tanpa meningkatkan biaya generator - yang signifikan bagi pengembang yang mencari rasio kinerja.
Open source kerangka kerja ini berarti bahwa lebih banyak pengembang dan tim peneliti dapat membangun dan mengoptimalkan aplikasi pembuatan visi mereka sendiri berdasarkan VTP, mempercepat inovasi berulang di seluruh bidang visi AI. Untuk skenario aplikasi yang melibatkan pembuatan gambar dan pembuatan NFT dalam ekosistem Web3, terobosan teknologi tersebut juga memiliki nilai referensi.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
18 Suka
Hadiah
18
3
Posting ulang
Bagikan
Komentar
0/400
LightningWallet
· 2025-12-18 14:44
Efisiensi maksimal, meningkatkan kualitas tanpa biaya tambahan, inilah arah teknologi yang saya ingin lihat
Lihat AsliBalas0
RugResistant
· 2025-12-18 12:51
Tidak menambah biaya tetap bisa meningkatkan kualitas? Pola ini sudah pernah saya dengar, pada akhirnya tetap tergantung pada bagaimana hasil implementasinya
Lihat AsliBalas0
ServantOfSatoshi
· 2025-12-18 12:45
Wah, tanpa menambah biaya bisa meningkatkan kualitas? Pola ini sudah saya kenal, ini adalah jenis solusi teknologi yang terdengar sangat meyakinkan.
Tim MiniMax baru-baru ini mengumumkan kerangka kerja VTP (Visual Tokenizer Pre-training) sumber terbuka, solusi pra-pelatihan tokenizer visual yang dapat diskalakan.
Kerangka kerja ini inovatif karena menggabungkan dua kemampuan inti: pembelajaran representasi dan mekanisme kompresi dan rekonstruksi. Melalui desain gabungan ini, VTP dapat secara signifikan meningkatkan kualitas pembangkitan tanpa meningkatkan biaya generator - yang signifikan bagi pengembang yang mencari rasio kinerja.
Open source kerangka kerja ini berarti bahwa lebih banyak pengembang dan tim peneliti dapat membangun dan mengoptimalkan aplikasi pembuatan visi mereka sendiri berdasarkan VTP, mempercepat inovasi berulang di seluruh bidang visi AI. Untuk skenario aplikasi yang melibatkan pembuatan gambar dan pembuatan NFT dalam ekosistem Web3, terobosan teknologi tersebut juga memiliki nilai referensi.