Alibaba merilis generasi baru Model Dasar Qianwen 3.5, menduduki puncak sebagai model sumber terbuka terbesar dan terkuat di dunia

2026-02-23 07:48:20

Pada hari Tahun Baru Imlek tanggal 16 Februari, Alibaba merilis model besar generasi terbaru, Qwen3.5-Plus, secara open source, dengan performa yang sebanding dengan Gemini 3 Pro, dan menduduki puncak sebagai model open source terkuat di dunia.

Diketahui, Qwen3.5 merealisasikan inovasi menyeluruh dalam arsitektur model dasar. Versi Qwen3.5-Plus yang dirilis memiliki total parameter sebanyak 397 miliar, dengan aktivasi hanya 17 miliar, menunjukkan performa yang unggul dari model Qwen3-Max dengan parameter triliunan, serta penggunaan memori GPU yang turun 60%, dan peningkatan efisiensi inferensi secara signifikan, dengan throughput inferensi maksimal hingga 19 kali lipat. Harga API Qwen3.5-Plus per juta token hanya 0,8 yuan, hanya 1/18 dari Gemini 3 Pro.

Berbeda dari beberapa generasi model bahasa besar sebelumnya, Qwen3.5 berhasil melakukan lompatan generasi dari model teks murni menjadi model multimodal asli. Pretraining Qwen3 dilakukan pada token teks murni, sementara Qwen3.5 didasarkan pada token gabungan visual dan teks, serta menambahkan secara besar-besaran data dalam bahasa Inggris dan Mandarin, multibahasa, STEM, dan inferensi, sehingga model besar yang “bermata” ini mampu mempelajari pengetahuan dunia yang lebih padat dan logika inferensi yang kompleks. Dengan kurang dari 40% parameter, performa puncak dari basis model Qwen3-Max yang triliunan dapat dicapai, dan dalam berbagai evaluasi standar seperti inferensi, pemrograman, dan agen cerdas, menunjukkan performa yang sangat baik. Misalnya, Qwen3.5 meraih skor 87,8 dalam penilaian penalaran pengetahuan MMLU-Pro, melampaui GPT-5.2; mendapatkan 88,4 dalam ujian soal tingkat doktor GPQA, lebih tinggi dari Claude 4.5; mencetak rekor 76,5 dalam mengikuti instruksi di IFBench; dan dalam evaluasi agen umum BFCL-V4 serta agen pencarian Browsecomp, performa Qwen3.5 melampaui Gemini 3 Pro dan GPT-5.2.

Pelatihan multimodal asli juga membawa lonjakan kemampuan visual Qwen3.5: dalam berbagai evaluasi resmi seperti inferensi multimodal (MathVison), tanya jawab visual umum VQA (RealWorldQA), pengenalan teks dan pemahaman dokumen (CC_OCR), kecerdasan spasial (RefCOCO-avg), pemahaman video (MLVU), Qwen3.5 meraih performa terbaik. Dalam tugas pemecahan masalah akademik, perencanaan tugas, dan inferensi ruang fisik, Qwen3.5 menunjukkan performa lebih baik dibanding model khusus Qwen3-VL, dengan peningkatan besar dalam kemampuan penentuan posisi spasial dan inferensi berbasis gambar, serta analisis inferensi yang lebih halus dan akurat. Dalam pemahaman video, Qwen3.5 mendukung input video berdurasi hingga 2 jam (1 juta token konteks), cocok untuk analisis konten video panjang dan pembuatan ringkasan. Selain itu, Qwen3.5 menggabungkan pemahaman visual dan kemampuan kode secara native, dengan fitur pencarian gambar dan alat pembuatan gambar, memungkinkan sketsa antarmuka yang digambar tangan langsung diubah menjadi kode frontend yang dapat digunakan, bahkan satu tangkapan layar dapat digunakan untuk mendeteksi dan memperbaiki masalah UI, menjadikan pemrograman visual benar-benar alat produktivitas.

Pelatihan multimodal asli Qwen3.5 dilakukan secara efisien di infrastruktur AI Alibaba Cloud. Melalui inovasi teknologi dasar, throughput pelatihan data campuran teks, gambar, dan video Qwen3.5 hampir mencapai 100% dari model basis teks murni, secara besar-besaran menurunkan hambatan pelatihan multimodal asli. Selain itu, dengan strategi penggunaan presisi FP8 dan FP32 yang dirancang secara cermat, saat pelatihan diperluas hingga ratusan triliun token, penggunaan memori aktif berkurang sekitar 50%, dan kecepatan pelatihan meningkat 10%, sehingga mengurangi biaya pelatihan model dan meningkatkan efisiensi.

Qwen3.5 juga mencapai terobosan baru dari kerangka kerja agen ke aplikasi agen. Qwen3.5 mampu mengoperasikan ponsel dan komputer secara mandiri, menyelesaikan tugas harian secara efisien, mendukung lebih banyak aplikasi utama dan instruksi di perangkat mobile, serta menangani operasi yang lebih kompleks di PC seperti pengelolaan data lintas aplikasi dan otomatisasi proses, secara signifikan meningkatkan efisiensi operasional. Tim Qwen membangun kerangka kerja pembelajaran penguatan asinkron yang dapat diperluas untuk agen, mempercepat proses 3 hingga 5 kali, dan mendukung pengembangan agen cerdas berbasis plugin hingga skala jutaan.

Diketahui, aplikasi Qwen dan versi PC telah mengintegrasikan model Qwen3.5-Plus secara langsung. Pengembang dapat mengunduh model baru di komunitas Moda dan HuggingFace, atau langsung mendapatkan layanan API melalui Alibaba Cloud Bailing. Alibaba juga akan segera merilis berbagai model seri Qwen3.5 dengan ukuran dan fungsi berbeda secara open source. Model flagship yang lebih kuat, Qwen3.5-Max, juga akan segera diluncurkan.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka