阿里發布新一代基模千問3.5,登頂全球最強開源大模型

2月16日除夕當天,阿里巴巴開源全新一代大模型千問Qwen3.5-Plus,性能媲美Gemini 3 Pro,登頂全球最強開源模型。

據悉,千問3.5實現了底層模型架構的全面革新,此次發布的Qwen3.5-Plus版本總參數為3970億,激活僅170億,以小勝大,性能超過萬億參數的Qwen3-Max模型,部署顯存佔用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價格每百萬Token低至0.8元,僅為Gemini 3 Pro的1/18。

與前幾代的千問大語言模型不同,千問3.5實現了從純文本模型到原生多模態模型的代際躍遷。千問3預訓練在純文本Tokens上進行,而千問3.5則基於視覺和文本混合Token上預訓練,並大幅新增中英文、多語言、STEM和推理等數據,讓張開“眼睛”的大模型學會了更密集的世界知識和推理邏輯,以不到40%的參數量獲得超萬億的Qwen3-Max基座模型的頂尖性能,在推理、編程、Agent智能體等全方位基準評估中均表現優異。例如,千問3.5在MMLU-Pro知識推理評測中得分87.8分,超越GPT-5.2;在博士級難題GPQA測評中斬獲88.4分,高於Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型紀錄;而在通用Agent評測BFCL-V4、搜索Agent評測Browsecomp等基準中,千問3.5表現均超越Gemini 3 Pro、GPT-5.2。

原生多模態訓練,也帶來千問3.5的視覺能力飛躍:在多模態推理(MathVison)、通用視覺問答VQA(RealWorldQA)、文本識別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等眾多權威評測中,千問3.5均斬獲最佳性能。在學科解題、任務規劃與物理空間推理等任務上,千問3.5相比千問專項模型Qwen3-VL表現更好,空間定位推理和帶圖推理能力均大幅增強,推理分析更細緻、精準;在視頻理解方面,千問3.5支持長達2小時(1M token上下文)的視頻直接輸入,適用於長視頻內容分析與摘要生成;同時,千問3.5實現了視覺理解與程式碼能力的原生融合,結合圖搜和生圖工具,可將手繪界面草圖直接轉為可用的前端程式碼,一張截圖就能定位並修復UI問題,讓視覺程式設計真正成為生產力工具。

千問3.5的原生多模態訓練,是在阿里雲AI基礎設施上高效完成的。通過系列基礎技術創新,千問3.5在文本、圖像、視頻等混合數據訓練吞吐量,幾近100%持平純文本基座模型訓練,大幅降低了原生多模態訓練的難度門檻;同時,通過設計精巧的FP8、FP32精度應用策略,在訓練穩定擴展到數十萬億個token時,激活內存減少約50%,訓練還能提速10%,進一步節約了模型訓練成本、提升了訓練效率。

千問3.5也實現了從Agent框架到Agent應用的新突破。千問3.5可自主操作手機與電腦,高效完成日常任務,在移動端支持更多主流APP與指令,在PC端可處理更複雜的多步驟操作,如跨應用資料整理、自動化流程執行等,顯著提升操作效率。同時,千問團隊構建了一個可擴展的Agent異步強化學習框架,端到端可加速3到5倍,並將插件式智能體Agent支持擴展至百萬級規模。

據悉,千問APP、PC端已第一時間接入Qwen3.5-Plus模型。開發者可在魔搭社區和HuggingFace下載新模型,或通過阿里雲百煉直接獲取API服務。阿里很快將繼續開源不同尺寸、不同功能的千問3.5系列模型。性能更強的旗艦模型Qwen3.5-Max不久也將發布。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)