Vào ngày 16 tháng 2, ngày Giao thừa, Alibaba đã mở mã nguồn thế hệ mới của mô hình lớn Qwen3.5-Plus, hiệu năng sánh ngang Gemini 3 Pro, đứng đầu các mô hình mã nguồn mở mạnh nhất toàn cầu.
Theo thông tin, Qwen3.5 đã thực hiện đổi mới toàn diện kiến trúc mô hình nền tảng. Phiên bản Qwen3.5-Plus được phát hành lần này có tổng tham số là 3970 tỷ, chỉ kích hoạt 170 tỷ, thắng nhỏ nhưng thắng lớn, hiệu suất vượt xa mô hình Qwen3-Max với hơn nghìn tỷ tham số, giảm 60% dung lượng bộ nhớ GPU cần thiết để triển khai, tăng đáng kể hiệu quả suy luận, tối đa có thể tăng gấp 19 lần throughput suy luận. Giá API của Qwen3.5-Plus chỉ còn 0,8 nhân dân tệ trên mỗi triệu Token, chỉ bằng 1/18 của Gemini 3 Pro.
Khác với các thế hệ mô hình ngôn ngữ lớn trước đây của Qwen, Qwen3.5 đã đạt bước nhảy thế hệ từ mô hình thuần văn bản sang mô hình đa phương thức nguyên bản. Qwen3 dựa trên tiền huấn luyện trên token văn bản thuần túy, còn Qwen3.5 dựa trên tiền huấn luyện trên token kết hợp hình ảnh và văn bản, đồng thời mở rộng đáng kể dữ liệu tiếng Trung, đa ngôn ngữ, STEM và suy luận, giúp mô hình lớn “mở mắt” học hỏi kiến thức thế giới và logic suy luận phong phú hơn, chỉ với chưa đến 40% tham số của mô hình nền Qwen3-Max nhưng đạt hiệu suất hàng đầu. Trong các bài kiểm tra đánh giá toàn diện như suy luận kiến thức MMLU-Pro, Qwen3.5 đạt 87,8 điểm, vượt GPT-5.2; trong bài kiểm tra GPQA cấp tiến sĩ, đạt 88,4 điểm, cao hơn Claude 4.5; trong bài kiểm tra tuân thủ lệnh IFBench, đạt 76,5 điểm phá vỡ kỷ lục các mô hình khác; còn trong các bài đánh giá Agent chung BFCL-V4, đánh giá tìm kiếm Browsecomp, Qwen3.5 đều vượt Gemini 3 Pro, GPT-5.2.
Việc huấn luyện đa phương thức nguyên bản cũng mang lại bước nhảy vọt về khả năng thị giác của Qwen3.5: trong các bài kiểm tra uy tín như suy luận đa phương thức MathVison, hỏi đáp thị giác chung VQA (RealWorldQA), nhận dạng văn bản và hiểu tài liệu (CC_OCR), trí tuệ không gian (RefCOCO-avg), hiểu video (MLVU), Qwen3.5 đều đạt hiệu suất tối ưu. Trong các nhiệm vụ giải đề môn học, lập kế hoạch nhiệm vụ và suy luận không gian vật lý, Qwen3.5 thể hiện tốt hơn so với mô hình chuyên biệt Qwen3-VL, khả năng định vị không gian và suy luận hình ảnh đã được nâng cao rõ rệt, phân tích suy luận chính xác hơn. Trong lĩnh vực hiểu video, Qwen3.5 hỗ trợ nhập trực tiếp video dài tới 2 giờ (1 triệu token ngữ cảnh), phù hợp phân tích nội dung video dài và tạo tóm tắt. Đồng thời, Qwen3.5 đã tích hợp khả năng hiểu thị giác và lập trình mã nguồn nguyên bản, kết hợp công cụ tìm kiếm hình ảnh và sinh ảnh, có thể chuyển trực tiếp sơ đồ vẽ tay thành mã front-end khả dụng, chỉ cần một ảnh chụp màn hình để định vị và sửa lỗi UI, biến lập trình thị giác thành công cụ năng suất thực sự.
Việc huấn luyện đa phương thức nguyên bản của Qwen3.5 được thực hiện hiệu quả trên hạ tầng AI của Alibaba Cloud. Nhờ các đổi mới công nghệ cơ bản, Qwen3.5 gần như đạt hiệu suất huấn luyện dữ liệu hỗn hợp giữa văn bản, hình ảnh, video gần như bằng với mô hình nền dựa trên văn bản thuần túy, giảm đáng kể rào cản khó khăn trong huấn luyện đa phương thức nguyên bản; đồng thời, nhờ chiến lược sử dụng chính xác các độ chính xác FP8, FP32, khi mở rộng huấn luyện lên hàng nghìn tỷ token, bộ nhớ hoạt động giảm khoảng 50%, tốc độ huấn luyện còn tăng 10%, giúp tiết kiệm chi phí huấn luyện và nâng cao hiệu quả.
Qwen3.5 cũng đạt bước đột phá mới từ khung Agent đến ứng dụng Agent. Qwen3.5 có thể tự thao tác trên điện thoại và máy tính, hoàn thành nhiệm vụ hàng ngày hiệu quả, hỗ trợ nhiều ứng dụng chính trên di động và lệnh điều khiển, trên PC có thể xử lý các thao tác phức tạp hơn nhiều bước, như tổ chức dữ liệu liên ứng dụng, tự động hóa quy trình, nâng cao rõ rệt hiệu suất thao tác. Đồng thời, nhóm phát triển của Alibaba đã xây dựng khung học tăng cường bất đồng bộ mở rộng cho Agent, có thể tăng tốc từ 3 đến 5 lần toàn diện, và mở rộng hỗ trợ plugin cho Agent lên quy mô hàng triệu.
Theo thông tin, ứng dụng Qwen và phiên bản PC đã tích hợp mô hình Qwen3.5-Plus ngay lập tức. Các nhà phát triển có thể tải mô hình mới từ cộng đồng MagicStack và HuggingFace, hoặc truy cập dịch vụ API trực tiếp qua Alibaba Cloud Bailing. Alibaba sẽ tiếp tục mở mã nguồn các mô hình Qwen3.5 các kích cỡ và chức năng khác nhau. Phiên bản flagship mạnh hơn, Qwen3.5-Max, cũng sẽ sớm ra mắt.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Alibaba phát hành thế hệ mới của mô hình cơ bản Qianwen 3.5, đứng đầu toàn cầu về mô hình mã nguồn mở mạnh nhất
Vào ngày 16 tháng 2, ngày Giao thừa, Alibaba đã mở mã nguồn thế hệ mới của mô hình lớn Qwen3.5-Plus, hiệu năng sánh ngang Gemini 3 Pro, đứng đầu các mô hình mã nguồn mở mạnh nhất toàn cầu.
Theo thông tin, Qwen3.5 đã thực hiện đổi mới toàn diện kiến trúc mô hình nền tảng. Phiên bản Qwen3.5-Plus được phát hành lần này có tổng tham số là 3970 tỷ, chỉ kích hoạt 170 tỷ, thắng nhỏ nhưng thắng lớn, hiệu suất vượt xa mô hình Qwen3-Max với hơn nghìn tỷ tham số, giảm 60% dung lượng bộ nhớ GPU cần thiết để triển khai, tăng đáng kể hiệu quả suy luận, tối đa có thể tăng gấp 19 lần throughput suy luận. Giá API của Qwen3.5-Plus chỉ còn 0,8 nhân dân tệ trên mỗi triệu Token, chỉ bằng 1/18 của Gemini 3 Pro.
Khác với các thế hệ mô hình ngôn ngữ lớn trước đây của Qwen, Qwen3.5 đã đạt bước nhảy thế hệ từ mô hình thuần văn bản sang mô hình đa phương thức nguyên bản. Qwen3 dựa trên tiền huấn luyện trên token văn bản thuần túy, còn Qwen3.5 dựa trên tiền huấn luyện trên token kết hợp hình ảnh và văn bản, đồng thời mở rộng đáng kể dữ liệu tiếng Trung, đa ngôn ngữ, STEM và suy luận, giúp mô hình lớn “mở mắt” học hỏi kiến thức thế giới và logic suy luận phong phú hơn, chỉ với chưa đến 40% tham số của mô hình nền Qwen3-Max nhưng đạt hiệu suất hàng đầu. Trong các bài kiểm tra đánh giá toàn diện như suy luận kiến thức MMLU-Pro, Qwen3.5 đạt 87,8 điểm, vượt GPT-5.2; trong bài kiểm tra GPQA cấp tiến sĩ, đạt 88,4 điểm, cao hơn Claude 4.5; trong bài kiểm tra tuân thủ lệnh IFBench, đạt 76,5 điểm phá vỡ kỷ lục các mô hình khác; còn trong các bài đánh giá Agent chung BFCL-V4, đánh giá tìm kiếm Browsecomp, Qwen3.5 đều vượt Gemini 3 Pro, GPT-5.2.
Việc huấn luyện đa phương thức nguyên bản cũng mang lại bước nhảy vọt về khả năng thị giác của Qwen3.5: trong các bài kiểm tra uy tín như suy luận đa phương thức MathVison, hỏi đáp thị giác chung VQA (RealWorldQA), nhận dạng văn bản và hiểu tài liệu (CC_OCR), trí tuệ không gian (RefCOCO-avg), hiểu video (MLVU), Qwen3.5 đều đạt hiệu suất tối ưu. Trong các nhiệm vụ giải đề môn học, lập kế hoạch nhiệm vụ và suy luận không gian vật lý, Qwen3.5 thể hiện tốt hơn so với mô hình chuyên biệt Qwen3-VL, khả năng định vị không gian và suy luận hình ảnh đã được nâng cao rõ rệt, phân tích suy luận chính xác hơn. Trong lĩnh vực hiểu video, Qwen3.5 hỗ trợ nhập trực tiếp video dài tới 2 giờ (1 triệu token ngữ cảnh), phù hợp phân tích nội dung video dài và tạo tóm tắt. Đồng thời, Qwen3.5 đã tích hợp khả năng hiểu thị giác và lập trình mã nguồn nguyên bản, kết hợp công cụ tìm kiếm hình ảnh và sinh ảnh, có thể chuyển trực tiếp sơ đồ vẽ tay thành mã front-end khả dụng, chỉ cần một ảnh chụp màn hình để định vị và sửa lỗi UI, biến lập trình thị giác thành công cụ năng suất thực sự.
Việc huấn luyện đa phương thức nguyên bản của Qwen3.5 được thực hiện hiệu quả trên hạ tầng AI của Alibaba Cloud. Nhờ các đổi mới công nghệ cơ bản, Qwen3.5 gần như đạt hiệu suất huấn luyện dữ liệu hỗn hợp giữa văn bản, hình ảnh, video gần như bằng với mô hình nền dựa trên văn bản thuần túy, giảm đáng kể rào cản khó khăn trong huấn luyện đa phương thức nguyên bản; đồng thời, nhờ chiến lược sử dụng chính xác các độ chính xác FP8, FP32, khi mở rộng huấn luyện lên hàng nghìn tỷ token, bộ nhớ hoạt động giảm khoảng 50%, tốc độ huấn luyện còn tăng 10%, giúp tiết kiệm chi phí huấn luyện và nâng cao hiệu quả.
Qwen3.5 cũng đạt bước đột phá mới từ khung Agent đến ứng dụng Agent. Qwen3.5 có thể tự thao tác trên điện thoại và máy tính, hoàn thành nhiệm vụ hàng ngày hiệu quả, hỗ trợ nhiều ứng dụng chính trên di động và lệnh điều khiển, trên PC có thể xử lý các thao tác phức tạp hơn nhiều bước, như tổ chức dữ liệu liên ứng dụng, tự động hóa quy trình, nâng cao rõ rệt hiệu suất thao tác. Đồng thời, nhóm phát triển của Alibaba đã xây dựng khung học tăng cường bất đồng bộ mở rộng cho Agent, có thể tăng tốc từ 3 đến 5 lần toàn diện, và mở rộng hỗ trợ plugin cho Agent lên quy mô hàng triệu.
Theo thông tin, ứng dụng Qwen và phiên bản PC đã tích hợp mô hình Qwen3.5-Plus ngay lập tức. Các nhà phát triển có thể tải mô hình mới từ cộng đồng MagicStack và HuggingFace, hoặc truy cập dịch vụ API trực tiếp qua Alibaba Cloud Bailing. Alibaba sẽ tiếp tục mở mã nguồn các mô hình Qwen3.5 các kích cỡ và chức năng khác nhau. Phiên bản flagship mạnh hơn, Qwen3.5-Max, cũng sẽ sớm ra mắt.