Vào ngày 16 tháng 2, ngày Giao thừa, Alibaba đã mở mã nguồn thế hệ mới của mô hình lớn Qwen3.5-Plus, hiệu năng sánh ngang Gemini 3 Pro, đứng đầu các mô hình mã nguồn mở mạnh nhất thế giới.
Theo thông tin, Qwen3.5 đã thực hiện đổi mới toàn diện kiến trúc mô hình nền tảng. Phiên bản Qwen3.5-Plus được phát hành lần này có tổng tham số là 3970 tỷ, chỉ kích hoạt 170 tỷ, hiệu năng vượt xa mô hình Qwen3-Max với hơn nghìn tỷ tham số, dung lượng bộ nhớ GPU cần để triển khai giảm 60%, hiệu quả suy luận tăng đáng kể, tối đa có thể tăng gấp 19 lần. Giá API của Qwen3.5-Plus thấp nhất chỉ 0,8 nhân dân tệ trên mỗi triệu Token, chỉ bằng 1/18 của Gemini 3 Pro.
Khác với các thế hệ mô hình ngôn ngữ lớn trước đây của Qwen, Qwen3.5 đã đạt bước nhảy thế hệ từ mô hình thuần văn bản sang mô hình đa phương thức nguyên bản. Qwen3 được huấn luyện trên Tokens văn bản thuần túy, còn Qwen3.5 dựa trên dữ liệu kết hợp hình ảnh và văn bản, đồng thời mở rộng đáng kể dữ liệu tiếng Trung, đa ngôn ngữ, STEM và suy luận, giúp mô hình lớn “mở mắt” học hỏi kiến thức thế giới phong phú và logic suy luận, đạt hiệu suất hàng đầu của mô hình nền Qwen3-Max với chưa đến 40% số tham số, thể hiện xuất sắc trong các bài kiểm tra toàn diện về suy luận, lập trình, trí tuệ nhân tạo Agent.
Vào ngày 15 tháng 1, ứng dụng Qwen ra mắt Agent mua sắm AI tiêu dùng đầu tiên trên thế giới. Trong dịp Tết Nguyên Đán, Agent mua sắm AI của Qwen đã giúp người dùng hoàn thành 120 triệu đơn hàng trong 6 ngày, lần đầu tiên trên thế giới thực hiện thành công các nhiệm vụ thực tế quy mô lớn và xác nhận thương mại. Với khả năng của Agent được nâng cao rõ rệt, Qwen3.5 sẽ mở rộng hơn nữa khả năng của ứng dụng Qwen trong công việc và cuộc sống, giúp mọi người giải quyết công việc dễ dàng hơn.
Kể từ khi mở mã nguồn vào năm 2023, Alibaba đã mở mã hơn 400 mô hình Qwen, bao gồm các kích cỡ và đa phương thức toàn diện. Lượt tải toàn cầu của Qwen đã vượt 1 tỷ lần, lượt tải trung bình mỗi tháng vượt qua tổng của DeepSeek, Meta, OpenAI, Zhipu, Kimi, MiniMax và các đối thủ khác, gấp 2 đến 8 lần. Các mô hình phát triển dựa trên Qwen đã vượt quá 200.000, trở thành mô hình mã nguồn mở hàng đầu thế giới được cộng đồng công nhận, và là mô hình mã nguồn mở thân thiện nhất dành cho các nhà phát triển. Đáp ứng nhu cầu của các nhà phát triển AI và doanh nghiệp ở các quốc gia khác nhau, mô hình Qwen vẫn đang tiếp tục phát triển: Qwen3.5 mở rộng hỗ trợ 201 ngôn ngữ, kích thước từ điển từ 150.000 lên 250.000 từ, tối đa nâng cao hiệu quả mã hóa cho các ngôn ngữ ít người nói lên đến 60%.
Thông tin cho biết, ứng dụng Qwen và phiên bản PC đã tích hợp mô hình Qwen3.5-Plus ngay từ đầu. Các nhà phát triển có thể tải mô hình mới tại cộng đồng MagicHub và HuggingFace, hoặc trực tiếp lấy dịch vụ API qua Alibaba Cloud Baille. Alibaba sẽ sớm tiếp tục mở mã nguồn các mô hình Qwen3.5 với các kích cỡ và chức năng khác nhau. Phiên bản mô hình cao cấp Qwen3.5-Max với hiệu năng mạnh hơn cũng sẽ sớm ra mắt.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Alibaba phát hành thế hệ mới của mô hình cơ bản Qianwen 3.5, đứng đầu toàn cầu về mô hình mã nguồn mở mạnh nhất
Vào ngày 16 tháng 2, ngày Giao thừa, Alibaba đã mở mã nguồn thế hệ mới của mô hình lớn Qwen3.5-Plus, hiệu năng sánh ngang Gemini 3 Pro, đứng đầu các mô hình mã nguồn mở mạnh nhất thế giới.
Theo thông tin, Qwen3.5 đã thực hiện đổi mới toàn diện kiến trúc mô hình nền tảng. Phiên bản Qwen3.5-Plus được phát hành lần này có tổng tham số là 3970 tỷ, chỉ kích hoạt 170 tỷ, hiệu năng vượt xa mô hình Qwen3-Max với hơn nghìn tỷ tham số, dung lượng bộ nhớ GPU cần để triển khai giảm 60%, hiệu quả suy luận tăng đáng kể, tối đa có thể tăng gấp 19 lần. Giá API của Qwen3.5-Plus thấp nhất chỉ 0,8 nhân dân tệ trên mỗi triệu Token, chỉ bằng 1/18 của Gemini 3 Pro.
Khác với các thế hệ mô hình ngôn ngữ lớn trước đây của Qwen, Qwen3.5 đã đạt bước nhảy thế hệ từ mô hình thuần văn bản sang mô hình đa phương thức nguyên bản. Qwen3 được huấn luyện trên Tokens văn bản thuần túy, còn Qwen3.5 dựa trên dữ liệu kết hợp hình ảnh và văn bản, đồng thời mở rộng đáng kể dữ liệu tiếng Trung, đa ngôn ngữ, STEM và suy luận, giúp mô hình lớn “mở mắt” học hỏi kiến thức thế giới phong phú và logic suy luận, đạt hiệu suất hàng đầu của mô hình nền Qwen3-Max với chưa đến 40% số tham số, thể hiện xuất sắc trong các bài kiểm tra toàn diện về suy luận, lập trình, trí tuệ nhân tạo Agent.
Vào ngày 15 tháng 1, ứng dụng Qwen ra mắt Agent mua sắm AI tiêu dùng đầu tiên trên thế giới. Trong dịp Tết Nguyên Đán, Agent mua sắm AI của Qwen đã giúp người dùng hoàn thành 120 triệu đơn hàng trong 6 ngày, lần đầu tiên trên thế giới thực hiện thành công các nhiệm vụ thực tế quy mô lớn và xác nhận thương mại. Với khả năng của Agent được nâng cao rõ rệt, Qwen3.5 sẽ mở rộng hơn nữa khả năng của ứng dụng Qwen trong công việc và cuộc sống, giúp mọi người giải quyết công việc dễ dàng hơn.
Kể từ khi mở mã nguồn vào năm 2023, Alibaba đã mở mã hơn 400 mô hình Qwen, bao gồm các kích cỡ và đa phương thức toàn diện. Lượt tải toàn cầu của Qwen đã vượt 1 tỷ lần, lượt tải trung bình mỗi tháng vượt qua tổng của DeepSeek, Meta, OpenAI, Zhipu, Kimi, MiniMax và các đối thủ khác, gấp 2 đến 8 lần. Các mô hình phát triển dựa trên Qwen đã vượt quá 200.000, trở thành mô hình mã nguồn mở hàng đầu thế giới được cộng đồng công nhận, và là mô hình mã nguồn mở thân thiện nhất dành cho các nhà phát triển. Đáp ứng nhu cầu của các nhà phát triển AI và doanh nghiệp ở các quốc gia khác nhau, mô hình Qwen vẫn đang tiếp tục phát triển: Qwen3.5 mở rộng hỗ trợ 201 ngôn ngữ, kích thước từ điển từ 150.000 lên 250.000 từ, tối đa nâng cao hiệu quả mã hóa cho các ngôn ngữ ít người nói lên đến 60%.
Thông tin cho biết, ứng dụng Qwen và phiên bản PC đã tích hợp mô hình Qwen3.5-Plus ngay từ đầu. Các nhà phát triển có thể tải mô hình mới tại cộng đồng MagicHub và HuggingFace, hoặc trực tiếp lấy dịch vụ API qua Alibaba Cloud Baille. Alibaba sẽ sớm tiếp tục mở mã nguồn các mô hình Qwen3.5 với các kích cỡ và chức năng khác nhau. Phiên bản mô hình cao cấp Qwen3.5-Max với hiệu năng mạnh hơn cũng sẽ sớm ra mắt.