Alibaba phát hành thế hệ mới của mô hình cơ bản Qianwen 3.5, đứng đầu toàn cầu về mô hình mã nguồn mở mạnh nhất

robot
Đang tạo bản tóm tắt

Vào ngày 16 tháng 2, ngày Giao thừa, Alibaba đã mở mã nguồn thế hệ mới của mô hình lớn Qwen3.5-Plus, có hiệu năng sánh ngang Gemini 3 Pro, đứng đầu các mô hình mã nguồn mở mạnh nhất thế giới.

Theo thông tin, Qwen3.5 đã thực hiện đổi mới toàn diện kiến trúc mô hình nền tảng. Phiên bản Qwen3.5-Plus được phát hành lần này có tổng tham số là 3970 tỷ, chỉ kích hoạt 170 tỷ, hiệu năng vượt xa mô hình Qwen3-Max với hơn nghìn tỷ tham số, giảm 60% dung lượng bộ nhớ GPU cần thiết để triển khai, tăng đáng kể hiệu quả suy luận, tối đa có thể tăng gấp 19 lần throughput suy luận. Giá API của Qwen3.5-Plus chỉ còn 0,8 nhân dân tệ trên mỗi triệu token, chỉ bằng 1/18 của Gemini 3 Pro.

Khác với các thế hệ mô hình ngôn ngữ lớn trước đây của Qwen, Qwen3.5 đã đạt bước nhảy thế hệ từ mô hình thuần văn bản sang mô hình đa phương thức nguyên bản. Qwen3 được huấn luyện trên token văn bản thuần túy, còn Qwen3.5 dựa trên token kết hợp hình ảnh và văn bản, đồng thời bổ sung đáng kể dữ liệu tiếng Trung, tiếng Anh, đa ngôn ngữ, STEM và suy luận, giúp mô hình lớn “mở mắt” học hỏi kiến thức thế giới phong phú và logic suy luận, đạt hiệu suất vượt trội trên nền tảng có chưa tới 40% tham số của mô hình Qwen3-Max, thể hiện xuất sắc trong các bài kiểm tra toàn diện về suy luận, lập trình, trí tuệ nhân tạo Agent.

Vào ngày 15 tháng 1, ứng dụng Qwen ra mắt Agent mua sắm AI tiêu dùng đầu tiên trên thế giới. Trong dịp Tết Nguyên Đán, Agent mua sắm AI của Qwen đã giúp người dùng hoàn thành 120 triệu đơn hàng trong 6 ngày, lần đầu tiên trên thế giới thực hiện thành công các nhiệm vụ thực tế quy mô lớn và xác nhận thương mại. Với khả năng của Agent được nâng cao rõ rệt, Qwen3.5 sẽ mở rộng hơn nữa khả năng giúp đỡ người dùng trong công việc và cuộc sống qua ứng dụng Qwen.

Kể từ khi mở mã nguồn vào năm 2023, Alibaba đã mở mã hơn 400 mô hình Qwen, bao gồm các kích cỡ và đa phương thức toàn diện. Tải xuống toàn cầu của Qwen đã vượt 1 tỷ lần, trung bình mỗi tháng có hơn các mô hình của DeepSeek, Meta, OpenAI, Zhipu, Kimi, MiniMax cộng lại. Các nhà phát triển dựa trên Qwen đã tạo ra hơn 200.000 mô hình phụ, trở thành mô hình mã nguồn mở hàng đầu thế giới và là mô hình thân thiện nhất với nhà phát triển. Đáp ứng nhu cầu của các nhà phát triển AI và doanh nghiệp ở các quốc gia khác nhau, mô hình Qwen vẫn tiếp tục tiến hóa: mở rộng hỗ trợ 201 ngôn ngữ, tăng kích thước từ điển từ 150.000 lên 250.000 từ, tối đa có thể nâng cao hiệu quả mã hóa cho các ngôn ngữ ít người nói lên tới 60%.

Theo thông tin, ứng dụng Qwen và phiên bản PC đã tích hợp mô hình Qwen3.5-Plus ngay từ đầu. Các nhà phát triển có thể tải mô hình mới từ cộng đồng MagicHub và HuggingFace, hoặc trực tiếp lấy dịch vụ API qua Alibaba Cloud Bailing. Alibaba sẽ sớm tiếp tục mở mã nguồn các mô hình Qwen3.5 với các kích cỡ và chức năng khác nhau. Mô hình flagship Qwen3.5-Max có hiệu năng mạnh hơn cũng sẽ sớm ra mắt.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim