Tencent phát hành mã nguồn mở Hy3 phiên bản xem trước, bộ chuẩn kiểm thử hiệu năng mã nguồn tăng 40% so với phiên bản trước

MarketWhisper

騰訊開源Hy3預覽版

腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型,并同步于腾讯云端(Tencent Cloud)提供付费 API 服务。据 Decrypt 于 4 月 24 日报道,Hy3 预览版自 1 月下旬启动训练,至发布日历时不足三个月。

Hy3 模型架构与开发背景

根据腾讯官方公告,Hy3 预览版为混合专家架构,将各查询路由至指定专家子网络子集处理,而非同步启用全部参数,以降低计算需求。

前一代旗舰模型 Hy2 的参数量逾 4,000 亿。腾讯官方声明指出,2,950 亿为推理效益优化后的设置,超出此规模后增加参数的边际效益不再划算。

根据 Decrypt 报道,Hy3 的训练工作由腾讯首席人工智慧科学家姚顺宇(Yao Shunyu)主导,其于 2026 年 2 月完成预训练与强化学习堆叠的基础设施重建后,Hy3 训练正式展开。

关键基准测试数据

根据腾讯官方公告所披露的基准测试结果:

SWE-bench Verified(GitHub 真实程式码错误修复):Hy3 预览版 74.4%,Hy2 为 53.0%;同期 GLM-5 为 77.8%,Kimi-K2.5 为 76.8%,Claude Opus 4.6 为 80.8%

Terminal-Bench 2.0(命令列自行主任务执行):Hy3 预览版 54.4%,Hy2 为 23.2%

BrowseComp(复杂网络搜寻任务):Hy3 预览版 67.1%,Hy2 为 28.7%

WideSearch:Hy3 预览版 70.2%,高于 GLM-5 及 Kimi-K2.5,低于 Claude Opus 4.6 的 77.2%

清华大学数学博士资格考试(2026 年春季):三次运行平均分(avg@3)88.4,为中国模型最高分

2025 年中国高中生物奥林匹克竞赛(CHSBO 2025):87.8 分,为同类中国模型最高分

部署平台与 API 定价

根据腾讯官方公告,Hy3 预览版已部署于以下平台:元宝(Yuanbao)、QQ、腾讯文档(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。

腾讯云端 API 定价为每百万输入标记 0.18 美元、每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。腾讯公告亦显示,Hy3 在 CodeBuddy 与 WorkBuddy 上的首标记延迟较前代降低 54%,端到端生成时间缩短 47%,并成功完成 495 步骤的代理工作流程。

常见问题

腾讯 Hy3 预览版何时发布,可在哪些平台取得?

根据腾讯官方公告及 Decrypt 2026 年 4 月 24 日报道,Hy3 预览版于 2026 年 4 月 23 日(星期四)在 GitHub、Hugging Face 及 ModelScope 开源,腾讯云端同步提供付费 API 服务。

Hy3 预览版与前代模型 Hy2 相比,主要基准测试差异为何?

根据腾讯官方公告,SWE-bench Verified 评分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。

Hy3 预览版的 API 定价为何?

根据腾讯云端官方定价,Hy3 预览版 API 起价为每百万输入标记 0.18 美元,每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI

Mollick 指 ra rằng chỉ với các phương pháp công khai và dữ liệu là có thể để AI agent tái tạo lại nghiên cứu phức tạp mà không cần có bản thảo bài báo gốc và mã nguồn; nếu quá trình tái hiện không khớp với bài báo gốc thì đa phần là do lỗi xử lý dữ liệu trong chính bài báo hoặc do kết luận bị quá mức, chứ không phải do AI. Claude đầu tiên tái hiện lại bài báo, sau đó GPT‑5 Pro được dùng để xác minh chéo, đa số thành công, chỉ bị cản trở khi gặp vấn đề do dữ liệu quá lớn hoặc replication data. Xu hướng này đã làm giảm đáng kể chi phí nhân lực, khiến việc tái hiện trở thành một kiểm định phổ biến và có thể thực hiện được; đồng thời cũng nêu ra các thách thức về thể chế đối với việc phản biện và quản trị, trong đó các công cụ quản trị của chính phủ hoặc có thể trở thành một vấn đề then chốt.

ChainNewsAbmedia16phút trước

OpenAI Sáp Nhập Codex Vào Mô Hình Chính Bắt Đầu Từ GPT-5.4, Ngừng Dòng Lập Trình Riêng

Tin tức Cổng, ngày 26 tháng 4 — Giám đốc bộ phận trải nghiệm nhà phát triển của OpenAI, Romain Huet, đã tiết lộ trong một tuyên bố gần đây trên X rằng Codex, dòng mô hình lập trình chuyên biệt được công ty duy trì độc lập, đã được sáp nhập vào mô hình chính bắt đầu từ GPT-5.4 và sẽ không còn nhận các bản cập nhật riêng biệt

GateNews16phút trước

Salesforce sẽ tuyển 1.000 sinh viên mới tốt nghiệp và thực tập sinh cho các sản phẩm AI, đồng thời nâng dự báo doanh thu FY2026

Tin tức cổng, ngày 26 tháng 4 — Salesforce sẽ tuyển dụng 1.000 sinh viên mới tốt nghiệp và thực tập sinh để làm việc trên các sản phẩm AI, bao gồm Agentforce và Headless360, khi công ty mở rộng mảng phần mềm AI của mình, CEO Marc Benioff đã công bố trên X. Công ty cũng đã nâng dự báo doanh thu cho tài khóa 2026 lên trong khoảng từ US$41.45 b

GateNews18phút trước

Alibaba Cloud Ra Mắt Qwen-Image-2.0-Pro với Văn Bản Tới Ảnh và Chỉnh Sửa Hợp Nhất, Hỗ Trợ Hiển Thị Văn Bản Đa Ngôn Ngữ

Thông điệp Cổng Tin Tức ngày 26 tháng 4 — Nền tảng Bailian của Alibaba Cloud đã ra mắt Qwen-Image-2.0-Pro, phiên bản đầy đủ tính năng của dòng Qwen-Image-2.0, kết hợp tạo ảnh từ văn bản và chỉnh sửa ảnh trong cùng một mô hình. Người dùng có thể chỉnh sửa các đối tượng, văn bản và phong cách trực tiếp thông qua các lệnh ngôn ngữ tự nhiên

GateNews2giờ trước

API DeepSeek V4-Pro giảm 75% đến ngày 5 tháng 5, giá đầu ra giảm xuống còn $0.87 mỗi một triệu token

Tin tức từ Gate, ngày 26 tháng 4 — DeepSeek đã công bố giảm giá 75% trong thời gian giới hạn đối với giá API V4-Pro, có hiệu lực đến ngày 5 tháng 5 lúc 15:59 UTC. Sau khi giảm giá, giá cho mỗi một triệu token là: hit bộ nhớ cache đầu vào $0.03625

GateNews3giờ trước

Anthropic Triển khai các biện pháp bảo vệ bầu cử cho Claude trước thềm cuộc bầu cử giữa nhiệm kỳ năm 2026

Anthropic đã công bố vào thứ Sáu một loạt biện pháp nhằm bảo vệ tính toàn vẹn bầu cử, được thiết kế để ngăn chatbot AI Claude của hãng bị biến thành công cụ vũ khí nhằm lan truyền thông tin sai lệch hoặc thao túng cử tri trước thềm cuộc bầu cử giữa kỳ năm 2026 tại Mỹ và các cuộc tranh cử lớn khác trên khắp thế giới trong năm nay. Trụ sở tại San Francisco-based

CryptoFrontier8giờ trước
Bình luận
0/400
Không có bình luận