Hy3 preview – 腾讯混元正式发布并开源的新一代语言模型

Hy3 preview是腾讯混元(Hunyuan)团队正式发布并开源的一款新一代语言模型。

在经历底层基础设施“重建”后推出的首个成果,也是腾讯首席AI科学家姚顺雨(ReAct框架提出者)加盟后主导的首个旗舰模型。这款模型主打“高性价比”和“实用性”,旨在解决真实世界中的复杂问题,特别是针对AI Agent(智能体)场景进行了深度优化。

Hy3 preview - 腾讯混元正式发布并开源的新一代语言模型

Hy3 preview核心规格与架构

Hy3 preview 并没有盲目追求参数规模的无限扩大,而是选择了在性能与效率之间寻找平衡点:
  • 架构类型:采用MoE(混合专家) 架构,融合了“快慢思考”机制(即结合了快速反应和深度推理的能力)
  • 参数量: 总参数 295B(约3000亿),但激活参数仅为 21B(210亿)。这种设计使得它在保持强大智能的同时,推理速度更快,成本更低。
  • 上下文窗口: 支持256K超长上下文,能够处理海量文档和复杂数据
  • 定位: 它是混元大模型“重建”后的第一步,被视为一个探索实用性的预览版本,正式版 Hy3 仍在筹备中

Hy3 preview核心能力亮点

这款模型在三个关键领域实现了显著提升,特别是在“干活”能力上:
  1. 代码与智能体(Agent)能力最强:
    • 这是Hy3 preview提升最显著的方向。它在SWE-Bench Verified、Terminal-Bench2.0等主流代码和智能体基准测试中表现优异
    • 它能够稳定驱动复杂的 Agent 工作流(实测最长可达 495 步),覆盖文档处理、数据分析、工具链编排等场景
    • 在腾讯内部的CodeBuddy和WorkBuddy产品中,它帮助将任务成功率提升至 99.99% 以上
  2. 复杂推理能力突出:
    • 在高难度的理工科推理任务中表现强劲,例如在清华大学求真书院数学博资考(26春)和全国中学生生物学联赛中取得了优异成绩
    • 具备出色的上下文学习和指令遵循能力,能理解杂乱冗长的上下文并遵从复杂规则
  3. 极高的性价比:
    • 得益于低激活参数和架构优化,其推理成本大幅下降。在腾讯云TokenHub上,输入价格最低仅需 1.2元/百万tokens,输出价格为4元/百万tokens,大大降低了开发者和企业的使用门槛

如何使用Hy3 preview

  • 官网直接体验:访问腾讯混元官网,在线与模型对话,测试推理、代码生成与长文本理解能力。
  • 开源本地部署:前往GitHub 或 Hugging Face搜索”Tencent Hy3 preview”,下载模型权重与推理代码,基于本地GPU环境进行部署与微调。
  • API 调用开发:登录腾讯云TokenHub,选择 Hy3 preview 套餐(Lite/Standard/Pro/Max),获取 API Key 后即可通过标准接口将模型能力接入自有应用或工作流。
  • 腾讯产品直接使用:在元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享、搜狗输入法、腾讯地图、腾讯电子签、腾讯云等产品中,Hy3 preview 已作为底层模型全面上线,直接对话即可调用新模型能力。

Hy3 preview的项目地址

  • 项目官网:https://hunyuan.tencent.com/research/hy3
  • GitHub仓库:https://github.com/Tencent-Hunyuan/Hy3-preview
  • HuggingFace模型库:https://huggingface.co/tencent/Hy3-preview
© 版权声明

相关文章

暂无评论

none
暂无评论...