腾讯混元团队开源的Hy-MT2是新一代多语言翻译大模型家族,包含1.8B、7B、30B-A3B三种尺寸,支持33种语言互译及5种民族语言/方言翻译,核心突破在于通过1.25-bit极端量化技术将轻量级模型压缩至仅440MB,实现手机端本地离线部署,且在专业领域翻译性能上部分超越谷歌Gemini 3.1 Pro等国际顶级模型。该模型已同步上线“腾讯Hy翻译”小程序,提供离线翻译、自定义风格等实用功能。

Hy-MT2技术原理
1. 模型架构与量化技术
- 多尺寸模型设计:
- Hy-MT2-1.8B:轻量级端侧部署,专为手机芯片优化,通过 AngelSlim 1.25-bit极端量化技术 将原始3.3GB模型压缩至440MB,可在苹果A15、高通/联发科等主流手机芯片上本地推理。
- Hy-MT2-7B/30B-A3B:均衡版与旗舰版,后者采用混合专家(MoE)架构,在扩大参数规模的同时控制推理开销,适用于专业场景。
- 量化核心技术:
- 1.25-bit方案:基于自研 Sherry稀疏高效三值量化框架(ACL 2026录用),通过“细粒度稀疏”策略(每4个参数中3个用1-bit存储,1个置0),在苹果A15芯片上推理速度较上一代提升1.5倍。
- 2-bit方案:采用拉伸弹性量化(SEQ)技术,体积约574MB,支持Arm SME2指令集加速,质量几乎无损。
2. 指令遵循能力升级
- 通过自建测试集 IFMTBench 优化模型对复杂指令的理解,能精准执行术语保留、风格控制等要求。例如,用户设定“翻译结果简洁精炼,每句不超过15个字”,模型可自动压缩冗余表达。
- 在真实场景测试中,Hy-MT2-30B-A3B的指令遵循能力已接近Gemini 3.1 Pro,显著优于同尺寸开源模型。
Hy-MT2核心功能
1. 多语言与场景化翻译
- 语言覆盖:支持33种主流语言互译及5种民汉/方言翻译。
- 自定义翻译风格:提供9种预设模板,用户可自定义术语规则(如保留“GPU”“AI”不译)或指定输出格式。
2. 离线与实时交互能力
- 无网环境可用:通过“腾讯Hy翻译”小程序提前下载端侧模型,在无网络或弱网场景下实现离线翻译,解决跨境旅行、户外作业等场景痛点。
- 语音输入支持:集成实时语音翻译功能,优化对话场景的实用性。
Hy-MT2关键优势
1. 性能与效率突破
- 轻量级模型超越商业API:Hy-MT2-1.8B在FLORES-200评测中效果优于微软等主流商业翻译API,1.25-bit量化版仅需440MB即可部署于手机端。
- 专业领域领先:在金融、教育等垂直领域的DomainMTBench测试中,Hy-MT2-30B-A3B部分场景表现已超过Gemini 3.1 Pro。
2. 开源与生态适配
- 全栈开源:模型权重、代码及测试集IFMTBench已在GitHub、Hugging Face、ModelScope平台开放,Apache 2.0协议允许免费商用。
- 硬件兼容性强:完成与沐曦曦云C系列GPU、天数智芯等国产芯片的Day 0深度适配,支持ARM、高通、Intel等多品牌硬件环境。
Hy-MT2典型应用场景
1. 移动端离线翻译
- 跨境旅行/商务:在无网络环境下快速翻译菜单、路标、合同等,避免依赖云端服务导致的延迟或隐私泄露。
- 民族地区沟通:精准处理方言翻译,适用于教育等场景。
2. 专业领域本地化需求
- 金融与法律文档:通过自定义术语库确保“IPX7”“Type-C”等专业词汇准确保留不译,满足合规性要求。
- 跨境电商内容生产:结合“腾讯Hy翻译”小程序的风格化指令,一键生成符合目标市场语境的商品描述。
3. 开发者集成与二次创新
- 低门槛部署:开发者可基于开源模型快速集成至App,无需自建翻译服务即可实现端侧离线功能。
- 垂直领域优化:利用IFMTBench测试集微调模型,适配医疗、工程等专业场景的术语体系。
Hy-MT2的核心价值在于将高质量翻译能力从云端下沉至终端设备,通过量化压缩与指令优化平衡性能与实用性。
其开源策略大幅降低了企业集成成本,尤其适合对网络依赖敏感、需保障数据隐私或涉及小众语言的场景。目前“腾讯Hy翻译”小程序已开放体验,iOS/安卓正式版即将推出。
Hy-MT2的项目地址
项目官网:https://aistudio.tencent.com/llm/en?tabIndex=0
GitHub仓库:https://github.com/Tencent-Hunyuan/Hy-MT2
HuggingFace模型库:https://huggingface.co/collections/tencent/hy-mt2
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



