Hy-MT2 – 腾讯混元团队开源的新一代翻译大模型家族

腾讯混元团队开源的Hy-MT2是新一代多语言翻译大模型家族，包含1.8B、7B、30B-A3B三种尺寸，支持33种语言互译及5种民族语言/方言翻译，核心突破在于通过1.25-bit极端量化技术将轻量级模型压缩至仅440MB，实现手机端本地离线部署，且在专业领域翻译性能上部分超越谷歌Gemini 3.1 Pro等国际顶级模型。该模型已同步上线“腾讯Hy翻译”小程序，提供离线翻译、自定义风格等实用功能。

Hy-MT2技术原理

1. 模型架构与量化技术

多尺寸模型设计：
- Hy-MT2-1.8B：轻量级端侧部署，专为手机芯片优化，通过 AngelSlim 1.25-bit极端量化技术 将原始3.3GB模型压缩至440MB，可在苹果A15、高通/联发科等主流手机芯片上本地推理。
- Hy-MT2-7B/30B-A3B：均衡版与旗舰版，后者采用混合专家（MoE）架构，在扩大参数规模的同时控制推理开销，适用于专业场景。
量化核心技术：
- 1.25-bit方案：基于自研 Sherry稀疏高效三值量化框架（ACL 2026录用），通过“细粒度稀疏”策略（每4个参数中3个用1-bit存储，1个置0），在苹果A15芯片上推理速度较上一代提升1.5倍。
- 2-bit方案：采用拉伸弹性量化（SEQ）技术，体积约574MB，支持Arm SME2指令集加速，质量几乎无损。

2. 指令遵循能力升级

通过自建测试集 IFMTBench 优化模型对复杂指令的理解，能精准执行术语保留、风格控制等要求。例如，用户设定“翻译结果简洁精炼，每句不超过15个字”，模型可自动压缩冗余表达。
在真实场景测试中，Hy-MT2-30B-A3B的指令遵循能力已接近Gemini 3.1 Pro，显著优于同尺寸开源模型。

Hy-MT2核心功能

1. 多语言与场景化翻译

语言覆盖：支持33种主流语言互译及5种民汉/方言翻译。
自定义翻译风格：提供9种预设模板，用户可自定义术语规则（如保留“GPU”“AI”不译）或指定输出格式。

2. 离线与实时交互能力

无网环境可用：通过“腾讯Hy翻译”小程序提前下载端侧模型，在无网络或弱网场景下实现离线翻译，解决跨境旅行、户外作业等场景痛点。
语音输入支持：集成实时语音翻译功能，优化对话场景的实用性。

Hy-MT2关键优势

1. 性能与效率突破

轻量级模型超越商业API：Hy-MT2-1.8B在FLORES-200评测中效果优于微软等主流商业翻译API，1.25-bit量化版仅需440MB即可部署于手机端。
专业领域领先：在金融、教育等垂直领域的DomainMTBench测试中，Hy-MT2-30B-A3B部分场景表现已超过Gemini 3.1 Pro。

2. 开源与生态适配

全栈开源：模型权重、代码及测试集IFMTBench已在GitHub、Hugging Face、ModelScope平台开放，Apache 2.0协议允许免费商用。
硬件兼容性强：完成与沐曦曦云C系列GPU、天数智芯等国产芯片的Day 0深度适配，支持ARM、高通、Intel等多品牌硬件环境。