MiniCPM5-1B – 面壁智能与清华大学联合开发端侧大语言模型

MiniCPM5-1B是面壁智能与清华大学联合开发的10亿参数端侧大语言模型，其核心突破在于仅以1B参数规模实现对2B级别模型的性能超越，并在国际权威榜单AA-Index上登顶所有2B以下模型首位。

该模型最大创新点是基座模型由全球首个AI自编写的生产级训练框架ForgeTrain完成预训练，标志着“AI制造AI”从实验室概念走向工业化落地。

1. 极小体积与高效部署

2. AI自进化的训练范式

ForgeTrain框架革命：全球首个完全由AI编写并成功训练出工业级模型的训练框架，开发周期比传统手工编写缩短90%以上。
数据治理创新：采用五级（L0-L4）数据治理方案，核心数据集Ultra-FineWeb-L3包含4100亿+中文词元，通过高质量数据而非堆规模提升模型能力。
国产芯片深度适配：ForgeTrain仅用3-5天完成对华为昇腾芯片的零人工适配，训练速度比昇腾原生框架快10%。

1. 权威榜单领先优势

2. 多维度能力均衡性

代码与数学能力突出：在LCB-Pro代码测评中获22.68分，在AIME数学推理测试中达40.42分，显著领先同体量模型。
六边形战士特性：在逻辑推理、工具调用、多语言理解等7个维度均名列前茅，尤其在智能体任务（BFCLv4）中表现优异。
关键对比数据：
- MiniCPM5-1B/think平均分42.57 vs Qwen3.5-0.8B/think（25.14分）
- AIME-2026数学测试得分40.42 vs Qwen3.5-0.8B（0.21分）。

1. 端侧落地核心优势

低门槛部署：提供一键安装脚本与Agent Skills工具链，开发者可直接调用Claude Code等智能体自动完成部署，大幅降低“下载到运行”的操作成本。
全场景适配能力：支持离线客服、AI桌宠、车机交互等碎片化场景，在弱网或隐私敏感场景中无需依赖云端。
自定义人格功能：可记忆用户交互偏好，适配不同场景风格，强化端侧模型的本地化体验。