Intern-S2-Preview – 开源的新一代书生科学大模型的预览版

Intern-S2-Preview是上海人工智能实验室(上海AI实验室)最新开源的新一代书生科学大模型的预览版。

它最大的亮点在于“以小博大”:仅用 350亿(35B) 的参数规模,就在多个核心科学领域的表现上,比肩甚至超越了以往的万亿参数模型,大幅降低了专业科学大模型的使用门槛。

Intern-S2-Preview - 开源的新一代书生科学大模型的预览版

Intern-S2-Preview核心能力突破

  • 科学能力更强:通过提升任务难度和多样性,显著增强了小参数模型在复杂科学任务中的表现。例如,它首次在开源通用大模型中引入了实数预测模块,实现了材料晶体结构生成的能力
  • 顶尖的科学智能体(Agent)能力:在真实科研场景中表现出色。在PinchBench等通用智能体评测基准中,它展现出稳健的任务理解、工具调用和多步决策能力。在科学发现任务中,甚至超越了Claude-Haiku-4.5、GPT5.4-Nano 等主流闭源模型
  • 强大的科学代码生成:在面向科学编程与算法求解的SciCode基准上表现优异,位居同量级模型前列,能够高效支撑科学计算、算法开发与科研脚本编写等复杂任务

Intern-S2-Preview训推效率与国产算力协同

Intern-S2-Preview 在“算法-系统-算力”上进行了深度协同演进,特别是在国产昇腾A3超节点上实现了全流程优化:
  • 训练效率提升:针对多模态长序列训练,引入了多项显存与内存优化技术。通过离线模拟视觉与语言模块的算力占比,实现了更均衡的资源分配,解决了视觉模块耗时过高的问题。
  • 训推一体化:基于训练框架XTuner与部署推理框架 LMDeploy,引入了共享权重计算方式。这不仅减少了训练与推理之间的不一致,还显著提升了生成结果的有效性和推理效率
  • 强化学习优化:支持多token预测强化学习(MTP RL),并引入共享 MTP 权重计算,有效缓解了训练与推理阶段的不一致问题,提升了模型训练的稳定性

Intern-S2-Preview体验与获取渠道

上海AI实验室已经构建了丰富的书生大模型家族及全链路开源工具体系。如果你想进一步了解或体验 Intern-S2-Preview,可以通过以下官方渠道:
  • 在线体验https://chat.intern-ai.org.cn/
  • HuggingFacehttps://huggingface.co/collections/internlm/intern-s2
  • ModelScope(魔搭社区)https://modelscope.cn/collections/Shanghai_AI_Laboratory/Intern-S2
  • GitHubhttps://github.com/InternLM/Intern-S1
简单来说,Intern-S2-Preview是一款面向科研与科学发现的“小而精”的强力工具,非常适合需要处理复杂科学计算、代码生成以及多步决策任务的开发者和科研团队使用。
© 版权声明

相关文章

暂无评论

none
暂无评论...