腾讯混元团队正式发布并开源了混元3D世界模型 2.0 (HY-World 2.0)。这是一个多模态大模型,能够根据文字、图片、视频等输入,自动生成、重建和模拟可交互的3D世界。
它的核心突破在于,不再像前代模型或谷歌Genie 3那样仅生成视频,而是直接产出可二次编辑、能导入游戏引擎的3D资产文件,实现了从“AI画图”到“AI造世界”的跨越。

混元3D世界模型 2.0功能亮点
- 多模态输入,一键生成3D世界
你可以输入一段文字描述(如“生成一个日式RPG风格的中世纪地牢”)或一张图片,模型就能精准解析语义,生成一个风格多样、可自由漫游的完整3D空间。 - 生成可编辑的3D资产
模型生成的不是视频,而是可以直接导出为Mesh、3DGS(3D高斯泼溅)、点云等多种格式的3D文件。这些文件能无缝对接 Unity、UE(虚幻引擎) 等主流游戏引擎,用于快速制作游戏地图和关卡原型。 - 支持物理碰撞的角色模式
生成的3D场景具备真实的物理碰撞属性。你可以开启“角色模式”,像在真实游戏中一样操控角色在场景中自由行走、跳跃,测试空间的可行性和动线。 - 复刻真实场景(数字孪生)
通过输入一段真实空间的视频或多角度图片,模型可以构建出高精度的3D数字孪生空间。这项能力未来可应用于室内装修预览、城市规划、文化遗产保护等领域。
主要技术升级
相较于1.0版本,混元3D世界模型2.0在性能上实现了巨大提升:
表格
| 升级维度 | 提升效果 |
|---|---|
| 生成速度 | 提升 10倍,从小时级缩短至分钟级 |
| 模型精度 | 提升 60%,纹理和结构还原度更高 |
| 场景完整度 | 对物体侧面、背面的生成更完整,空间一致性更强 |
混元3D世界模型 2.0的项目地址
- 项目官网:https://3d-models.hunyuan.tencent.com/world/
- GitHub仓库:https://github.com/Tencent-Hunyuan/HY-World-2.0
- HuggingFace模型库:https://huggingface.co/tencent/HY-World-2.0
- 技术论文:https://3d-models.hunyuan.tencent.com/world/world2_0/HY_World_2_0.pdf
混元3D世界模型 2.0的应用场景
- 游戏开发领域:开发者可用模型快速生成具备物理碰撞的可交互3D场景原型,显著降低传统关卡设计的时间和技术门槛。
- 虚拟现实应用:系统能构建高保真沉浸式VR/AR空间,支持终端用户在生成环境中实现自由行走和实时探索。
- 数字孪生构建:用户仅需提供少量照片或短视频即可自动重建真实物理世界的高精度3D数字副本。
- 机器人仿真训练:为具身智能和自动驾驶系统提供物理一致、可交互的虚拟训练环境,支持算法安全验证。
- 影视虚拟制片:模型能生成360°全景虚拟背景资产,用于电影预演、虚拟摄影棚拍摄及后期特效合成制作。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



