
导语:不是视频,而是可玩的3D游戏!腾讯混元世界模子2.0卷出新高度:一句话天生3D游戏原型。 4月16日,腾讯正式发布并开源混元3D世界模子2.0( HY-World 2.0)。HY-World 2.0是一个多模态世界模子,可以或许理解文字、图片、视频等差别类型输入,主动天生、重修及模仿 3D 世界,同时撑持多格局3D资产(Mesh/3DGS/点云等)导出,可以与现有的游戏事情流无缝对于接,用在快速天生游戏舆图及关卡原型。 混元世界模子 2.0让 AI 从“对于话”、“绘图”、“捏物体”,进化到了“造世界”——包罗人、物、景的完备世界。差别在google的Genie 3及混元世界模子1.5仅能天生视频文件,世界模子2.0的实用性更进一步:它可以直接天生可二次编纂的3D资产文件,这些天生的3D资产可以直接导入到游戏建造或者者具身仿真引擎,实现真正可玩、可用。 今朝,世界模子2.0已经经上线至腾讯混元3D创作引擎官网,用户可以申请利用。(申请利用地址:https://3d.hunyuan.tencent.com/sceneTo3D) 实机演示:输入“天生一个日式RPG气势派头的中世纪地牢”,便可天生一个3D空间资产 实机演示:输入“天生一个温馨的绘本气势派头小板屋”,游戏脚色可以自由穿行于天生的3D场景中所有内容均为3D文件,且全数由HY-World 2.0年夜模子一键天生 混元世界模子2.0撑持文、图、视频多种输入。输入一段文字或者一张图片,模子便可精准解析繁杂语义,一键天生气势派头多样的可漫游世界。比拟较混元世界模子1.0,2.0的模子架构周全进级,画面邃密度及真实感年夜幅晋升。用户还有可以自界说气势派头,按需天生真实风、漫画风、游戏风的3D空间。天生完成后,用户可以将资产导入到Unity、UE 等引擎、举行二次编纂,显著降低了游戏舆图的创作门坎。 模子还有撑持脚色模式,用户可以操作脚色于街道、修建、场景中自由摸索,不限时间,具备物理碰撞,就像于游戏里同样。 同时,世界模子2.0撑持复刻真实3D场景,用户输入一段真实空间的视频或者者多视角图片,模子就能构建出高精度的数字孪生空间。基在进级后的 WorldMirror 2.0 架构,模子撑持肆意尺寸图象与视频输入,一次性猜测密集点云、多视角深度图、外貌法线和相机参数 ,一次天生永世可复用。将来,室内装修预览、都会计划、文化遗产掩护等场景,均可以基在这一能力实现快速构建及还有原。 混元世界模子2.0以3D为主轴,经由过程同一空间理解、天生、重修的架构,实现了SOTA级的天生效果。与其他世界模子比拟,混元世界模子2.0于场景完备度(物体侧面及反面)以和对于输入图片的遵照水平体现更优。混元天生的3DGS与Mesh的混淆表征,也让用户可以或许开启脚色模式举行有真什物体碰撞的交互。 混元世界模子(HY-World 系列)自觉布以来就于连续进化:从首个开源的3D世界模子 HY-World 1.0 ,到可及时于线交互的 HY-World 1.5 ,再到一键天生3D空间资产的 HY-World 2.0,腾讯混元的3D世界模子正于一步步将“AI 造世界”从观点变为实际。 2025年下半年以来,腾讯引入多位高级人材、加速研发架构进级、连续加年夜混元年夜模子研发效率,并取患了显著结果。2025年12月,混元发布年夜语言模子2.0版本,推理能力与效率居海内顶尖行列;智能程度更高的新模子 HY3 也于内部营业测试中,于元宝App测试中得到较着正向收益。这次混元世界模子2.0发布,是混元于多模态范畴的又一冲破。 雷峰网(公家号:雷峰网) 雷峰网版权文章,未经授权禁止转载。详情见转载须知。




