8月21日消息,继7月2日百度蒸汽机(MuseSteamer)放出Turbo 版视频生成大模型后,团队正式放出了百度蒸汽机2.0模型家族的Turbo、Lite、Pro 及有声版四款模型,实现多人有声音视频一体化生成。

现场,国产科幻剧《三体》的视效指导姚骐展示了他用百度蒸汽机2.0制作的科幻短片《归途》。

按传统影视制作方式费用可能需要百万级,而用百度蒸汽机,《归途》作品共40个镜头,每个镜头生成3次,总共AI生成120片段素材,成本共计330.6元!

百度商业体系商业研发总经理刘林表示,百度蒸汽机视频生成大模型,解决了影视业三大痛点:限制多:危险镜头难拍摄、理想场景难寻找;流程长:影视制作周期长,参与协同角色多;成本高:演员拍摄成本高、视觉特效投入大等。

如姚骐所言:百度蒸汽机让好莱坞级大片镜头不再需要百万预算。

蒸汽机2.0五大核心技术突破:

行业首次实现多人有声音视频一体化生成,语音与唇形、表情、动作的毫秒级精准对齐,复杂场景下依然稳定;

首创多模态潜在空间规划技术(Latent Multi-Modal Planner),自主协调多角色身份、情感与互动逻辑,保障电影级叙事连贯性;

中文场景深度适配,以超98%的还原度精准呈现中文语音细节与情感表达;

端到端电影级画质生成,通过精准主体动态刻画,打造真实细腻的人物表现力;

大师级运镜控制,内置数十种专业镜头语言,精准响应文本指令,实现视觉细节与创意意图的完美对齐。