字节跳动推出全新AI数字人模型,OmniHuman助力内容创作门槛大降
2025-02-07 08:57:50
来源:
金融界
2月6日,字节跳动数字人团队推出了新的多模态数字人方案OmniHuman,其可以对任意尺寸和人物占比的单张图片结合一段输入的音频进行视频生成,生成的人物视频效果生动,具有非常高的自然度。
业内人士表示,OmniHuman通过引入多模态条件驱动和全条件训练策略,成功解决了人类动画生成领域长期存在的数据扩展和泛化能力问题。这一发展出现在AI视频生成技术竞争日益激烈的背景下,谷歌、Meta和微软等公司也在积极追逐类似技术。
传统 AI 数字人模型多基于姿势驱动或音频驱动,OmniHuman 则可以基于单个人体图像和运动信号,如仅音频、仅视频或音频和视频的组合生成人体视频,极大地降低内容创作的门槛。个人用户、MCN 机构等都能利用它快速生成虚拟主播、虚拟偶像、虚拟客服、虚拟教育等各种形式的数字人内容,为商业化变现提供更多可能。
![](http://i0cloud.jrjimg.cn/cloud/images/general/default.png)
![](http://i0cloud.jrjimg.cn/cloud/images/general/emoji.png)
全部评论
机会情报
- 字节跳动推出全新AI数字人模型,OmniHuman助力内容创作门槛大降
- “AI教母”团队用不到50美元训练出新模型,蒸馏法加速大模型训练和应用平民化
- DeepSeek成焦点!高盛、德银、瑞银齐发声,中企价值重估
- 国产AI芯片生态加速裂变,DeepSeek开源模型驱动自主技术突破
- 比亚迪智能化战略开启高阶智驾新纪元,产业重构催生千亿赛道机遇
- 宇树、特斯拉、Figure AI传来大消息,人形机器人站上风口!行业加速迎来量产阶段
- AI眼镜 “百镜大战” 打响!小米眼镜官方微博上线引发市场热潮,产业链有望迎来快速发展期
- 央行疯狂囤金!全球黄金需求三连破纪录,三大核心因素支撑金价
- 无人作战力量正加速走向战场,关注无人机产业链
- 多个新兴领域需求催化,固态电池加速商业化进程