OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度会员

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
点赞2672 分享
WattageViewer - mac充电功率实时查看工具【限时免费】-零度会员

WattageViewer – mac充电功率实时查看工具【限时免费】

WattageViewer 是一款轻量级 macOS 工具,可在顶部菜单栏实时显示为 MacBook 供电的功率信息。它不仅支持查看充电功率(瓦特),还可显示当前的电压(V)与电流(A),让你随时掌握充电状态,电...
admin的头像-零度会员admin
1.1W+2253
【限免】AOMEI Backupper 专业版免费密钥 – PC 备份和恢复、同步和克隆软件-零度会员

【限免】AOMEI Backupper 专业版免费密钥 – PC 备份和恢复、同步和克隆软件

AOMEI Backupper Pro是一款专业且易于使用的备份和恢复程序。它可以全面保护您的电脑免遭数据丢失。它可以安全地备份您的电脑和服务器,提供一键备份系统分区或驱动器的功能,只需几分钟即可完...
admin的头像-零度会员admin
2.5W+861
HivisionIDPhotos 证件照在线制作!支持离线、换装、美颜等-零度会员

HivisionIDPhotos 证件照在线制作!支持离线、换装、美颜等

HivisionIDPhotos 是一款功能强大的开源证件照生成工具。用户只需上传一张人像照片,它就能智能裁剪为一寸、两寸等标准尺寸,同时自动去除背景并渲染新的背景颜色,例如蓝色、白色、红色,还支...
admin的头像-零度会员admin
1.6W+2170
挖矿凉凉!大批矿卡遭集中翻新:画面不忍直视,等等党准备好了吗?-零度会员

挖矿凉凉!大批矿卡遭集中翻新:画面不忍直视,等等党准备好了吗?

  1.OKX 欧易官网:https://www.okx.com 2.新手指南:https://www.okx.com/academy/zh/?channelFlag=ACECK1501590 3.OKX去中心化手机钱包:https://www.okx.com/download
admin的头像-零度会员admin
1.7W+2250
HiveOS系统:显卡超频设置,100%解锁LHR算力!支持NBminer、T-Rex等挖矿软件 | 零度解说-零度会员
AI 贴近真实人物的生成! 提示词+生成参数和模型下载!-零度会员

AI 贴近真实人物的生成! 提示词+生成参数和模型下载!

  1.模型下载:【点击获取】,注意:如果无法下载,可以使用VPN【点击获取】进行代理下载。 2.没有 Stable Diffusion?【点击前往】下载安装 3.高清化算法 4x-UltraSharp:【点击下载】 提...
admin的头像-零度会员admin
1.4W+1528
最强AI芯片诞生!英伟达GTC大会推出“超级”GPU,这6个重点务必知晓! | 零度解说-零度会员

最强AI芯片诞生!英伟达GTC大会推出“超级”GPU,这6个重点务必知晓! | 零度解说

https://youtu.be/1Jh6DHe6_ig   AI 开发者盛会 | GTC 2024 完整直播视频:https://www.lingdu80.com/11869.html
admin的头像-零度会员admin
1.3W+1527
打鼾检测神器!免费分析你打呼噜的严重程度,并提供止鼾方法!-零度会员

打鼾检测神器!免费分析你打呼噜的严重程度,并提供止鼾方法!

  IOS版下载: 【点击下载】 安卓版下载:【点击下载】 【友情提醒:免费版已经足够大家使用】 鼾声分析器是同类产品中最受欢迎、最具创新力的应用,可录制、计量和跟踪您的鼾声,帮您找出...
核电挖矿! 美国向中国比特币矿主敞开了大门,提供廉价的核电支持挖矿,你准备好了吗?| 零度解说-零度会员