OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度会员

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
点赞2672 分享
相关推荐
Sniffnet 网络流量监控神器!支持跨平台、直观、免费开源可靠!-零度会员

Sniffnet 网络流量监控神器!支持跨平台、直观、免费开源可靠!

Sniffnet 是一款免费开源的网络流量监控神器,支持 Windows、macOS、Linux 跨平台使用。界面直观美观,可实时监测进出流量、连接详情和协议分布,帮助用户轻松掌握网络状况,安全可靠,适合个人...
admin的头像-零度会员admin
1.9W+1004
精品网站推荐!这5个免费实用的软件,你可曾都用过?| 零度解说-零度会员
Windows 10 最新重大升级版!都有那些功能变化?附免费升级教程(21H1) | 零度解说-零度会员
又一个视频生成AI火了:Pika 作为新起之秀非常能打!-零度会员

又一个视频生成AI火了:Pika 作为新起之秀非常能打!

继runway发布了他们的局部动画笔刷,Stability AI 开源了他们的AI视频模型后,另一边的Pika终于发布了他们的视频编辑器,并同时公布了他们获得了5000W美元的投资。 Pika之前早就预告了他们的高...
admin的头像-零度会员admin
1.8W+1682
微软鼠标无边际操作程序下载【Microsoft Garage Mouse without Borders】-零度会员

微软鼠标无边际操作程序下载【Microsoft Garage Mouse without Borders】

Mouse without Borders, 由微软官方开放! 它允许您通过单个鼠标和键盘控制多达四台计算机,从而使您成为计算机舰队的船长。 这意味着使用无边界鼠标,您可以在计算机之间复制文本或拖放文件。 ...
admin的头像-零度会员admin
3.8W+2251
【限免】iPhone 万能电视遥控器!原价 US $29.99 现终生免费!-零度会员

【限免】iPhone 万能电视遥控器!原价 US $29.99 现终生免费!

《电视遥控器 – 通用版》已开启限时免费活动!告别东找西翻的遥控器,也无需再为切换多个控制器而手忙脚乱!这款应用专为追求高效与便捷的用户设计,可让您的 iPhone 或 iPad 秒变强大的智能电...
admin的头像-零度会员admin
1.8W+741
谷歌Bard正式支持免费生图功能,无限使用!顶流模型大混战开始了-零度会员

谷歌Bard正式支持免费生图功能,无限使用!顶流模型大混战开始了

Google宣布Bard新增图像生成功能,只需要给Bard一段文字描述,例如:创造一张狗在冲浪板冲浪的图片,“Create an image of a dog riding on a surfboard”,Bard就能生成出客制化且种类多元的图...
admin的头像-零度会员admin
1.4W+1527
开源ChatGPT 最佳替代方案!本地离线运行,100%免费,完美支持各大主流AI大模型 | 零度解说-零度会员

开源ChatGPT 最佳替代方案!本地离线运行,100%免费,完美支持各大主流AI大模型 | 零度解说

https://youtu.be/gf8Phs2YXWU ------------------------------------- 🔔 ChatGPT最佳替代软件下载:https://www.lingdu80.com/11591.html 检测电脑是否安装驱动和CUDA引擎:https://www.lingd...
admin的头像-零度会员admin
1.4W+1527
微软强悍的 OneNote 合并始于 Windows 商店中的一个应用程序-零度会员

微软强悍的 OneNote 合并始于 Windows 商店中的一个应用程序

微软一直致力于将其 OneNote 和 OneNote for Windows 10 应用程序统一为一个应用程序。 经过 12 个月的改进,Windows 商店中仅列出了 OneNote 应用程序。 过去一年,微软一直在将其 OneNote 和 ...
admin的头像-零度会员admin
1.7W+2250