OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度博客

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
喜欢就支持一下吧
点赞2672 分享
相关推荐
Web3.0 网络是否真的能实现?它会带来什么后果! 答案就在这里 (2022)| 零度解说-零度博客
轻松爬取清纯小姐姐私房照!小孩子别学-零度博客

轻松爬取清纯小姐姐私房照!小孩子别学

先上效果图 import re import requests import os   头文件: 因为爬虫需要用到请求网络部分,所以需要这两个包,没有的话自行下载即可。这个可以直接用pip安装。如果连pip都不懂,那就只...
admin的头像-零度博客admin
2.1W+2177
全新 AI 视频生成工具 - 免费开源,本地部署,一键生成2分钟超长视频!剑指Sora? | 零度解说-零度博客

全新 AI 视频生成工具 – 免费开源,本地部署,一键生成2分钟超长视频!剑指Sora? | 零度解说

https://www.youtube.com/watch?v=mKYWIm4qWF0   ------------------------------------- 🔔 StreamingT2V模型下载安装:https://www.lingdu80.com/12128.html
Windows 11 运行慢? 禁用10 个隐藏功能,让电脑飞起来!(2024) | 零度解说-零度博客

Windows 11 运行慢? 禁用10 个隐藏功能,让电脑飞起来!(2024) | 零度解说

https://www.youtube.com/watch?v=ME9czQsm5X0 ============== 右键菜单管理软件下载:https://www.lingdu80.com/11790.html
担心用户流失!Netflix 推迟打击密码共享行为-零度博客

担心用户流失!Netflix 推迟打击密码共享行为

我们不止一次注意到 Netflix 的密码共享打击是一种 愚蠢的现金抢夺,并说明了该公司不可避免地从创新颠覆者转变为 Netflix 最初颠覆的那种廉价有线电视公司。 Netflix 在过去五年中最大的创新...
admin的头像-零度博客admin
1.2W+6539
7款超火爆的免费开源软件!Github上的Stars过万,良心又实用,实至名归!!| 零度解说-零度博客

7款超火爆的免费开源软件!Github上的Stars过万,良心又实用,实至名归!!| 零度解说

https://youtu.be/A2GUgvPlTBE?si=0BrzL2g-tJtutNBH 7款超火爆的免费开源软件:https://www.lingdu80.com/10301.htmlPutty工具+Docker下一键部署命令:https://www.lingdu80.com/10294.html
admin的头像-零度博客admin
1.7W+1682
Windows 11 升级文件资源管理器的现代 UI 设计-零度博客

Windows 11 升级文件资源管理器的现代 UI 设计

据报道,微软正在对文件资源管理器进行重大更新,该更新将深度集成 OneDrive 和 Microsoft 365 据报道,微软正在对 Windows 11 中的文件资源管理器进行重大更新,以改进其用户界面和功能。Windo...
admin的头像-零度博客admin
1.3W+6539
微软发布首款 Majorana 1 量子芯片!人类计算即将被彻底颠覆?| 零度解说-零度博客
Windows 史上最快、最强的大文件复制、拷贝工具!Fastcopy 4.10 新版发布,免费好用,电脑备份必备软件! | 零度解说-零度博客