OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度会员

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
点赞2672 分享
相关推荐
2020年谁最有钱?全球顶级亿万富翁大揭晓!马云还在全球首富前十位吗?-零度会员
PayPal在冻结、扣押资金、诉讼指控后窃取了用户的钱-零度会员

PayPal在冻结、扣押资金、诉讼指控后窃取了用户的钱

用户政策“不能用作‘盗窃许可’ PayPal 正面临集体诉讼,指控这家数字支付公司在不提供解释的情况下冻结客户资金,违反了敲诈勒索法。 诉讼称,当用户就冻结资金联系 PayPal 时,他们被告知他...
admin的头像-零度会员admin
1.6W+2251
Windows XP 系统联网开机就会中病毒?-零度会员

Windows XP 系统联网开机就会中病毒?

  今天早上看到一篇新闻,说一位博主在使用一台XP系统的电脑,关闭所有的防火墙联网开机以后,没过几分钟,电脑上就中了10多种电脑病毒! 那么这种情况是否属实?还是作者作弊了呢?现在我们...
admin的头像-零度会员admin
1.5W+1532
火箭加速器!智能AI连接,只需三秒解除上网限制-零度会员

火箭加速器!智能AI连接,只需三秒解除上网限制

  下载连接:【点击进入】   智能AI连接,只需三秒 火箭加速器采用了全新内核,智能AI连接,自动选择最优线路,不论您在哪里,按下软件开启按钮后只需轻轻等待,3~2~1,即可连接成...
admin的头像-零度会员admin
1.9W+2254
AI视频换脸、AI绘画、深度学习,这5个网站值得推荐!-零度会员

AI视频换脸、AI绘画、深度学习,这5个网站值得推荐!

  1.图片在线免费去背网站【点击前往】 2.AI 视频换脸【点击前往】 3.草图变成精美图片网站 【点击前往】 4.Cleanup Photos 去除图片不需要的部分 【点击前往】 5.AI解压网站 【点击前往】...
admin的头像-零度会员admin
2.3W+1682
OpenAI 正式发布 Sora 2 安卓版!免费注册、邀请码、美区代理IP、生成有趣的AI视频,全部轻松搞定!| 零度解说-零度会员

OpenAI 正式发布 Sora 2 安卓版!免费注册、邀请码、美区代理IP、生成有趣的AI视频,全部轻松搞定!| 零度解说

https://youtu.be/j9_QGtqk8xE   1、Sora 2 安卓版下载: https://www.lingdu80.com/21441.html 2、免费的美区代理IP: https://www.lingdu80.com/13533.html 3、Sora2 邀请码: https://w...
免费白嫖 Cursor Pro 学生账号? 快速申请 edu 教育邮箱,总价值高达 240 美元!| 零度解说-零度会员
推荐两款 AI 神器!图片上色、智能写作 ,完全免费开源!| 零度解说-零度会员

推荐两款 AI 神器!图片上色、智能写作 ,完全免费开源!| 零度解说

https://youtu.be/OjnH5Ei5g_Y   Style2paints下载:https://www.lingdu80.com/8113.html AI 写作所需要的安装包:https://www.tuio.cc/d/92    
admin的头像-零度会员admin
1.3W+6539
USB4 将打破 USB2.0/3.0 从未达到过的地方!-零度会员

USB4 将打破 USB2.0/3.0 从未达到过的地方!

USB4 与 Thunderbolt 4 — 以及有关最新 USB 标准的所有其他信息。   自 90 年代的 12Mbps 时代以来,USB 已经走过了漫长的道路。它已经向 USB-B 挥手告别,并逐渐远离 USB-A,转而采用纤...
admin的头像-零度会员admin
1.7W+2250