一键换装神器爆火,IDM-VTON :奥特曼秒变猛男!

图片[1]-一键换装神器爆火,IDM-VTON :奥特曼秒变猛男!-零度会员

直接我们介绍过一键视频换脸技术,今天我们就来说下一键换装,这是目前效果最好的一个开源项目,完全免费!

在线体验:【链接直达

开源项目:【GitHub

网盘下载:【点击下载

 

图片[2]-一键换装神器爆火,IDM-VTON :奥特曼秒变猛男!-零度会员

 

图片[3]-一键换装神器爆火,IDM-VTON :奥特曼秒变猛男!-零度会员

安装环境要求:

git clone https://github.com/yisol/IDM-VTON.git
cd IDM-VTON

conda env create -f environment.yaml
conda activate idm

数据准备

VITON-HD

 

您可以从 VITON-HD 下载 VITON  HD 数据集。

下载 VITON-HD 数据集后,将 vitonhd_test_tagged.json 移动到测试文件夹中。

数据集目录的结构应如下所示。

train
|-- ...

test
|-- image
|-- image-densepose
|-- agnostic-mask
|-- cloth
|-- vitonhd_test_tagged.json

着装要求

 

您可以从DressCode下载 DressCode 数据集。

我们在这里提供预先计算的密集姿势图像和服装标题。

我们使用detectorron2来获取密集姿态图像,请参阅此处了解更多详细信息。

下载 DressCode 数据集后,放置图像密集目录和标题文本文件,如下所示。

DressCode
|-- dresses
    |-- images
    |-- image-densepose
    |-- dc_caption.txt
    |-- ...
|-- lower_body
    |-- images
    |-- image-densepose
    |-- dc_caption.txt
    |-- ...
|-- upper_body
    |-- images
    |-- image-densepose
    |-- dc_caption.txt
    |-- ...

推理

 

VITON-HD

 

使用带参数的 python 文件进行推理,

accelerate launch inference.py \
    --width 768 --height 1024 --num_inference_steps 30 \
    --output_dir "result" \
    --unpaired \
    --data_dir "DATA_DIR" \
    --seed 42 \
    --test_batch_size 2 \
    --guidance_scale 2.0

或者,您可以简单地使用脚本文件运行。

sh inference.sh

着装要求

 

对于 DressCode 数据集,通过类别参数输入要生成图像的类别,

accelerate launch inference_dc.py \
    --width 768 --height 1024 --num_inference_steps 30 \
    --output_dir "result" \
    --unpaired \
    --data_dir "DATA_DIR" \
    --seed 42 
    --test_batch_size 2
    --guidance_scale 2.0
    --category "upper_body"

或者,您可以简单地使用脚本文件运行。

sh inference.sh

 

THE END
点赞2177 分享
只需一招!网盘提速15倍,让夸克网盘、百度、迅雷下载不再限速,永久免费!| 零度解说-零度会员
Windows 11( 23H2)极限精简版!居然只要3G磁盘空间,拯救你的老旧电脑就靠它,超级流畅!! | 零度解说-零度会员

Windows 11( 23H2)极限精简版!居然只要3G磁盘空间,拯救你的老旧电脑就靠它,超级流畅!! | 零度解说

https://youtu.be/FkDXMz21RLU?si=hchL00geWgAOs2q3 ================= Windows 11 (23H2)精简版下载:https://www.lingdu80.com/10748.html VM虚拟机下载:https://www.lingdu80.com/6937.ht...
Windows 11 支持的英特尔处理器-零度会员

Windows 11 支持的英特尔处理器

支持升级安装到windows 11的英特尔CPU 列表: Intel® Atom® x6200FE Intel® Atom® x6211E Intel® Atom® x6212RE Intel® Atom® x6413E Intel® Atom® x6414RE Intel® Atom® x6425E In...
前所未见的恶意软件已经感染了数百台 Linux 和 Windows 设备-零度会员

前所未见的恶意软件已经感染了数百台 Linux 和 Windows 设备

小型办公室路由器?FreeBSD机器?企业服务器?它们都可能被感染! 研究人员揭示了一种前所未见的跨平台恶意软件,它感染了广泛的 Linux 和 Windows 设备,包括小型办公室路由器、FreeBSD 机器和...
admin的头像-零度会员admin
1.6W+2251
ChatGPT 官方手机客户端下载,用美区的苹果ID即可!-零度会员

ChatGPT 官方手机客户端下载,用美区的苹果ID即可!

  1.美区苹果ID注册官方地址:https://appleid.apple.com   2.美区身份生成网站:【点击进入】
admin的头像-零度会员admin
1.3W+6540
谷歌最强模型 Gemma 开源了!性能超Llama-2,可在笔记本和台式机运行,附本地安装教程!-零度会员

谷歌最强模型 Gemma 开源了!性能超Llama-2,可在笔记本和台式机运行,附本地安装教程!

https://youtu.be/Ms1xkAFNO9g ------------------------------------- 1.谷歌 Gemma 大模型本地部署和下载:https://www.lingdu80.com/11682.html 2.huggingFace上运行 Gemma 模型:https://ww...
admin的头像-零度会员admin
1.4W+1527
最实用的AI视频去码!简单好用效果又非常棒,附上CodeFormer-GUI 使用教程,小白都能轻松驾驭 | 零度解说-零度会员
DeepSeek V3.1 正式发布! 最强的开源、AI 编程模型?对比Claude Opus 4.1 和 GPT-5 如何?实测告诉你答案!| 零度解说-零度会员
AI 视频终于有“声音”了?实测 Higgsfield Kling 2.6 Audio:画面+配音一次生成!|零度解说-零度会员

AI 视频终于有“声音”了?实测 Higgsfield Kling 2.6 Audio:画面+配音一次生成!|零度解说

Higgsfield Kling 2.6 Audio — AI 视频与声音同步生成实测 Higgsfield 是目前增长最快的生成式 AI 视频平台之一,主打 对创作者最友好、价格最低、效率最高。 本期视频我将完整实测 Kling 2.6 ...
admin的头像-零度会员admin
84821578