最新超长AI视频模型!一句话即可生成120秒视频,免费开源!

图片[1]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度会员

近日,由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

  1. 生成时长达2分钟(1200帧),超越以往模型
  2. 视频质量优秀
  3. 与业内其他主流模型实现无缝衔接
  4. 开源免费,便于开发者使用和二次开发

图片[2]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度会员

 

免费在线试玩:【点击进入】 目测在线人太多需要排队

自己本地搭建教程:

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境 【Python 3.10 】、【Cuda 下载

2.克隆开源项目至本地:

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git
cd StreamingT2V/

StreamingT2V 最新版打包下载:网盘下载

3.安装必备的环境:

conda create -n st2v python=3.10
conda activate st2v
pip install -r requirements.txt

4.(可选)如果您的系统上缺少 FFmpeg,请安装 FFmpeg

 

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

 

6.文本转视频

cd t2v_enhanced
python inference.py --prompt="A cat running on the street"

如要使用其他基本模型,请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced
python inference.py --image=../__assets__/demo/fish.jpg --base_model=SVD

推理时间

 

ModelscopeT2V作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 40秒 165秒
56帧 75秒 360秒
80帧 110秒 525秒
240帧 340秒 1610 秒(约 27 分钟)
600帧 860秒 5128 秒(约 85 分钟)
1200帧 1710 秒(约 28 分钟) 10225 秒(约 170 分钟)
AnimateDiff作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 50秒 180秒
56帧 85秒 370秒
80帧 120秒 535秒
240帧 350秒 1620 秒(约 27 分钟)
600帧 870秒 5138 秒(~85 分钟)
1200帧 1720 秒(约 28 分钟) 10235 秒(约 170 分钟)
SVD作为基本模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 80秒 210秒
56帧 115秒 400秒
80帧 150秒 565秒
240帧 380秒 1650 秒(约 27 分钟)
600帧 900秒 5168 秒(~86 分钟)
1200帧 1750 秒(约 29 分钟) 10265 秒(~171 分钟)

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时,采用随机混合。对于随机混合,chunk_size和 的值overlap_size分别设置为 112 和 32。

更多的文生视频在线使用:【点击前往】 支持多模型自由切换!

THE END
点赞2179 分享
Windows 11 任务栏高级自定义工具 TaskbarXI-零度会员

Windows 11 任务栏高级自定义工具 TaskbarXI

TaskbarXI 下载地址:https://github.com/ChrisAnd1998/TaskbarXI/releases/tag/1.0.0.0
admin的头像-零度会员admin
1.2W+652
微软 Phi-3 最新开源大模型,能否媲美 ChatGPT、Cladue 3?附本地安装部署! | 零度解说-零度会员

微软 Phi-3 最新开源大模型,能否媲美 ChatGPT、Cladue 3?附本地安装部署! | 零度解说

https://youtu.be/kqz4nDcKctg ------------------------------------- 🔔 Phi-3 大模型本地搭建工具下载:https://www.lingdu80.com/12593.html
admin的头像-零度会员admin
2.1W+2176
Zorin OS 18 突然爆火!最像 Windows 的轻量级 Linux 系统,流畅到惊讶!(3分钟上手) | 零度解说-零度会员

Zorin OS 18 突然爆火!最像 Windows 的轻量级 Linux 系统,流畅到惊讶!(3分钟上手) | 零度解说

https://youtu.be/q1qCzx3sakA   Zorin OS 18 系统及工具下载:https://www.lingdu80.com/22036.html   https://www.lingdu80.com/22036.html
谷歌突然发布 Gemini 3.0!强到离谱,Pro 版免费开放使用,附实测与开通教程!| 零度解说-零度会员

谷歌突然发布 Gemini 3.0!强到离谱,Pro 版免费开放使用,附实测与开通教程!| 零度解说

谷歌这一次终于憋不住了——在毫无预兆的情况下,突然发布了他们迄今为止最强、也是目前全球排行第一的 AI 模型:Gemini 3.0(准确来说是 Gemini 3 Pro)。它一登场就直接“屠榜”,在全球 LMAr...
让老照片动起来!通过 AI 一键搞定,按要求生成动态视频-零度会员

让老照片动起来!通过 AI 一键搞定,按要求生成动态视频

岁月如沙,从指缝悄然流逝。那些定格在泛黄照片里的笑脸,曾是我们最珍贵的瞬间。如今,科技让逝去的时光重现生机,让我们一同重温那些逐渐模糊的记忆,感受时光荏苒中永恒不变的温暖。 如今,科技的...
admin的头像-零度会员admin
4.6W+2182
Chrome、Edge 浏览器开启(VSR)视频超分辨率功能!-零度会员

Chrome、Edge 浏览器开启(VSR)视频超分辨率功能!

  1.Chrome浏览器开启VSR功能所需代码:(注意,代码前要添加一个空格,否则会报错) --enable-features=IntelVpSuperResolution 2.Edge浏览器需要安装金丝雀版:官方下载【简体中文版】【...
admin的头像-零度会员admin
1.9W+6540
SyncBackFree 100%免费好用的电脑文件同步软件-零度会员

SyncBackFree 100%免费好用的电脑文件同步软件

  Windows 备份软件 - 100% 免费 - 超级好用! 支持 Windows 11、10、8、7 和 Vista,支持 32 位和 64 位版本的 Windows 官方下载:【点击前往】  
admin的头像-零度会员admin
1.5W+1528
100%本地离线运行的 ChatGPT最佳替代!支持各大开源的AI大模型-零度会员

100%本地离线运行的 ChatGPT最佳替代!支持各大开源的AI大模型

真正完全免费! 100%本地离线运行的ChatGPT最佳替代,完全免费开源可以导入各大开源的AI大模型,支持Windows 、Mac 和linux系统,可以随时随地,哪怕在没有网络的情况下,都可以在我们电脑上跑AI大...
admin的头像-零度会员admin
1.8W+1530
2023年 最新免费域名注册教程!支持 .com顶级域名-零度会员

2023年 最新免费域名注册教程!支持 .com顶级域名

  1.EU.org域名,永久免费!【注册链接】 2.Onamae,顶级域名首年免费,支持com/net域名 【注册链接】 3.商用域名、提供永久免费的Whois 隐私保护! 推荐 Namesio 【优惠链接】,新用户首...
admin的头像-零度会员admin
2.5W+6542