Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

图片[1]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

AI 圈又有大新闻啦!Stability AI 又悄悄放出一个大招,这次不再是画图,而是音乐生成!而且还是开源的!

这个新工具叫 Stable Audio Open,简单来说,用文字就能生成各种音频——无论是鼓点、旋律,还是环境音效,全都不在话下!最最最重要的是,它还能为 Sora 和可灵 这些视频生成配音!接下来我介绍3种使用方法

1.最简单在线使用

Stable Audio 2.0

点击前往

 

图片[2]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

 

2.本地一键安装包:点击下载】,适合新手,低配的电脑也能运行,但是效果没有第3种好!
图片[3]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

3.手动安装

首先,将存储库克隆到本地机器:

git clone https://github.com/RoyalCities/RC-stable-audio-tools.git
cd RC-stable-audio-tools

创建虚拟环境

Windows :

python -m venv venv
venv\Scripts\activate

macOS 和 Linux:

python3 -m venv venv
source venv/bin/activate

安装所需的软件包

安装稳定的音频工具和必要的软件包setup.py

pip install stable-audio-tools
pip install .

 

Windows 用户的额外步骤

 

为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU,请卸载并重新安装torch、,torchvisiontorchaudio使用正确的 CUDA 版本:

pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

配置

 

config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录(.wav 和 .mid 文件将存储在此处):

{
    "model_directory": "models",
    "output_directory": "generations"
}

使用方法

 

🎚️ 运行 Gradio 界面

 

使用批处理文件或直接从命令行启动 Gradio 界面:

  • 批处理文件示例:

@echo off
cd /d path-to-your-venv/Scripts
call activate
cd /d path-to-your-stable-audio-tools
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
pause

或命令行:

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

🎶 生成音频和 MIDI

 

Gradio 界面中的输入提示会生成音频和 MIDI 文件,这些文件将按照 中指定的方式保存config.json

该界面已经扩展了 Bar/BPM 设置(可修改用户提示 + 样本长度条件)、MIDI 显示 + 转换,还具有动态模型加载功能。

模型必须与附带的配置文件一起存储在其自己的子文件夹中。即,一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中,但重要的是,它们的相关配置文件包含在与检查点本身相同的文件夹中。

要切换模型,只需使用下拉菜单选择要加载的模型,然后选择“加载模型”。

 

THE END
喜欢就支持一下吧
点赞2176 分享
相关推荐
火箭加速器!智能AI连接,只需三秒解除上网限制-零度博客

火箭加速器!智能AI连接,只需三秒解除上网限制

  下载连接:【点击进入】   智能AI连接,只需三秒 火箭加速器采用了全新内核,智能AI连接,自动选择最优线路,不论您在哪里,按下软件开启按钮后只需轻轻等待,3~2~1,即可连接成...
admin的头像-零度博客admin
1.8W+2253
龙年行大运!“零度解说” 祝大家新年快乐!愿望都实现  | 零度解说-零度博客
苹果抛弃密码!这是您需要知道的一切-零度博客

苹果抛弃密码!这是您需要知道的一切

在 iOS 16 和 macOS Ventura 中,Apple 引入了密码——一种更方便、更安全的密码替代方案。   多年来,我们被承诺结束基于密码的登录。现在,无密码未来​​的现实正在向前迈出一大步,为...
admin的头像-零度博客admin
1.6W+2251
硬盘克隆、系统迁移教程!完全免费,速度超快!电脑升级SSD必备 | 零度解说-零度博客
Claude 正式推出桌面客户端! 支持Windows 10/11 和 Mac-零度博客

Claude 正式推出桌面客户端! 支持Windows 10/11 和 Mac

由人工智能技术开发商 Anthropic 推出的 Claude 应用现已在电脑桌面、移动端提供客户端支持,官方声称:速度更快,更专业便捷!Claude 桌面客户端兼容 Windows 10/11 和 Mac 设备,整体体验与网...
admin的头像-零度博客admin
1.4W+3464
5个超实用的 Stable Diffusion 大模型!堪称AI绘画必备的神器!! | 零度解说-零度博客

5个超实用的 Stable Diffusion 大模型!堪称AI绘画必备的神器!! | 零度解说

https://youtu.be/3rCO8ulbkLk ====================   1.容华国风大模型下载 :https://bittly.cc/bMtsI 2.超逼真的人物模型下载: https://bittly.cc/oDPXg 3.EpiCRealism 冠军级真人模...
admin的头像-零度博客admin
1.7W+1682
Umi-OCR 支持离线使用的批量图文识别软件,免费开源!-零度博客

Umi-OCR 支持离线使用的批量图文识别软件,免费开源!

免费,开源,可批量的离线OCR软件 适用于 Windows7 x64 、Linux x64   免费:本项目所有代码开源,完全免费。 方便:解压即用,离线运行,无需网络。 高效:自带高效率的离线OCR引擎,内置...
admin的头像-零度博客admin
2.3W+3252
如何隐藏自己真实的IP地址?这5种方法你最好要知道! | 零度解说-零度博客
修复父母的黑白老照片和视频,因为她、他们曾经也年轻过....-零度博客

修复父母的黑白老照片和视频,因为她、他们曾经也年轻过….

这是送给每一位父母的礼物,我们来一起修复父母曾经的黑白老照片,因为她、他们曾经也年轻过....A.通过免费的修复平台,优点是即开即用,完全免费,缺点是速度有点慢,功能有限。1.CodeFormer ...
admin的头像-零度博客admin
4.4W+2181