Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

图片[1]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度会员

AI 圈又有大新闻啦!Stability AI 又悄悄放出一个大招,这次不再是画图,而是音乐生成!而且还是开源的!

这个新工具叫 Stable Audio Open,简单来说,用文字就能生成各种音频——无论是鼓点、旋律,还是环境音效,全都不在话下!最最最重要的是,它还能为 Sora 和可灵 这些视频生成配音!接下来我介绍3种使用方法

1.最简单在线使用

Stable Audio 2.0

点击前往

 

图片[2]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度会员

 

2.本地一键安装包:点击下载】,适合新手,低配的电脑也能运行,但是效果没有第3种好!
图片[3]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度会员

3.手动安装

首先,将存储库克隆到本地机器:

git clone https://github.com/RoyalCities/RC-stable-audio-tools.git
cd RC-stable-audio-tools

创建虚拟环境

Windows :

python -m venv venv
venv\Scripts\activate

macOS 和 Linux:

python3 -m venv venv
source venv/bin/activate

安装所需的软件包

安装稳定的音频工具和必要的软件包setup.py

pip install stable-audio-tools
pip install .

 

Windows 用户的额外步骤

 

为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU,请卸载并重新安装torch、,torchvisiontorchaudio使用正确的 CUDA 版本:

pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

配置

 

config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录(.wav 和 .mid 文件将存储在此处):

{
    "model_directory": "models",
    "output_directory": "generations"
}

使用方法

 

🎚️ 运行 Gradio 界面

 

使用批处理文件或直接从命令行启动 Gradio 界面:

  • 批处理文件示例:

@echo off
cd /d path-to-your-venv/Scripts
call activate
cd /d path-to-your-stable-audio-tools
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
pause

或命令行:

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

🎶 生成音频和 MIDI

 

Gradio 界面中的输入提示会生成音频和 MIDI 文件,这些文件将按照 中指定的方式保存config.json

该界面已经扩展了 Bar/BPM 设置(可修改用户提示 + 样本长度条件)、MIDI 显示 + 转换,还具有动态模型加载功能。

模型必须与附带的配置文件一起存储在其自己的子文件夹中。即,一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中,但重要的是,它们的相关配置文件包含在与检查点本身相同的文件夹中。

要切换模型,只需使用下拉菜单选择要加载的模型,然后选择“加载模型”。

 

THE END
点赞2176 分享
世界最强的5款免费杀毒软件!安全又实用!!【2020年】-零度会员

世界最强的5款免费杀毒软件!安全又实用!!【2020年】

1. Bitdefender 卫士 【点击下载】 2. AVG 免费防毒 【点击下载】 3.Malwarebytes 【点击下载】 4.Avira 【点击下载】 5.Window Defence 【点击观看】 6.世界反病毒实验室排行榜 【AV-TEST】 &n...
admin的头像-零度会员admin
2.1W+2252
影子系统PowerShadow,系统还原超级方便!-零度会员

影子系统PowerShadow,系统还原超级方便!

影子系统PowerShadow,您的电脑安全卫士什么是影子系统? 影子系统就像给您的电脑套上了一层保护膜。它创建一个和您电脑一模一样的虚拟环境,您在虚拟环境中进行的所有操作都不会影响到真正的系...
admin的头像-零度会员admin
2.5W+2773
只需一招!网盘提速15倍,让夸克网盘、百度、迅雷下载不再限速,永久免费!| 零度解说-零度会员
以4K/8K分辨率:录制高清电脑屏幕+语音转字幕功能!-零度会员

以4K/8K分辨率:录制高清电脑屏幕+语音转字幕功能!

1.OBS录屏官网:【点击下载】 2.剪映视频剪辑:【点击下载】 3.剪映字幕一键导出工具:【点击下载】 4.AegiSub 字幕编辑器:【点击下载】    
admin的头像-零度会员admin
2.6W+2180
只需600刀,组装超高性价比电脑!免费显卡、电源配件!畅玩3A大作、4K视频剪辑,办公也能轻松应对!附超详细组装教程 | 零度解说-零度会员
Hyper-V 独立显卡虚拟化教程 【vGPU】显卡直通-零度会员

Hyper-V 独立显卡虚拟化教程 【vGPU】显卡直通

$vm = '虚拟机的名字' Add-VMGpuPartitionAdapter -VMName $vm Set-VMGpuPartitionAdapter -VMName $vm -MinPartitionVRAM 80000000 -MaxPartitionVRAM 100000000 -OptimalPartitionVRAM 100000...
Stable Diffusion 3.5  美图生成提示词大全-零度会员

Stable Diffusion 3.5 美图生成提示词大全

 NSFW, front angle, (8k, best quality, masterpiece:1.2), (realistic, photo-realistic:1.37), ultra-detailed, 1 girl, looking at viewer, beautiful detailed sky, detailed cafe street...
admin的头像-零度会员admin
3W+2590
最强 AI 翻译神器!免费开源,支持离线使用,实时对话、内置 OpenAI Whisper 顶级模型! RTranslator | 零度解说-零度会员
OpenAI 正式发布 GPT-5.2!实测 效果惊人,附最新免费使用教程!切勿错过 | 零度解说-零度会员