Stableaudio音乐

10个月前更新 0 0

一种基于稳定扩散技术的音频生成模型，它能够根据文本提示高效生成高品质的音频内容。

所在地：

美国

收录时间：

2025-03-30

打开网站手机查看

Ai音频图像视频常用推荐 # Ai音乐 # Ai音频

Stableaudio音乐

文本直接生成20多种背景音乐。
Stable Audio 2.0 是一款由 Stability AI 开发的先进音频生成模型。

这个模型能够根据文本提示或上传的音频样本，生成高质量、长达三分钟的音乐作品，且支持多种音乐风格，如摇滚、爵士、电子、嘻哈等。

主要特点包括：

1.高质量音乐生成：Stable Audio 2.0 可以生成44.1kHz高保真的音乐作品，这些作品具有完整的结构，包括引子、发展和尾声，以及立体声音效。

2.音频到音频的转换：这个模型允许用户上传音频样本，并通过自然语言提示将这些样本转化为不同的声音。

3.高效的生成速度：与前一版本相比，Stable Audio 2.0 显著提升了音乐生成的效率，平均1分钟左右即可完成一首3分钟音乐作品的生成。

4.大规模数据集训练：模型使用了超过80万个音频文件和1.95万小时的音频数据进行训练，确保生成的音乐具有丰富的细节和真实感。

5.商业化应用支持：与知名音乐服务商 AudioSparx 合作，Stable Audio 2.0 生成的音乐可用于商业用途，适用于视频自媒体用户和商业广告制作。

6.多样化的输出格式：生成的音乐支持多种格式下载，包括 MP3、WAV 和 Video，满足不同用户的需求。

玩法指南

第一步：登录Stable Audio 2.0的网址，使用谷歌邮箱或其他邮箱进行注册登录。然后点击“Try now”，进入操作页面。

第二步：输入提示词。由于提示词直接影响生成音乐的质量，因此，官方专门给了一个指导意见：细节越多越好；最好包含流派、描述性短语、乐器、情绪、节拍等要素。

例如，Cinematic, Soundtrack, Wild West, High Noon Shoot Out, Percussion, Whistles, Horses, Action Scene, SFX, Shaker, Guitar, Bass, Timpani, Strings, Tense, Climactic, Atmospheric, Moody（电影，配乐，狂野西部，正午射击，打击乐，哨子，马，动作场景，SFX，震动器，吉他，贝斯，定音鼓，弦乐，紧张，高潮，大气，情绪化）

例如，小编选择了pop（流行风格），系统自动输入提示词：Machine, Bass, Lush Synthesizer Pads, Synthesizer Arp, Synth Bass, Vocal Sample Chops, Percussion, Honest, Heart-Felt, Melancholic, Vibe, Cool, Modern, Atmospheric, 115 BPM。

第三步：调整各项参数。首先选择模型，系统默认最新Stable Audio 2.0版本。然后选择生成的音乐时长，最长不超过3分钟。最后点击“Generate”
小编重新输入一段提示词：Cinematic, Solo Piano, Emotional, Touching, Melancholic, Reflective, Sentimental, Simple, Sparse, Heartfelt, Poignant, Evocative, Haunting, Ethereal, Atmosphere（电影风格，钢琴独奏，情感的，感人的，忧郁的，反思的，感伤的，简单的，稀疏的，衷心的，尖锐的，唤起的，萦绕的，空灵的，气氛）

最终生成的音乐效果如下：

除了文生音频，Stable Audio 2.0 还可以实现音频生音频。

用户只需上传一段音频，再输入提示词即可。例如，小编上传了一段歌曲《若月亮没来》，并要求它改编成迪斯科风格：

最终生成的效果如下：

虽然保留着原曲的曲调，但改编之后的版本过于复杂，有些乐器似乎在打架，有种录音机没电了的感觉。

数据统计

Stableaudio音乐

文本直接生成20多种背景音乐。 Stable Audio 2.0 是一款由 Stability AI 开发的先进音频生成模型。

主要特点包括：

玩法指南

数据统计

相关导航

Anthropic

Trae

豆包

Coze扣子

Meshyai

Opencut

WPSAi

Hyper3d

一页标签

文本直接生成20多种背景音乐。
Stable Audio 2.0 是一款由 Stability AI 开发的先进音频生成模型。