Stableaudio音乐

5天前更新 0 0

一种基于稳定扩散技术的音频生成模型,它能够根据文本提示高效生成高品质的音频内容。

所在地:
美国
收录时间:
2025-03-30
Stableaudio音乐Stableaudio音乐
Stableaudio音乐
广告也精彩

文本直接生成20多种背景音乐。
Stable Audio 2.0 是一款由 Stability AI 开发的先进音频生成模型。

这个模型能够根据文本提示或上传的音频样本,生成高质量、长达三分钟的音乐作品,且支持多种音乐风格,如摇滚、爵士、电子、嘻哈等。

Stableaudio音乐

主要特点包括:

1.高质量音乐生成:Stable Audio 2.0 可以生成44.1kHz高保真的音乐作品,这些作品具有完整的结构,包括引子、发展和尾声,以及立体声音效。

2.音频到音频的转换:这个模型允许用户上传音频样本,并通过自然语言提示将这些样本转化为不同的声音。

3.高效的生成速度:与前一版本相比,Stable Audio 2.0 显著提升了音乐生成的效率,平均1分钟左右即可完成一首3分钟音乐作品的生成。

4.大规模数据集训练:模型使用了超过80万个音频文件和1.95万小时的音频数据进行训练,确保生成的音乐具有丰富的细节和真实感。

5.商业化应用支持:与知名音乐服务商 AudioSparx 合作,Stable Audio 2.0 生成的音乐可用于商业用途,适用于视频自媒体用户和商业广告制作。

6.多样化的输出格式:生成的音乐支持多种格式下载,包括 MP3、WAV 和 Video,满足不同用户的需求。

玩法指南

第一步:登录Stable Audio 2.0的网址,使用谷歌邮箱或其他邮箱进行注册登录。然后点击“Try now”,进入操作页面。

第二步:输入提示词。由于提示词直接影响生成音乐的质量,因此,官方专门给了一个指导意见:细节越多越好;最好包含流派、描述性短语、乐器、情绪、节拍等要素。

例如,Cinematic, Soundtrack, Wild West, High Noon Shoot Out, Percussion, Whistles, Horses, Action Scene, SFX, Shaker, Guitar, Bass, Timpani, Strings, Tense, Climactic, Atmospheric, Moody(电影,配乐,狂野西部,正午射击,打击乐,哨子,马,动作场景,SFX,震动器,吉他,贝斯,定音鼓,弦乐,紧张,高潮,大气,情绪化)

例如,小编选择了pop(流行风格),系统自动输入提示词:Machine, Bass, Lush Synthesizer Pads, Synthesizer Arp, Synth Bass, Vocal Sample Chops, Percussion, Honest, Heart-Felt, Melancholic, Vibe, Cool, Modern, Atmospheric, 115 BPM。

第三步:调整各项参数。首先选择模型,系统默认最新Stable Audio 2.0版本。然后选择生成的音乐时长,最长不超过3分钟。最后点击“Generate”
小编重新输入一段提示词:Cinematic, Solo Piano, Emotional, Touching, Melancholic, Reflective, Sentimental, Simple, Sparse, Heartfelt, Poignant, Evocative, Haunting, Ethereal, Atmosphere(电影风格,钢琴独奏,情感的,感人的,忧郁的,反思的,感伤的,简单的,稀疏的,衷心的,尖锐的,唤起的,萦绕的,空灵的,气氛)

最终生成的音乐效果如下:

除了文生音频,Stable Audio 2.0 还可以实现音频生音频。

用户只需上传一段音频,再输入提示词即可。例如,小编上传了一段歌曲《若月亮没来》,并要求它改编成迪斯科风格:

最终生成的效果如下:

虽然保留着原曲的曲调,但改编之后的版本过于复杂,有些乐器似乎在打架,有种录音机没电了的感觉。

 

广告也精彩

数据统计

相关导航