找回密码
 立即注册
查看: 998|回复: 1

[教程] 一个根据Spectrogram图像数据训练的Stable Diffusion模型,让我们用文本提示生成音乐

[复制链接]

3869

主题

36

回帖

4331

积分

管理员

积分
4331
发表于 2023-4-10 16:43:12 | 显示全部楼层 |阅读模式
想象一下,如果你能告诉机器学习模型 "用爵士萨克斯管演奏放克基调",它就会合成人工音乐!这就是我们的机器学习。实际上,你不需要想象,你可以直接使用它! 介绍一下RIFFUSION,一个根据Spectrogram图像数据训练的Stable Diffusion模型。这个想法很简单。




1.要挑选一个预先训练好的Stable Diffusion模型(Diffuse The Rest - a Hugging Face Space by huggingface-projects)就好了。
2.将大量的音乐及其文字描述转换成Spectrogram图像数据。
3.微调到Stable Diffusion模型。


在有了一个模型,可以根据其他谱图或文字提示预测新的谱图。只要将这些频谱图转换回音乐。




你现如果你想了解更多关于如何自己做的细节,你可以按照这里的流程:https://www.riffusion.com/about



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

3869

主题

36

回帖

4331

积分

管理员

积分
4331
 楼主| 发表于 2023-4-10 20:03:45 | 显示全部楼层

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|金房子

GMT+8, 2024-12-22 21:23 , Processed in 0.048474 second(s), 22 queries .

© 2023 金房子|AI发烧友社区

快速回复 返回顶部 返回列表