简介:
MuseNet是由OpenAI开发的一款人工智能音乐生成工具。它基于深度神经网络,使用从互联网上获取的数据进行训练,使其能够在很长一段时间内评估音乐。MuseNet使用与OpenAI的GPT-2语言模型Sparse Transformer相同的通用无监督技术。该变换器允许MuseNet根据给定的音符组预测下一个音符。
MuseNet有以下功能:
使用四种不同的乐器,结合不同的风格,如莫扎特或Lady Gaga,制作四分钟的音乐作品。
通过学习大量的MIDI文件来预测下一个音符,从而生成和声、节奏和风格的模式。
使用通用无监督技术GPT-2.这是一种可以训练预测音频或文本序列的大型变压器模型。
从互联网上收集各种音频源作为训练数据,包括Classicages和BitMidi服务提供的大量MIDI文件,以及流行、非洲、印度、阿拉伯和其他风格的音乐。
通过各种实验,找到了最具表现力和简洁的编码方法,将音高、音量和乐器信息组合成一个令牌。
在训练期间,通过提高或降低音高来替换音符,并且通过增加或降低每个样本的总音量来增强音量效果。
创建了一个批评者,在模型训练期间不断查询模型,以查看给定样本是来自真实数据集还是过去模型的结果。批评者将给出样本的分数。当MuseNet生成输出时,它将根据此分数选择样本。
添加了几个嵌入,允许模型为歌曲添加各种功能,包括和弦或音乐长度。
创建了作曲家和乐器令牌,允许用户轻松控制MuseNet样本类别。在训练期间,这些训练器和仪器标记被添加到每个样本中,因此模型可以基于该信息预测笔记。在构建阶段,模型基于用户指定的作曲家和乐器执行音符预测。
因为MuseNet有很多不同的音乐风格,所以也可以将不同的风格与新的混合方式融合在一起。
总的来说,MuseNet是一款功能强大的AI音乐生成工具,具有很高的创造性和灵活性,能够帮助音乐创作者激发灵感和创作出新的作品。