机器学习如何生成音乐

电脑是否开始扭转局面,自己也变得有创造力了?
12月15日

采访

Rebecca Fiebrink,伦敦艺术大学

COMPUTER_NETWORK

一个程式化的计算机网络。

分享

到目前为止,我们已经听说了计算机如何分析和激发创造力;但他们是否开始扭转局面,自己也变得有创造力了呢?“创意计算”领域仅在过去几年就取得了长足的进步——至少创意计算专家丽贝卡·费布林克是这样认为的。她告诉菲尔·桑索姆,音乐的可能性之大,会让可怜的贝多芬头晕目眩。

丽贝卡——我想他会大吃一惊的。很明显,电脑不仅能让我们播放音乐;它们允许我们录制音乐,允许我们作曲,并使用越来越有趣的算法在计算机中处理和生成音乐。

菲尔-真的吗?一个算法真的可以生成音乐?

丽贝卡:嗯,这取决于你对音乐的定义,但我认为我们已经非常接近了——如果还没有成功的话——用计算机算法生成人们可以识别为音乐的声音模式,在某些情况下甚至是非常令人愉快的音乐。

菲尔:你说的是机器学习,对吗?

丽贝卡:没错。机器学习是一套计算技术,用于发现数据中的模式,然后生成包含类似模式的新数据。

菲尔-他们在音乐中寻找什么?是哪个音符接哪个音符,还是别的什么?

丽贝卡:这取决于你使用什么样的机器学习和你使用什么样的音乐表示。在音乐中使用机器学习的一种常见方法是将音乐视为一段时间内的音符序列。这并不是对所有的音乐都适用,但如果你想让电脑听一首流行歌曲或民谣的旋律,那其实还不错。目前的一些机器学习技术在去年左右刚刚问世,已经成功地使用了一种不同的音乐表示,更像是你在手机上存储一段录音以便听它时使用的音乐表示。音乐的表现形式要复杂得多,对吧?你不仅仅是在捕捉音符在演奏的时间,你还在捕捉乐器,音量,织体的信息;就像钢琴的声音,鼓的声音,或者歌手的声音。

你提到的最后一个让我很困惑。它真的能捕捉到歌手的声音吗?它能像真正的歌手一样重现歌手吗?

丽贝卡:当然。即使在五年前,我也不一定会相信这一点,但机器学习技术发展得如此之快。今年4月,一家名为OpenAI的公司推出了…它叫Jukebox。我听到的第一个例子是一首歌;我用这个词很随意,但这是一首以弗兰克·辛纳屈风格演唱的新歌,名叫……我想应该是"热浴盆圣诞节"

菲尔:我们现在可以听一听吗?

丽贝卡:当然。

菲尔:哇。

丽贝卡:太搞笑了!这首歌很及时,很有趣;我现在就把它放到我的圣诞歌单里。听起来像辛纳屈。

菲尔:你是说那些不是取自辛纳屈不同歌曲的歌词样本;这些是它模仿弗兰克·辛纳屈产生的真实声音片段。

丽贝卡:没错。

菲尔-这对我来说太疯狂了。

丽贝卡:这太疯狂了。公平地说,这个算法也没有完成歌词的工作。研究人员和他们的歌词生成系统决定,“哦,这将是一个有趣的新弗兰克辛纳屈歌曲的歌词”。

菲尔——我是说,房间里的大象:背景音乐听起来像闹鬼的游乐场。

丽贝卡:是的,是的。这是这种类型的音乐生成算法的局限性。开发这个系统的OpenAI人员用了一些聪明的技巧来弄清楚我们如何才能做到这一点。其中一个技巧是在生成的音乐片段中加入一些噪音;这听起来有点像背景噪音,就像你从一张老唱片里听到的;有些会发生一些奇怪的事情;你听到的音调……事情听起来可能不完全一致。

Phil -有了无限的计算资源,你认为他们能基本上重现我们所熟悉和喜爱的现代音乐吗?还是说,算法想要发挥创造力,制作新音乐,还有更根本的限制?

丽贝卡:我绝对相信这些技术在接下来的几年里会变得越来越好,接近我们期望从真正的音乐家的录音中得到的那种质量。我仍然认为有几件事是很大的障碍。其中一个障碍是,从长期结构来看,很难创作出听起来可信的音乐。辛纳屈的歌很可能有主歌和副歌;当你看古典音乐的时候,你会看到更复杂的结构,比如交响乐,第一乐章的一个主题可能会以一种不同的方式在作品的结尾重新出现。这些系统现在还没有能力表示或生成那种规模的结构。另一个很大的障碍是这些系统往往很难被人们控制。你可以点击重做,让它重新做一遍,然后想出一些不同的东西,因为这些系统中存在随机性;但如果你说,“你知道吗,我真的希望这首歌更活泼一点,”或者,“我希望这首歌有一个不同的音调,”或者,“我希望这首歌里有一个小号,”对吧?如果你把它看作是一种制作新音乐的工具,那么人类想要做的事情有很多。

评论

添加注释