学习说鲸鱼语

机器学习可以用来解码海洋哺乳动物的语言吗?
2023年3月21日

采访

汤姆Mustill

WHALE-AND_BABY.jpg

一头座头鲸和它的幼鲸

分享

所有的谈话都集中在人类如何共同努力保护自然世界,但如果我们能问问受影响的动物自己呢?诚然,这听起来像是杜立特博士的观点,但随着机器学习和人工智能的突飞猛进,这真的像看起来那么荒谬吗?

威尔——作家玛丽·安妮·埃文斯,也许更广为人知的名字是乔治·艾略特,曾经写道:“动物是如此和蔼可亲的朋友,它们从不提问,也从不批评。”很长一段时间以来,我们一直认为动物缺乏一种适当复杂的语言来相互交流。但事实真的是这样吗?那么,有谁比《如何说鲸语》的作者汤姆·穆斯提尔(Tom Mustill)更适合问这个问题呢?从一个显而易见的问题开始——是否有可能定义一种非人类的语言?

汤姆:这是非常困难的,因为大多数对其他物种类语言行为的研究都集中在试图看看它们是否和我们的语言完全一样。被囚禁的黑猩猩或海豚能听懂人类的英语口语吗?但这些并不是寻找语言的方式,这些语言已经在其他人的思想中进化了,也不是感知世界的其他方式。你如何退一步思考其他物种的语言呢?鲸鱼会说些什么呢?很长一段时间来研究这个问题都非常非常困难。大多数研究的目的都是试图破译最简单的动物交流,比如草原土拨鼠的警报叫声。所以我们被困住了。我们有人类的感官,人类的大脑,人类的语言概念,人类的寿命,尤其是鲸鱼和海豚,你甚至不能很容易地去海里听它们说话。但现在我们有了录音设备,就像你现在给我录音的那种,你可以把它们做成防水的,你可以把它们扔进海里,在那里放上几年,记录下大量的对话,如果它们是动物之间的对话,你可以开始收集所谓的“大数据”。

Will -大数据是一个与我们生活中一些令人不安的部分联系在一起的术语。众所周知,它与密集的、有时甚至是邪恶的定向广告活动联系在一起。但是“大数据”这个词实际上指的是大数据,也就是说数据集大到需要特殊的算法来处理它。是的,它可以浏览你所有的上网历史,找到你最喜欢的洗发水,但它也可以做一些惊人的事情。说到解码语言……

Tom -大数据对于人类语言的机器翻译是必要的。你可能用过谷歌翻译。谷歌翻译的工作原理是利用巨大的数据,比如数百万甚至数十亿的数据点和交流,比如人类对话的转录,并在其中找到人类看不见的模式。有一个叫做嵌入的过程,在这个过程中,人工智能程序基本上会注意到你给它的数百万个对话中所有单词之间的关系,并将它们绘制成单词或语言其他元素的星系图,就像一种巨大的星图,但有数千个维度。这是人脑无法做到的。这个过程的迷人之处在于,当开发这个的计算机科学家让人工智能去做这件事时,它们可以将一种人类语言的模式与另一种人类语言相匹配,自然语言处理机器能够在不被告知它们正在处理这种语言的情况下在不被告知任何语言规则或任何指令的情况下在不被给予双向字典的情况下在人类语言之间进行翻译。所以如果你想破解另一种语言的密码,这是一个非常令人兴奋和有前途的工具。所以我们在海洋中的其他物种,像鲸鱼和海豚这样的海洋哺乳动物,科学家们现在正试图获得足够大的数据集,以便能够应用这些机器翻译系统,这些系统可以发现人类语言中隐藏的模式,并看看他们在海洋动物的交流中发现了什么模式。这并不意味着他们有自己的语言,但他们活得很长。它们的交流方式看起来非常复杂,非常重要它们利用这些交流来协调非常复杂的行为。 So it's quite promising that within the communications that we can hear, there is something like a language. Is it something like a language like our language? Who knows. How would you ask a sperm whale if it was wet? What if they have a totally different idea for group cohesion where there's no such thing as an individual? There's no real material culture in the sea where everything washes around all the time and you can't make fire and if you haven't got any hands, how do you explain the sort of possessions and things you might make? So maybe we could discover things that seem like languages, but they have such different patterns in them that there's no way of translating between them and our languages. But this is just the beginning.

因此,通过将正确的机器学习算法暴露于数十亿字节的音频数据中,我们可能能够发现构成语言基础的通信中的链接。但如果这是成功的,那么问题是否就会从我们如何与鲸鱼对话转变为我们为什么要与鲸鱼对话?与这些生物展开对话能帮助我们帮助它们吗?

汤姆:是的,我想确实可以。这就是很多科学家从事这项工作的原因,他们相信我们会保护与我们有关的东西。能够表达自己的情感和说话是人类真正珍视的东西。我们认为这对我们来说是很特别的,如果我们看到其他动物能做到这一点,这很明显表明它们有内心世界。如果我们能理解他们在谈论的事情,我们不仅会对他们更感同身受,更关心他们,而且还可能会让我们意识到一些我们没有意识到的问题。我们只能猜测,目前是什么人类活动让其他物种的生活变得艰难。但也许我们能做些什么来帮助他们帮助我们发现。我认为还有另一个因素,这也是为什么这个条约如此重要的原因。现在我们花费了数十亿美元试图在太空中寻找生命,试图去其他行星或我们自己的月球旅行。我们在粒子加速器和望远镜上花费了数十亿美元,寻找可能存在或不存在的亚原子粒子,寻找可能存在或不存在的行星和太阳系。 None of the things that they are investigating have a chance of going extinct within our lifetimes. The moon's going to be there, Mars is going to be there. Subatomic particles, whether or not they exist, are going to be there distant galaxies that have actually expired before the birth of our own. That is not going to change whether they're there. But swimming alongside us, we're in London right now. A few miles from here are potentially the only other conscious entities in the universe that we might ever have a chance of having a conversation with. And they are being hammered by the way we are treating them. So this is of the utmost importance. We might go to other solar systems, we might go to Mars. There is no evidence we're going to find somebody we could talk to. These are our cousins, our relatives here on Earth. And without treaties like this, we will live alongside them. They might go extinct and only in the future will we realize what we'd lost.

评论

添加注释