做一个会说话的机器人

目前,个人助理机器人还不是最健谈的,但剑桥大学的一位科学家希望改变这种状况。
2016年3月24日

采访

Milica博士Gašic,剑桥大学

目前,个人助理机器人不是最健谈的,但有一位科学家说机器人医生剑桥大学希望改变这种状况。格雷哈·杰克逊去见米利卡·Ga了?伊奇想知道她是如何制作一个系统的,这个系统可以让我们与机器人对话……

Milica——你可能都听说过iphone或其他个人系统上的Siri,但这些系统可以更广泛地应用于银行等场合,或者可以用于为老年人提供医疗信息。这些系统通常有三个组成部分。第一个组成部分被称为言语理解,即试图从言语中提取意义。第二个组成部分被称为管理拨号,试图决定什么是最好的回应,或者我们称之为行动,对用户说,然后最后一个组成部分将这个回应生成语音。

Graihagh -这些都不是小事。把语言转换成文本,理解它,然后决定什么是最好的行动,然后把文本转换回语言——这是相当复杂的,尤其是中间的理解和行动的步骤。

目前,像Siri和谷歌这样的系统都是按照一系列规则运行的。有人真的坐下来,思考了所有你可能想要问你的智能手机的事情,把它写进代码,然后——瞧!听起来很漫长……

Milica -现在这显然是次优的,因为人类不能想到所有可能的情况,而且开发这样的系统非常昂贵,所以我们正在做的是尝试使用机器学习来解决这个问题,并使系统更好。

Graihagh -你说的机器学习是什么意思?你是真的坐在电脑前说这是X,这是Y吗?

蜜莉卡:不完全是。机器学习的概念是,机器可以分析数据,然后尝试建立一个模型,然后根据这个模型做出预测。所以预测可以是用户想要的,也可以是系统应该对用户说的话。一种特殊的机器学习方法对于构建对话系统非常有用,它是基于强化学习的,而强化学习就是关于试错的。在机器学习中,我们通常有两种学习方式。一种是监督式学习,你可以把它想象成你有一个老师在教你。老师教你怎么做,然后你试着模仿老师,做得和老师一样好。强化学习是非常不同的。在强化学习中,你探索不同的可能性。你没有老师,但是你有父母,他们会根据你所做的和你做得好的事情偶尔给你奖励。 In similar ways like children are trying to get as many presents from their parents, the system is also trying to maximise its reward and, indeed, many reinforcement algorithms were inspired from nature and how biological systems learn.

Graihagh -你让我想到孩子们想要吃的。我的意思是,对于机器来说,是否有巧克力的等效物?

米利卡:哦,当然!奖励是数字的,相当于一块巧克力。

说到食物,我们决定拨打对话系统,寻找午餐

克丽丝:你想吃什么?

Milica -你好,我在找市中心的一家中国餐馆。

香港融合是一个不错的地方-它提供中国菜。

米利卡-它在中心吗?

香港融合是一个好地方。他们的地址是市中心燃烧器街21号。

你能告诉我他们的电话号码吗?

香港融合是一个好地方。他们的电话号码是01223 355 909。

米利卡-谢谢。再见。

克里斯-谢谢。再见。

Graihagh -你可以很容易地看到这一点。这个对话有你所问问题的背景。因此,从这个对话中,它可以学习每次有人打电话要求特定的食物(无论是中国菜还是披萨),但是它将从这个对话中学习什么,或者它将如何从这个对话中学习?

Milica:所以,有时会要求别人输入他们的反馈。其他时候,它试着自己估计反馈,然后它试着分析它采取了什么行动,得到了什么反馈。它想要最大化的一件事是成功的机会。当它提供了用户所要求的所有信息时,它就被认为是一个成功的对话,但这并不是它试图优化的唯一组件。它还试图在尽可能少的回合中提供尽可能多的信息,因为用户通常不喜欢一直呆在对话系统上。因此,它试图调整自己的行动,使这两个目标最优化。

Graihagh -所以它几乎消失并反射?不像人类;这次谈话的好处和坏处是什么。

米利卡:没错,这是一个很好的对比。

Graihagh -那么在未来,你认为这种情况会比仅仅在市中心点中餐更广泛吗?

蜜莉卡:是的。我的目标是建立一个更丰富的对话模型。特别是,我的一个想法是建立一个对话系统,可以用来预防心理健康疾病,这个想法是建立一个对话系统,每个人都可以在他们的手机上访问,无论何时他们喜欢,无论何时他们有问题,他们都可以得到匿名的即时支持。所以我认为这肯定会产生巨大的影响,而且从科学的角度来看,这些对话将会更加丰富,这样就不会是点中国菜,而是试图模拟真实的对话。

评论

添加注释