新浪体育 综合体育

AI在辩论赛上击败人类高手 语言表达能力是硬伤

新浪体育

关注

文章来源:量子位公众号

郭一璞 岳排槐 发自 凹非寺
       量子位 出品 | 公众号 QbitAI

人类再一次被自己创造的AI击败了。

在旧金山的一间精心装潢的IBM会议室里,一块竖着的黑色电子面板正在台上侃侃而谈。

它大约有1米8高,一人宽,长着蓝色的动画嘴巴,看起来就像一块造型特异的广告屏幕。

它发出流利的女声,声音中充满自信。虽然说话有些磕磕绊绊,但它所讲的内容却不无道理,仿佛是一位学识丰富但口舌结巴的教授。

而它的身边则是再正常不过的人类辩论手,用自己人类的思考和语言表达、配合肢体动作来阐述观点。

正在进行的是一场AI与人类的辩论赛。

这块黑色面板背后的“灵魂”是IBM的人工智能Project Debater,IBM的研究员们正在台下紧张得注视着自己的作品。

人机辩论大战

这天的比赛分为两场,Project Debater分别对阵两位人类辩手。比赛的规则是1v1,人机双方各有4分钟的陈述时间和4分钟的驳论时间,以及最后2分钟的总结时间。

随后,将根据在场观众的立场是否改变而判断输赢。

第一场的题目是“我们是否应当资助太空探索”,Project Debater为正方,而反方则是2016年以色列全国辩论冠军Noa Ovadia。

Project Debater认为,太空探索对人类有益,能够促进科学研究,并且激励年轻人的的自我思考与自我超越。

Noa Ovadia则认为,政府经费应当被合理利用,除了探索太空之外,还有太多领域需要政府提供资金支持,并且,不需要飞上太空,地面上的科学研究同样十分重要。

而Project Debater听完之后则作出了反驳,它认为太空探索带来的潜在技术和经济利益超过其他政府支出。

第二场议题则是“我们是否应当更多地使用远程医疗”,Project Debater依然是正方,另一位以色列辩论专家Dan Zafrir为反方。

Project Debater在语言表达方面显然输给了旁边的真人,但它传递的信息量则高出了人类。在两场辩论中,观众们都投票表示同意这一点。

至于辩论的结果,从观众的投票中可以看出,相比人类,人工智能辩手Project Debater提供了更多有利的证据,更具说服力。可以说,这是人类输给AI的第一场辩论赛。

尽管赢得了辩论赛,但Project Debater的语言表达能力的确是个硬伤。

比如,在第一场辩论“我们是否应当资助太空探索”中,Project Debater提出了重要的论点:探索太空有利于经济发展。

但是,在表达过程中,它却啰啰嗦嗦,用不同的语句把这个观点重复了许多次,仿佛一个AI版的唐僧。

另外,Project Debater说出的许多话其实都是有语病的,经常会出现一句话的前后两部分不搭调的情况。

除此之外,在抖机灵和引用资料的时候,Project Debater也过于刻意了。

比如,在太空探索话题的辩论中,它引用著名宇航员斯科特·凯利的发言时,Project Debater说了一句“配音”,之后,它竟然开始播放视频中斯科特·凯利讲话的录音——这恐怕不是什么正经辩手。

现场直击

那么和人工智能辩论,实际是一种怎样的体验?

说一千道一万,不如直接感受一下。下面是我们截取的现场视频,只有30秒时间,先是AI结语,然后人类开始发言。

从这段视频来看,Project Debater的声音,还是常见的合成声,有明显的,嗯……机器人口音。听久了可能有种催眠的感觉。

而人类选手一开口,立刻就能感到不同。

人类选手Noa Ovadia的音调更加的抑扬顿挫,而且她还有着机器无法比拟的优势:有表情、有动作,能传递更丰富的信息。

尽管如此,AI还是拿下一局,不是么?

会辩论的AI有什么用

虽然“舌头”不灵活,不过好在Project Debater在辩论中表达的信息量大呀,这对查资料困难症来说的确是福音了。

这有赖于IBM让Project Debater具备了数据驱动的写作能力、语音表达能力、以及听取语音并提炼要点、确定反驳论点的能力。

Project Debater具有非常强大的数据处理能力,能够处理几十个主题相关的数百万篇新闻,然后将文章中的要点片段提取出来,重新组合润色成为流畅的文章。处理海量数据可能不是最难的,但对于计算机来说,这种水平的资料查询整理及写作能力已经是难能可贵的了。

Project Debater的这种能力扩展了IBM超级计算机Watson的功能,IBM正在用它来挖掘庞大的内部数据集——比如帮助医生诊断不同类型的癌症。

其实,除了处理数据和打辩论赛,IBM的这项研究最初是为了制造出更为复杂的虚拟助理——毕竟,当你在使用目前的语音助理Siri、Alexa或是小爱同学的时候,总觉得它们前言不搭后语,且无法完成什么复杂的思考和任务。

语音助理可能暂时还没有面世,但Project Debater的“思考判断”能力却能够为人类社会所用。

比如,当人类在进行企业决策或反恐分析时,往往会存在多个选择,比如是否应该开展某项新业务、某个人是否构成安全威胁等。

而决策团队成员在开会讨论时,由于受到利益、情绪、立场和思维方式的影响,经常会出现一些互相矛盾的观点,这就很容易争个没完没了,甚至吵得不可开交。

Project Debater就不一样了,它可以不受感情因素和情绪的困扰,“理性”的听取所有成员的对话,将所有证据和论据都考虑进去来进行判断。

并且,如果人类的分析逻辑出现问题,Project Debater会diss你呦。

外界评论

谈到这次的人机辩论,不少报道都用了“令人印象深刻”、“里程碑”、“令人不安”甚至“毛骨悚然”等形容词。

连Project Debater的人类对手都表示“震惊”。

每当这样的时刻,总有人特别关心人类的终极命运。当然和之前一样,也有人指责这又是一次IBM的过度营销。

Reddit用户TaupeRanger言辞激烈的表示:如果Project Debater真能做到IBM所说的事情,那是史无前例的进步。但IBM历史上常见毫无价值的技术哗众取宠,这次也不例外。

的确,曾经IBM也有过很多令人印象深刻的技术展示。

比如当年深蓝击败国际象棋大师卡斯帕罗夫,沃森在《Jeopardy!》问答节目中,击败人类高手等等。当然也确实有一些夸大的时候。

去年5月,风险投资公司Social Capital创始人、首席执行官Chamath Palihapitiya在CNBC节目《Closing Bell》中直言IBM在人工智能上毫无优势:“我就说白了吧,沃森就是个笑话”。

其实也不仅仅是IBM。

DeepMind也是一个非常善于宣传造势的公司。只不过,DeepMind的AlphaGo确实取得了实打实的惊人成就。

前不久,Google展示了一个能打预订电话的人工智能:Google Duplex。而且新任Alphabet董事长,宣称这个AI已经在特定领域,通过了图灵测试。显然,这也引发了一波外界的质疑。

PlaceIQ高级副总裁Drew Breunig认同辩论AI是一个有意义且值得重视的想法,但他担心Project Debater展示过程中的误导和不公正。

还有用户说:我就想知道,IBM团队花了多久时间,才说服他们自己,给这个AI起了一个普通的名字~

总会有质疑,路漫漫且修远。

正如IBM所说:辩论,只是一个开始。

问答Project Debater

1、目标是什么?

Project Debater是由IBM Research开发的一项AI技术,旨在通过公正的辩论来扩展人们的思维。 IBM研究人员正在通过教授计算机来探索人工智能的界限,以创造引人入胜且信息更加丰富的观点。

这个项目的目标是建立一个系统,帮助人们在答案不是非黑即白时,作出基于证据的决定。 Project Debater从2012年开始研发,是深蓝和沃森之后,IBM在AI领域的下一个里程碑。

2、和AI助手有什么区别?

AI助手在一些任务上已经非常在行。而Project Debater希望通过AI技术形成长篇讨论,并就各种没有正确或错误答案的主题,提供公正的论点。

3、为什么教机器辩论?

从文化上讲,辩论的起源不是冲突和竞争,而是民主和讨论。辩论丰富了决策制定的过程,帮助人们权衡新想法、新理念的利弊。辩论是文明社会的核心。我们辩论不只是为了获得他人的认同,也是为了理解和学习彼此的观点。未来,我们相信机器可以帮助人类更好的做决定。

4、Project Debater如何学会一个话题?

实际上,它没有学会某一话题,但是能够可用数据,快速创建一个有说服力的论述。这个系统被训练用来讨论不熟悉的话题,只要语料库中有大量的相关内容。

5、它的论点是怎么形成的?

对于给定的主题,这个AI系统会搜索大量的知识,寻找最相关的观点和证据,然后在其中选择最吸引人、最多样化、支持度最高的论点,然后把这些构建成一个完整的观点加以叙述。

更多关于Project Debater问答,可以前往这个页面查看。

传送门:http://t.cn/RBDUR2e

加载中...