触景无限 | 前端智能感知全球引领者

Menu

新闻资讯 > 新闻详情

人机大战“辩论赛”:IBM的AI选手战胜人类辩论冠军

日前,IBM 公司发布了被称为Project Debater的人工智能系统,这个系统与经验丰富的人类辩手之间举行了两场辩论,以展示它已经拥有的强大能力。

Debater在两次辩论中均获胜

Project Debater亮相在IBM位于旧金山办公室的包装舞台上,该系统内嵌有一个6英尺高的黑色面板,并带有一个蓝色动态“嘴巴”。这是人类辩论者Noa Ovadia和Dan Zafrir的最强大对手,它站在附近的领奖台后面。

几年来,IBM一直在公司内部进行人类与 Project Debater 之间的辩论,这次演示是首次公开辩论。虽然 Debater 在短时间内收集了大量支持其论点的证据,但是有时候的答辩会超出边际,偶尔也会表达错误。虽然机器在很多方面都表现地不太自然和磕绊,但这场史无前例的事件让人想起了计算机如何学习如何应对非结构化的人类决策世界,代表着对话式人工智能向前迈出了一步。

对于两次短暂的辩论,参与者必须准备一份四分钟的开幕词,然后是四分钟的反驳和两分钟论证总结。开幕辩论的主题是“我们应该资助太空探索”,其次是“我们应该扩大远程医疗的应用”。

Debater 的设计目的是分析单个辩论问题,然后扫描众多文档(从维基百科到杂志和新闻文章)中的数十亿个句子,以形成自己的论点、准备反驳对方观点的陈词以及总结陈词。

Debater 与人类对手分别有 4 分钟时间陈述自己的论点,4 分钟时间反驳对方的论点,2 分钟时间做总结陈词。与站在讲台后面的人类辩手不同,代表Debater 的是一个跟人一样高的黑色方尖碑,当显示 3 个圆点时就表示它在倾听或者准备论点。

该程序严格遵守辩论形式,概述论点,并通过从科学研究和全球事件中获取的事实来直接回应人类对手提出的论点。Debater 还一度比较准确地指出了对手所犯的事实错误。尽管这一举动在政治辩论中很常见,但是因为这是人工智能系统做出的应对,所以显得弥足珍贵。

在这两场辩论中,观众们都投票赞成票给Project Debater系统,其在传达的信息量方面表现更好。尽管AI系统出现了一些失误,但观众们在第二场辩论中投票认为AI系统在说服观众立场方面,比其人类对手Zafrir更具说服力。

机器以自信的节奏、有组织的结构发言,但缺乏语言精确度和议论清晰度。例如,在太空辩论期间,它几次重复了空间探索对经济有利的因素,使用的语言略有不同。在其他时候,AI系统以不自然的方式插入了随机语和引语。有一次,AI系统提到宇航员Scott Kelly,然后说“配音”,表明这部分论点是从视频记录中提取的。如果没有手势(好,完全没有双手)或面部表情,观众在听过机器人辩论者时仍然难以保持联系和交流。

AI的辩论能力经过六年研发

不过值得注意的是,有很多IBM员工可能一直在为他们的创作提供支持。IBM希望这项研究最终能够使一个更复杂的虚拟助理能够吸收大量不同的信息集合,以帮助建立有说服力的论点并作出明智的决定——不仅仅是回应简单的问题和命令。Project Debater是IBM处理非常大型数据集的能力的展示,其中包括几十个主题的数百万篇新闻文章,然后将论点片断变成流畅的文章——这是计算机的一项挑战性任务。

该公司已经花费了6年的时间来开发Project Debater的辩论能力,包括数据驱动的演讲能力,在演讲中识别关键声明的听力理解以及制定原则性论据的能力。它扩展了IBM超级计算机Watson的功能,公司正在使用它来挖掘庞大的内部数据集,包括帮助医生诊断不同类型的癌症。

近70年来,人工智能系统在一定程度上是通过学习西洋跳棋和国际象棋等游戏而发展起来的。1997年,IBM的深蓝程序在国际象棋中击败加里卡斯帕罗夫(Gary Kasparov );2011 年,IBM Watson 在《危险边缘》(Jeopardy)比赛中取胜。几年后,Google 的 Alpha Go 打败了顶级围棋冠军;一个名为Libratus的程序击败了全球四大顶级扑克玩家。而这次里程碑式的辩论发生在人与机器之间的多次相似的对决之后。

用语言和推理来辩论是一个更加复杂的游戏。“国际象棋的规则很少。即使对于更为复杂的围棋来说,我们仍然在谈论一个非常有限和明确界定的空间”。参加辩论的邓迪大学技术中心教授Chris Reed说。“对语言而言,它不是那么明确。”他说。“关于什么构成转折和游戏规则,灵活性更大。”

一旦人工智能具有说服力的论点,就可以将其用作辅助人类决策的工具。

IBM 负责AI的副总裁 Dario Gil 接受《财富》采访时表示,“这一计划的挑战在于脱离传统的游戏环境,尽管游戏可能很复杂,但你最终处在一个独立封闭的体系中。有一些规则需要遵守。将人工智能引入一个开放性问题领域非常有趣。问题是这能否实现?”

2012 年,Slonim 和其他研究人员开始开发 Debater,并在第二年 10 月得到了一个早期的工作原型。要取得成功,Debater 需要完成三项基本任务,每项任务都标志着人工智能领域的新突破,这包括:识别口语中的重要概念和观点;理解大量文档并提取明确的论点;以及模拟人类的困境和争议,来创建有原则的论点。

例如,Gil 表示,如果 Debater 正在准备一场赞成素食主义的辩论,它可能会从与该主题没有明确关联的内容中提取一个论点,比如一项科学研究表明动物可以感受到恐惧和其他情绪。人工智能系统还需要消除多余的词汇,并以对人类有说服力的方式提出其论点。

IBM 在 Debater 中的首要目标之一就是帮助人工智能系统掌握人类语言。诸如 Dragon 之类的语音听写程序只是被动地在文本和语音之间转录语言,而不进行分析。而诸如 Alexa 之类、受语音驱动的人工智能助手只能进行有限的交流,通常只会持续几秒钟。但 Debater 是要构建一个可能持续几分钟的论点,然后做出它的回应。

Gil 表示,IBM 计划适时将 Debater 投入商用。该技术可应用于从教育到法律、从政府到企业等多种领域。销售团队和辩护律师可以通过能够进行辩论的人工智能系统来巩固他们的观点,而研究人员和决策者可以从 Debater 产生的赞成和反对意见中受益。

Slonim 表示,另一种潜在的应用可能是,检查有多少证据(如果有)支持虚假主张,并揭示这些证据的可信度,借此来处理虚假新闻。他表示,“毫无疑问,我们正在开发的基础技术将对打击虚假新闻大有用处。”

Debater的未来:巨大的用途

除此之外,IBM 希望继续开发人工智能系统,推动 Project Debater 实现更加伟大的成就。

“IBM研究部门主管Arvind Krishna说:”我们相信人工智能具有很好的可以理解我们人类的巨大潜力。

其中一个例子可能是企业董事会决策,其中存在很多相互矛盾的观点。AI系统可以毫无情绪地倾听对话,将所有的证据和论据都考虑进去,并在必要时挑战人类的推理。“这可以提高以证据为基础的决策水平”。Reed说,他还补充,同样的系统可以用于反恐情报分析,例如确定某个人是否构成威胁。

在这两种情况下,机器都不会做出决定,但会有助于讨论,并作为另一位发言者。尽管辩论看起来像是一个噱头,但Reed认为这是对人工智能极限的重要证明。

“它有助于公众了解AI技术的最新状态,这意味着即将发生的机器人启示的恐慌可能会稍微缓和一些。”他说。

(选自:theguardian 编译:网易智能 参与:nariiy)

来源:网易智能