IBM沃森:用于真实世界的人工智能

IBM的人工智能计算平台,沃森,已经吸引了一个由开发者和使用者组成的生态系统,他们正在自己的技术顶层铺设这项技术,让它更加智能。本文介绍沃森最新进展,以及IBM是如何保证沃森不会变成HAL的。

计算机很笨。

开发者写下几百万行代码,告诉计算机如何去做每一件简单的小事。这种层面的实践已经被沃森颠覆。IBM的认知计算平台不是通过编程来做事情,而是通过编程来学东西。

「这是计算的第三个纪元,」沃森生态系统技术负责人Steven Abrams在Information Week(信息周刊)的一个访谈中说到。第一阶段是依靠穿孔卡片计算机的机械计算。第二个阶段是我们今天使用的输入/输出存储的编程系统。

「我们现在对系统进行的是训练和指导,而非编程,」Abrams 解释到,「站在一个开发者的角度,你得学会教计算机怎么做。」

「我没有在那个领域编程,无法做出回答。」

许多科幻类电视剧和电影中的机器人或计算机会使用这种陈词滥调来回答意外情况下的提问。

这是一个好的出发点,理解如何为沃森平台编程应用程序。

「你可以通过提问来调试沃森系统,比如『我们给了它正确数据吗?』」Abrams说。「数据和测试足够完整吗?」

开发者有一整套数据集合,他们能够通过30多个应用程序接口中的1个来「填饱」沃森。有些应用程序借口是基于XML或JSON格式的。熟悉这些格式的开发者知道如何与沃森互动,他解释说。

Abrams拿癌症研究举例。一位人类医生在进入医学院之前要接受16年的教育,而这之后,他/她仍然要在通过医师实习期和临床实习期之后才能行医。过了这道门槛,「人类医生」还需要经过几十年的实践才能成为一个合格的癌症专家。沃森可能需要2-5年的「学习」就能够达到和「人类医生」一样博学的程度。

所学领域的复杂程度决定沃森会用多长时间来学习。

沃森的一大优点是自然语言处理——当语言欠缺准确性,或当相似的词用来形容同一个物品时,处理这类问题的能力。这个能力可以用来理解用户的意图,Abrams解释说。「如果这些词有相同的地方,那么,其他词汇预示着什么相同意图呢?」

答案很复杂。

「训练沃森的过程是从不确定到确定,从低准确率到高准确率,」Abrams补充到。总的来说,一个沃森驱动系统要倾向于从犯错误到少犯错误。但这也是模式的转换,他强调说,因为程序员必须把他们对计算机的思考方式,从以决定性为基础变为以可能性为基础。如果沃森对信息的准确性有信心,它就会回答,反之,如果不确定这个答案是否正确,它就会保持沉默。

训练计算机学习新技能

有两家公司正在试验基于沃森的应用,一家是Ampsy,它提供了一个分析社交媒体品牌出现率的平台;另一家是SparkCognition,它提供安全分析。

Ampsy公司在音乐和娱乐产业涉足很多。公司的创始人兼CEO,Jeremy Gocke,在一次采访中表示,「我们认为我们意识到的所有震撼内容…背后有很多数据。」

Gocke认为沃森和Ampsy分析平台自然搭配,旨在发现和记录实时活动中所有分享和发布社交内容的人。

Gocke举出AC/DC音乐会这个例子。每个音乐会的举办地点会使用GPS进行地理限制。系统能掌握指定范围内用户的社交内容——甚至都不需要标签。然后,某个旅游网站会分享所有的社交媒体发布内容。收集粉丝对音乐会各个部分喜好度的发布率的数据。通过沃森驱动的分析,能识别出那些「超级粉丝」,据此,他就能获取免费后台通道,在音乐会结束后与乐队会面。

在大项活动中,通过使用沃森图像API,结合品牌图像识别,沃森表现更佳。在这种情况下,沃森能学会比对商标数据库,「识别」品牌的名字或者商标。

Gocke谈到,「品牌正在超越品牌本身,品牌正在变成体验。」最终,一个品牌的产品可能融入一项活动,这样任何参加活动的人都能展示出对该品牌的喜爱,或者品牌能显示出对大众的喜爱。

单靠这个分析平台,Amspy是不可能推出这种体验的,也不可能使人们给予同样的评价。Gocke表示,只有沃森能满足整理输入大量数据的挑战,能得出这种结果。

同时,SparkCognition正在使用人工智能作为SparkSecure产品的差异化因素。SparkSecure是一个安全事件和事故管理平台(SEIM),它的底层是「认知洞见」,可以规模化系统,它在相同时间内能超过人类安全分析师。SparkSecure能根据已知的操作和使用类型,发现可疑人。挑战在于吸收所有数据,绘制出IT场景。

公司的创始人兼CEO,Amir Husain在采访中称,「在提供数据时,这些算法会根据内部机制建立模型。」

「把沃森纳入SparkSecure的咨询师,可以处理更多数据,用以绘制公司的IT场景。这样,沃森允许终端用户知道发生的问题并作出相应处理。」

安保是无穷无尽的矛盾体系,道高一尺魔高一丈。坏蛋搞出新的入侵技术,好家伙就相应地发明防卫技术。在坏蛋发明新的入侵技术之前,防卫技术就占据优势。结果是,「我们不断给沃森增加新内容,」Husain谈到,「我们生活在不断变化的动态场景中。」

沃森的威力又一次得到了体现:规模化,自然语言处理,以及弹性学习能力。Husain称,假设没有沃森,SparkCognition的开发者就不得不无止境地建立诊断树,希望使用了正确关键字,以覆盖每一个安全意外事故。有了沃森,「提问不必那么精确。」用户不需要去「猜」哪里问错了,就能得到正确答案。

有没有可能黑客用AI帮助其入侵?虽然目前还不可能,这样的发展会有潜在问题。Husain表示,「IBM率先进入市场,这会让提出更好算法变得很难或者成本很高,这个行业的新晋者会落后IBM2到3年。」

沃森,遇上 HAL

以沃森为代表的人工智能容易被误认为HAL9000,后者是《2001:太空漫游》里的一个智能超级计算机。作者Arthur C. Clarke分别取I-B-M的前一个字母,把它命名为HAL。作为一个科幻角色,Clarke让HAL无所不能。这个有自主意识的计算机在一次去土星的太空任务中,变成了一个疯子,杀死了大部分舰员。

但是,我们不应把沃森当成HAL。IBM的Abrams指出,「沃森不会自己主动行动。沃森没有意识。他不会排斥外界的询问。」

他继续指出,「没有主观能动性,它就不会失去控制。沃森有一个插口,」它可以被断开。「无个人判断时,沃森就不会被运用…沃森每个决定的最终决策…将永远由人类根据从沃森那里获得的信息做出。」

机器之心,最专业的前沿科技媒体和产业服务平台,每日提供优质产业资讯与深度思考,欢迎关注微信公众号「机器之心」(almosthuman2014),或登录机器之心网站www.almosthuman.cn查看更多精彩内容。