如何教会人工智能开车?试试斯坦福的众包游戏吧

驾驶汽车的过程中,许多事情对人来说很容易,但对机器来说却很困难。现在,斯坦福研究者开发了一种方法,可以让人工智能(AI)机器以众包的方式来学习。

今年对AI来说是突飞猛进的一年。突然间,人工智能就能完成许多过去只有人才能完成的任务,甚至有的比真人还做得更好,例如人脸识别、物体识别、语言理解等等。

但是,AI依然有很多事情十分滞后,主要是一些对人类来说轻而易举的家务事,简单的如熨衣服,稍微复杂一点的如驾驶汽车。这些领域之所以进展缓慢,并不是因为智能机器不能做这些事,而是因为人们还不知道如何训练它们。

比如说,人脸识别领域的巨大进展大部分要归功于庞大的人脸数据库,其中的每张图都由人类亲自做了标注。在此基础上,AI算法就可以利用这个数据库来学习。

但是,还没有人能够建造出可以用在更复杂的任务上(例如驾驶汽车)的数据库。数据库的缺失正是这些领域进展缓慢的一个主要原因。

现在,这一情况可能要发生改变了,多亏了斯坦福大学的Pranav Rajpurkar及其团队。他们发明了一种方法,可以为那些复杂任务建起庞大的注解数据库。有了这些数据库,他们就可以把一些人类认为理所当然的重要驾驶技巧教给AI机器。

实际上,他们的方法十分简单。基本的思想是让人类注解者可以很容易地向数据库中添加信息和进行评测。Rajpurkar等人的方法是,将这种数据输入的过程转变成网络浏览器上的驾车游戏。

一开始,这个斯坦福的团队开着自己的车在加州的高速公路上兜风,并把获得的数据作为初始数据建立了一个数据库。这些数据包括了GPS数据、视觉数据、激光扫描数据等等。

接着,他们用这些数据生成了一个虚拟的3D环境。这个AI算法是一个卷积神经网络,名字叫做Driverseat,它的目标是在各种不同的驾驶环境中评估环境和确定信息(诸如其他车辆的位置、车道、匝道入口和出口等)。

为了简化,Rajpurkar的团队主要聚焦在确定车道的问题上。这对人类司机来说很简单,但对机器来说非常困难,因为实际的驾驶环境是三维的,还会遇到各种不同的光照和天气条件。

在这个网页游戏上,他们向人类注解者展示AI算法会「看见」的3D环境。算法会尝试识别车道。人类的任务就是在当虚拟汽车行驶在路上时,帮它校对错误。这个纠错的过程被反馈给神经网络,帮助它学会如何更好地分析道路。

当注解者的数据够大时,Driverseat就能从这种众包模式中学到更好的驾驶技巧。

结果十分有趣。研究者将这个神经网络在它从未见过的数据库上进行了测试,结果显示,它很擅长于识别路面的车道,即便在道路弯曲、甚至被其他车辆遮挡时。

但是,这个算法还不太擅长于识别匝道入口和出口。并且,当阴影投射在路面上时(例如从桥下经过时),或路面颜色改变时(如经过不同的路面时)它的表现也大打折扣。

这个团队还发现一件有趣的事,评测系统表明,当太阳接近地平线,干扰视线时,算法运行得不太良好。这是因为数据库的偏差——加州主要的高速公路都是从南向北或从北向南,所以,太阳一般出现在侧面,很少有数据是直接面向日出或日落。

他们计划在未来对这一问题进行弥补,但是,如果没有这个新的评测系统,他们不可能发现这个问题。发现这种缺陷总是很困难,所以这是一个很有价值的进步。必须要在算法真实上路之前,就找出这些问题,否则后果不堪设想。

当然,无论从哪个方面来说,Driverseat都不是完美的。但是众包的训练方法有着显著的优势。这是AI机器第一次从真实的人类行为中学习驾驶技巧。Rajpurkar说: 「我们的研究展示了如何用人类的驾驶知识和经验去『教』机器开车。」

这对改进下一代汽车十分有用。最近的一些汽车已经集成了智能巡航控制装置,以保证与前车之间的距离,当距离太近时自动刹车。一些汽车还能自动变道。

但是,汽车要在各种不同的环境中自动驾驶,还需要更多的智能。用人类来训练AI机器是一个很合理的方法。

这个研究还有更广阔的的用途。除了驾驶汽车以外,还有很多人类认为理所当然但机器难以做到的事情,例如洗漱、喂食婴儿、熨衣服等。没有训练数据,AI永远学不会这些事情。如果Rajpurkar等人发明的方法也能应用在这些事情上,人类很快就能变成AI的终极训练者。AI将能学会更多人类独有的技巧。

机器之心,最专业的前沿科技媒体和产业服务平台,每日提供优质产业资讯与深度思考,欢迎关注微信公众号「机器之心」(almosthuman2014),或登录机器之心网站www.almosthuman.cn查看更多精彩内容。