60年前,图灵如何评价「模仿游戏」?

《模仿游戏》讲述了艾伦·图灵努力破译纳粹海军密码,但鉴于这部电影有太多历史错误,下面这个故事有望让大家认识一个更真实的图灵。

编者按:日前,电影《模仿游戏》正式在中国上映,这部讲述艾伦·图灵努力破译纳粹海军密码的传记片获得了很多奖项提名,甚至获得了2015年奥斯卡最佳改编剧本奖。但是,有一件事,它是不会赢得任何奖项的,那就是对「模仿游戏」本身的写照。 「模仿游戏」,是指图灵提出的对机器思维的测试,取决于计算机能否令人信服地模仿一个人,现在被称为图灵测试,并没有真正在这部电影中表现出来。

图灵于1950年在《Mind》期刊发布的《计算机器与智能》文章中阐释了这个测试。但实际上,他关于这个话题最后一次有记录的发言是在 1952 年的一档广播节目里,这档节目差点就没有播出来。虽然至今这些发言还鲜为人知,但他在广播里的话还是揭示了他关于这一话题的思考。

鉴于《模仿游戏》这部电影有太多历史错误,下面这个故事有望让大家认识一个更真实的图灵。

1950年,BBC的一个制片人阿奇博尔德·克洛在寻找一些「天才」时,在曼彻斯特遇见了图灵。克洛当时对图灵印象平平。在他写给BBC高管克里斯托弗·霍姆的信中,他陈述道, 「毫无疑问,他具有活跃的思维,但我很怀疑他能做好一个演讲者。」克洛报告称图灵似乎「在他的讲话中有明确的犹豫」,因此不会推荐他。

更多地,克洛还抱怨图灵「似乎并不热衷于按照他在《Mind》上发表的文章来聊…… 他宁愿坚持机械事实的一面,我怀疑其他学者对《Mind》上这篇文章的反应可能不是很积极,这让他在目前过于谨慎。」

但克洛对「天才」的判断一如既往的差劲。前一年,克洛曾建议不要使用天文学家弗雷德·霍伊尔,因为他有太重的约克郡口音。结果霍伊尔竟然是BBC最成功的节目主持人之一——实际上就是在BBC关于宇宙起源的节目中,霍伊尔提出了「大爆炸(big bang)」一词。

霍姆没怎么在意克洛关于图灵的意见:「图灵是被培养成一个数理逻辑学家,而不是一个科学家,他应被给予充分的机会在我们的节目中来发展他的论点,即使这样需要不止一次访谈,」他回信给克洛。相对今人,霍姆对图灵这篇在《Mind》上文章的目标的所知有限得多 ——「基本上图灵也就是表明他对在不久的将来可以达到的实际的成就的信心」 —— 他仍然认为这篇文章的观点「可以被相当广泛的观众理解。」

霍姆是正确的,最后图灵录制了两次访谈节目,都在BBC广播电台第三频道上播出,分别在1951年5月和1952年1月。

第三频道是一个无法在今天这种评级意识浓厚的氛围中存在的频道。它紧随着二战诞生,如同其他高档的BBC节目,面向的是「为严肃文学和戏剧,为良好的音乐和智慧的讨论这种几乎无法满足的需求」,这是(他们说的)一个机会,「大胆的实验……不考虑…大众的吸引力。」据其第一任老板乔治·巴恩斯说,第三频道的目的是提供英国经历多年的战争已经缺乏的智力刺激。

第三频道的要求十分苛刻。它期望听众「全神贯注地听节目」。这正是图灵的首次亮相所需要的方式。我们应该感激安排这次机会的BBC工作人员,因为图灵在广播里的演讲为我们提供了一扇窥探他思想的窗口——尽管只是以文字的方式保存下来。

图灵第一次广播节目的主题是「电子计算机能思考吗?」这是五集的系列节目之一,演讲者都是早期的计算研究先驱。其他演讲者包括道格拉斯·哈特里和马克思·纽曼,这两位都是数学家,还有电子学专家毛里斯·维尔克斯和弗莱迪·威廉姆斯。

和图灵一样,这些人并不是家喻户晓的名字。他们中的大部分人,那几年都在做着高度机密的工作,如果他们提到这些工作,听众一定会肃然起敬。普通人可能只在报纸文章上,或者写给伦敦《泰晤士报》关于「电子大脑」的信件中看过他们的名字。但是,毫不夸张地说,图灵和纽曼(他是破解纳粹密码的另一位领导者)对二战的贡献绝不亚于丘吉尔麾下任何一位名垂青史的将军。

所以,让这些人有机会和英国公众交流,真是再合适不过了。霍姆对图灵当节目主持人很有信心,万幸,图灵自己也证明了这一点。他第一次节目的制片人说,图灵讲话「朴实自然」。于是,BBC请他再做一次节目,这一次是以嘉宾的形式参加一个研讨会,主题是「自动计算的机器能被看做在思考吗?」另外三名嘉宾分别是:纽曼、哲学家理查德·布雷思韦特和神经外科医生乔佛里·杰弗逊,而最后这位的观点曾遭到过图灵的攻击,就在他发表在《Mind》杂志上的文章中。

1952年1月10日,BBC在伦敦记录了这场研讨会。BBC报销了图灵的火车票和酒店住宿费,另外还支付了20几尼(译者注:英国旧时的一种金币)的费用,大约相当于今天的800美元——可能比《模仿游戏》里饰演图灵的卷福出席一场英国脱口秀的收入低多了。

1月14日周一晚9点35分,在这个晚间黄金时段,这场研讨会第一次播出。为了符合第三频道「呈现最经典节目」的宗旨,这场访谈以法国室内乐开场,接下来配以舒伯特的钢琴奏鸣曲。研讨会实际时长45分钟——四个学术专家的声音,背景中充斥着噼啪声。(第三频道收听起来并不总是很容易,连BBC都承认,「太多地方不可能听清楚,还有的地方信号太差,听着是一种煎熬。」)

虽然以今天的标准来看,图灵的听众算不上庞大,但数量依然不少——根据BBC的估计,保守的数字大约有10万人。收听这个节目的人简直五花八门,超出你的想象。根据第三频道的一份市场报告称,大约1/3的人是「工人阶级」。其中一些可能居住在欧洲大陆(译者注:指除了英国、爱尔兰、马耳他、冰岛、塞浦路斯五国以外的欧洲其他国家),那里很流行听第三频道。实际上,远在瑞士都能听到图灵的节目,尽管30%的英国人都不可能听清楚这个节目,或者压根听不到。

那么,这些人对图灵的节目反响如何呢?数学家在20世纪50年代的古怪倾向与现在无异。「数学家都是怪异的家伙。」图灵首次亮相的一年前,伦敦数学协会的主席在BBC的广播里如是说。他告诉听众:「数学家居住在与外界隔绝的智力国度,他们通常很害羞,对自己的工作很保守。有其他学者在场时,他们倾向于感到被孤立,并把自己的工作看成无法表达又令人愉快的小秘密。」从某些角度看,他可能是在说图灵,因为他无疑非常害羞。

最近刚刚过世的Sarah Baring女士,蒙巴顿将军的教女,同时也是被图灵称作「奴隶」的那些在布莱切利园(Bletchley Park)政府编码与解码学校中协助几乎全是男性的破译团队的女性之一,曾回忆到「当人们偶尔把他当作稀有动物一样关注的时候,他会低头盯着地板,以一种很奇葩的姿态蹒跚踱去食堂。」即使这样,图灵在广播节目中看上去倒是很有自信,与听众的交流直接而亲切。

大众对布莱切利园的计算机器依然没有什么概念。然而得利于《国家日报》(National Deillies)和其他地方报纸掀起的关于超快运算机的媒体风潮,图灵,威尔克斯,威廉姆斯和其他人在战后建造的「电子脑」却已早广为大众所熟知。

在逐渐升温的关于机器智力的论战中,图灵几乎是唯一一个站在机器这边的。他的BBC广播节目给了他一个将自己的观点传递给「路人」(图灵原话)的机会。从图灵的演讲稿看,他的沟通技巧非常好——他是一个很用心地对大众讲解高难度问题的人,而且他解释地很好。《模仿游戏》将图灵塑造成一个没有幽默感的人,但是他的演讲其实很有幽默感,虽然可能有点干。

图灵1952年的广播节目粉碎了三个关于图灵测试的传说,正如我的同事,新西兰坎特伯雷大学的杰克·科普兰所提出的一样。首先,根据大多数人的看法——包括《模仿游戏》剧本灵感的来源之一,安德鲁·哈吉斯的图灵传记——图灵的目标是提供一套关于思考的可操作定义。事实上,图灵表达了完全相反的目的,在广播中,他说,「我不想给思考定义」,他补充道,「我完全不觉得我们有必要在一个定义上达成共识。」事实上,有一些听众在BBC的听众调查中表示不满图灵及其相关的演讲者回避给与定义。

第二个传说是图灵曾预测机器会在本世纪初通过测试。但是其实他当时在1952年的广播中说的是在机器达到“毫无置疑”的可能性之前,需要「至少100年」。

第三个传说是图灵的测试是有漏洞的,因为它可以被很明显不会思考的机器通过——比如,一个只是简单搜索庞大的对话数据库,寻找合适的回答应对评判员的问题的机器。但是纽曼和图灵在广播节目中很明确的指出,这样的暴力搜索需要花上电脑「千百万年的时光」。

在广播节目中,布莱德维斯,杰弗逊和纽曼善意地将图灵重点引导至他提出的关于机器的思考能力的测试上,包括「机器是否可以撒谎」。图灵说:计算机「有权使用各种手段变得更像人」。这甚至让机器可以选择假装成没什么当地文化和词汇的外国人来逃避麻烦的问题。(最近的一位参加机器模仿人类游戏竞赛的获胜者,「Eugene Goostman」,据称是一个13岁的乌克兰男孩,就是这样做的,不过即使这样,这个程序也没有通过图灵测试,虽然很多媒体都激烈反对。)

另外一些逐渐进入人们视野的问题,比如「评判员应该被允许问什么样的问题?」「任何问题」,图灵回答并补充到,「而且问题并不一定得是问题,任何超过法庭上的问题才是真正的问题。」

难道一台电脑不是容易被检测的么?因为电脑是绝对可靠的。

答案是,不。因为,正如图灵所说,电脑能通过使用一些小诡计而避免被检测到。他认为,在任何情况下,「能计算的机器真的谈不上可靠。」图灵笃定地认为计算机会犯错。

什么样的计算机程序能在这样的测试中有优异的表现呢?

图灵的想法是将计算机按照正确方式设置后,使其从TA的老师及其本身过往的经验中学习,就像人类的孩童那样。这个想法在当时被认为惊人地创新。他把这种机器成为“孩童计算机”,并在这段陈述中提到了他自己与此相关的一些实验。

难道一台计算机不会(在未来)因为「不具有情绪」而显得与众不同?

图灵暗示「孩童计算机」甚至可能去自主产生「人类的情绪」。而这些情绪,在他看来,是「随着来自老师的真切的教导而产生的副产品」。如果图灵对这一点的看法是正确的话,计算机在未来将不再需要假装具备情绪。

难道电子脑与人脑之间不存在很大差异吗?

其他演讲嘉宾认同电子脑与人脑之间存在很大差异,比如在存储空间上的差距。但图灵却从另一个层面上挑战这个观点。在图灵看来,电子脑必须在各方面都像人脑一样运作才能被称作会思考:「举一个极端的例子,我们对一个具有像冷掉的粥一样粘稠度这个特点的大脑不感兴趣。」确实如此,从他倡导的测试中就能看出他真正感兴趣的特质。打字机在这个测试中对计算机的电子脑进行询问,过滤掉了许多与「电子脑能否思考」这个特质无关的参数与事实。

那么听众们是否买图灵的帐呢?听众的反映各不相同,评论从「这是真正的杰作」到「我认为以这种方式知道浪费45分钟实在是悲哀」不等。有些听众提出了与图灵在1950年《Mind》上文章中预期与反驳的完全一样的反对意见。思想,一些人认为,是「上帝赐予人类的特权」,而计算机「永远都只会是一堆聪明的金属而已。」不过仍然有54%的听众在BBC的听众调查中给予这档节目A或A+的评分。

似乎这些人并没有察觉(或反对)这些专家们只是在读事先准备好的评论,在那个时候,这是标准做法。之前的时段,所有的四个版本均背离了原先的演讲稿,图灵做了大部分的更改。最终版——真正使用地那一版——幸运地,保存在BBC写作档案室里,该中心保存了大量和只有部分目录合集的旧讲稿和其他历史文件。

图灵对该讲稿做的最大的变更是他关于类比学习的讨论,例如当宇宙论者解释宇宙膨胀时用了一个膨胀的气球来类比。图灵对类比如何能让大脑「灵光一现」非常有兴趣。今天对现在称之为强人工智能持怀疑态度的人们认为计算机不可能有这些灵光一现的时刻。相反的,图灵认为只要科学家们能够发现人类大脑在类比时的工作机制,他们就能给计算机编程让它们做同样的事。

图灵的基本理念在1952年的电台广播中是这样表达的:

我们不应该为计算机和我们为人类做的事之间设置任何更高或任何不同的界限。我们不应该通过把大脑放在显微镜下来决定我们的人类同胞的思想——每日的日常活动是足够的。

这就是图灵敏锐的观测。如果你想知道机器在思考什么,尝试与它交流吧。

本文来自IEEE,机器之心翻译出品 参与成员:ashleytan,汪汪,张之乎,KaraLii、柒柒四十九