解说奥运——度秘带来自然语言处理应用的想象空间

度秘直播是一次重要的自然语言处理应用尝试,但它肯定不会就此止步,它自己也在不断学习,一直成长,帮助用户连接各种服务,

在刚刚结束的澳大利亚对阵立陶宛的奥运男篮四分之一决赛中,知名篮球解说员杨毅迎来了一位新搭档——机器人解说嘉宾,它可以非常娴熟地进行解说,还能引用历史数据,精选球迷评论,自动分享现场图片,甚至可以通过语音搜索技术进行语音播报。而这位主持人就是百度的机器人助理——度秘。

度秘是百度在2015年世界大会上推出的智能助理。它在广泛索引真实世界的服务和信息的基础上,依托百度强大的搜索及智能交互技术,为用户提供各类服务。在今年4月份,度秘就在上海肯德基智能概念店惊艳亮相,为客户提供点餐服务,从而节省员工成本,提高效率。让我们看到了智能助手真正进入生活场景,为大家解决问题的可能。就像百度副总裁王海峰提到的:“百度通过不断的技术创新,索引真实世界将最符合用户需求的信息或服务及时准确的交付给用户。”

早在今年NBA总决赛中,度秘就完成了解说首秀,这次的奥运会直播解说又让我们看到了更加强大的解说能力,这主要是源于度秘强大的基于算法和数据的自我学习能力,现在的度秘可以随时快速的调用历史数据,根据现场比赛的走势第一时间做出反应,在中场休息时自动进行技术统计,在这些能力上已经远远超过了人类解说员,或者成为后者的强力助手。

度秘直播背后的技术就是大家熟知的自然语言处理,这是人工智能发展到现在最为困难的细分领域,也是使机器从感知智能过渡到认知智能的唯一途径。度秘基于统计和机器学习方法,把基本的统计数据翻译成了有趣的自然语言解说词。为了让解说语言更加生动流畅,研发团队让度秘对大量人类解说员的解说数据进行了深入学习。所以,度秘可以在比赛直播过程中,跟踪和收集所有的相关数据,并进行高效的整合、筛选和统计,最终呈现出智能化、定制化和可交互的直播效果。

就像人工智能的发展任重而道远,度秘在解说方面还有更大的想象空间,比如说,现在的度秘是基于外部的各种文字信息和数据生成解说,那未来度秘也有可能借助强大的图像识别能力,像人类解说员一样去看懂视频;借助「image caption」等技术将视觉内容用自然语言描述;在解说过程中可以非常智能地与用户进行交互,回答用户的各种问题,等等。

这次度秘非常出色的完成了解说任务,而更重要的是,这是度秘用人工智能技术连接服务的又一次有意义的尝试,并且也是目前为数不多的能将自然语言处理技术付诸实践的案例之一。

自然语言处理是谷歌、Facebook 和微软等科技巨头都最为重视的研究方向,在刚刚结束的语言学顶级会议上,他们也都发表了众多重磅论文。谷歌开源了SyntaxNet,将神经网络和搜索技术结合起来,在解决歧义问题上取得显著进展——能像训练有素的语言学家一样分析简单句法;Facebook 推出了文本理解引擎 DeepText ,每秒能理解几千篇博文内容,语言种类多达 20 多种,准确度近似人类水平;Siri 原创始团队的新创业公司也发布了智能助理 Viv demo,希望它不只能够基于网页搜索提供问题答案,还能连接各种各样的服务,成为真正的人类助手。

在产品层面,他们也都在自然对话的机器人 bot 上压下重注,自然对话技术的发展使我们正站在新一波软件革命的开端,一些理所当然的事物--图形用户界面(GUI)和 App--可能正在逐渐消失,而会话界面正在快速变成新的标准。微软也在年初的Build大会发布了对话平台, 并展示了用文本与 bot 对话的多种应用场景。此后,Facebook 在 F8 开发者大会上,也推出聊天机器人API——Messenger Platform,开发者通过这个平台可以建构出商业应用的聊天功能。

bot 体现出我们众多科技巨头对自然语言处理技术的重视,以及将其产品化并提供服务的决心和探索,最核心的本质将人工智能技术与服务相连接,从目前的技术进展来看,像 bot 这种理想化的通用对话平台还有很长的路要走,因此,在目前这个阶段,我们需要将有限的技术应用在更加垂直的场景中,让其在有明确边界的情况下发挥出最大价值。而此次的度秘直播就是这样的尝试,这不仅体现出百度度秘团队深厚的技术功底,不断积累的数据,还有对应用场景的理解。而这也是度秘的理念,真实场景的应用可以让度秘保持一种持续进步的状态。“度秘会在交互的过程中积累数据和学习,人工智能很重要的一点就是在场景中不断的学习。”王海峰说。

度秘直播体现出自身的进步和成长,就像百度大搜索总产品架构师景鲲所说:“我们准备度秘解说花了很长时间,一直在打磨,产品的进化速度也非常快。通过技术去实时抓取和汇总,过程中需要处理的环节很多。随着我们处理的数据越来越全面,度秘计算的速度越来越快,理解的能力越来越快,功能也会越来越完善。”随着度秘学习到的数据越来越多,对用户越发了解,以及自身底层技术的持续进步,我们必将更看更加智能的机器解说员。

度秘直播更加重要的意义是让我们看到了,在现有自然语言处理技术的情况下,我们可以探索的应用边界,虽然技术本身还有诸多难点,但我们可以凭借对细分场景的理解,对用户需求的把握,去把现阶段的自然语言处理技术发挥到极致,这对于自然语言处理领域,甚至是整个人工智能领域,以及对于科技公司来说,都是一次很好的示范——人工智能不可能一步到位,将技术、数据、应用场景和产品结合起来才是最佳发展路径,只有这样才能使我们从细分走向通用,从低级智能走向高级智能。

当然,度秘肯定也不会就此止步,就像度秘的研究人员所说,它自己也在不断学习,一直成长,接下来我们势必会看到度秘在更多应用场景下的持续探索,也会以一种更加智能的方式将用户连接到更多服务上,因为这才是人工智能的本质。