商用人工智能时代,高端GPU引擎将成为企业战略投入

伴随着商业逐步转变为数据商业,企业处理海量数据的能力将会成为决定主流商业竞争的策略竞争能力,人工智能正在成主流商业竞争策略之一。一个比较明显的趋势是,以深度学习为代表的机器学习正在成为人工智能主流。

2016 年 7 月 21 日,技术解决方案提供商 SoftServe 发布了 Big Data Snapshot 研究报告,研究显示 62% 的大中型公司希望在未来的两年内能将机器学习用于商业分析。更多的企业正在步入人工智能商用时代,基于深度神经网络的人工智能也已经从高校和实验室走进了企业,并从企业扩散向千家万户。这意味着深度学习即将成为各大企业逐浪智能化的主流商业竞争策略。

深度学习被 GPU 改变 

另一方面,硬件正在重塑颠覆性力量。由于人工智能算法有着独特的特点——分布式并行计算,这并非基于串行计算的 CPU 所擅长;而 GPU 已经不再局限于图形处理,并从一开始就应用于大规模并行计算。「芯」技术是影响企业获得人工智能的制胜关键之一。

事实上,和斯坦福大学吴恩达教授一样,人工智能领域采用 GPU 优化算法的例子比比皆是。随着 GPU 技术突飞猛进,12 颗 NVIDIA GPU 已经可以提供相当于 2000 颗 CPU 的深度学习性能。GPU 成为人工智能行业颠覆性力量的趋势几乎锐不可当。

2015 年的 ImageNet 计算机图形识别大赛中的冠军深度学习算法,例如 Alexnet 神经网络,都是基于深度学习且在 GPU 加速的深度神经网络,这也难怪《连线》杂志惊叹 GPU 在人工智能时代的崛起。

从当前人工智能的商业需求和硬件发展速度来看,GPU 在帮助人工智能走向商用显然具有极大的优势。NVIDIA 在今年发布的世界首款 GPU 深度学习超级计算机 DGX-1 正是在这种情况下应运而生,也是 GPU 帮助企业完成新时代使命和应对竞争挑战的标志性产品之一。

全新架构、颠覆性硬件,GPU推动人工智能商用快速到来

全球独创的 GPU 深度学习超级计算机 NVIDIA DGX-1 基于史上最先进的超大规模数据中心加速器 NVIDIA Tesla P100 GPU,使用了 NVIDIA 2016 年最新发布的第五代的 Pascal 架构。

作为新一代 GPU 架构,Pascal 带来了显著的性能提升。根据 NIVIDIA 的数据,Pascal GPU 在训练深度神经网络的性能方面有 1 个数量级的提高。2015 年 GTC 大会上,用 4 颗 Maxwelll GPU 训练 Alexnet 深度神经网络需要 25 小时,到了 2016 年 GTC 大会上用 8 颗 Pascal GPU 则只用 2 小时;对比英特尔双路至强 E5 服务器,训练 Alexnet 网络需要 150 个小时,而 DGX-1 只需要 2 个小时。

Pascal GPU 架构的优势又如:引入了 NVIDIA 独家的新高速总线 NVLink,专门用于 GPU 以及 GPU 与 CPU 的高速互连,GPU 最高能够以 160 GB/s 的双吐带宽访问系统内存,相当于 PCIe 传统带宽的 5 倍;采用了目前最快、容量最高的堆叠式内存技术 HBM2,Tesla P100 也是全球首款采用 HBM2 内存的 GPU;显著改进编程模型的统一内存,以单一统一虚拟地址来访问系统中所有 CPU 和 GPU 内存,极大简化了程序的可移植性及数据吞吐能力等。

在迎接商业智能时代的过程中,人们重新发现硬件技术革新的魅力。微软研究院首席语音科学家黄学东表示:「微软正在开发具有 1,000 多层的超级深度神经网络。NVIDIA Tesla P100 的惊人性能将让微软 CNTK 能够加速实现人工智能的突破。」

把 250 台服务器放到一个盒子里,微型超级计算机还能为AI带来什么?

当企业还在惊叹超级计算机如何实现只有一个家用 PC 主机大小时候,可能也在权衡自己拥抱 AI 的成本。简单粗暴地说,售价约合 80 万人民币的 NVIDIA DGX-1 从性能上相当于把 250 台服务器装在了一个盒子里。从企业迈向人工智能的经济学角度来说,这一价格已经可以忽略:

NVIDIA DGX-1 提供 8 颗 Tesla P100 加速器、每颗 GPU 16GB 内存、7TB 固态硬盘 DL 高速缓存等配置,吞吐量相当于 250 台 E5 双路 X86 服务器。那么,按 2 万元人民币一台 E5 服务器简单估算,250 台即 500 万的成本,这还不包括机房、网络、电力、人工、维护等额外成本。而 DGX-1 采用 3U 架上型机箱,可单独使用也可以集成到集群当中,显然,如果用 DGX-1 做集群更划算。

NVIDIA DGX-1 的革命性不仅限于「多快好省」,它还提供一整套优化的深度学习软件,这符合其面向深度学习和人工智能领域的角色定位。Deep Learning SDK 开发工具包、NVIDIA DIGITS 深度学习管理调度平台、Deep Learning 开源框架等定制化软件为深度学习提供了全方位的软件支持(详见Developer.nvidia.com深度学习专区),「开箱即用」可谓是 GPU 深入软件领域支持人工智能产业的匠心之笔。

其中,Deep Learning SDK 开发工具包内含强大的工具及类库,可用于设计、开发和部署面向 GPU 优化的深度学习应用。其中的类库包括深度学习基础 cuDNN、线性代数、稀疏矩阵、多 GPU 通信以及全面的 CUDA C\C++ 开发环境。NVIDIA DIGITS 深度学习管理调度平台为图像视频类数据分类和识别,提供了包括 LeNet、AlexNet、GoogLeNet等在内的预设优化算法。除此之外,NVIDIA 还定期更新开发者网站,为开发者提供更多的优化算法——如果说 GPU 已经是深度学习领域不能或缺的组成,那么这款面向人工智能机器学习的 NVIDIA DGX-1 则让更多企业抛开束缚,以更快的步伐迈向人工智能。

DGX-1 的上市有望激活人工智能的大规模商用

过去两年中,与 NVIDIA 在深度学习方面合作的企业激增了近 35 倍,和百度、谷歌、Facebook、微软一样将 NVIDIA GPU 应用于深度学习领域的企业增至 3,400 多家,横跨医疗、生命科学、能源、金融服务、汽车、制造业以及娱乐业等多个行业。

中国企业也在成为人工智能产业的生力军。这款体积微型、性能强悍、软硬件兼顾的NVIDIA DGX-1 一经发布即吸引了中国客户的眼光。HPC 行业翘楚中科曙光成为 NVIDIA DGX-1 在中国最重要的战略合作伙伴之一,而全球领先的监控产品供应商、中国平安城市解决方案提供商海康威视也成为 NVIDIA DGX-1 的首单客户,后者将把 DGX-1 用于视频监控方面的深度学习超级计算机项目上。

NVIDIA DGX-1 显然能够大幅提升 AI 模型的学习和训练时间,加快复杂的非结构化数据的处理效率,比如工业生产线检测的图片、医疗影像视频、道路交通图片与视频分析等等,帮助企业尽快、尽早地从 AI 算法中受益。

结语

对于企业来说,在大的产业趋势到来之前,只有领先一步,才能步步占据先机。在商用人工智能时代,需要一个高价值的 GPU 引擎,来创造高价值的商业模式(包括新的产品、服务与解决方案),从而带来高价值回报;这同时也是下一个商业世纪的核心竞争力,是企业不可忽视的战略性投入。

本文由机器之心发布,作者:米米;

©机器之心,最专业的前沿科技媒体和产业服务平台,每日提供优质产业资讯与深度思考,欢迎关注微信公众号「机器之心」(almosthuman2014),或登录机器之心网站www.jiqizhixin.com  , 查看更多精彩内容。