一出场就能引起观众山呼海啸的人已经不多了,点冷机尤其是在一个技术大会上,但无论到哪里,被奉为「AI 教主」的黄仁勋总能做到。
这一次 NVIDIA 把自己的 GPU 技术大会(GTC2017)开到了中国,作为全球最权威的 GPU 开发者大会,会议的主题聚焦在人工智能、自动驾驶、VR 等前沿科技领域。
NVIDIA 创始人兼 CEO 黄仁勋毫无意外的又为中国开发者带来了一场长达两小时的主题演讲——A New Computing Era,计算新纪元。
「摩尔定律已经终结」这几乎已经成了黄仁勋在所有演讲开始必说的事情,其次他也提到了 CPU 的瓶颈,「晶体管数每年增长 50%,但 CPU 的性能仅增长 10%」,尽管这样老黄还是强调说,GPU 并不是取代 CPU,他更愿意定义 GPU 为一个「加速器」。
当然,这次的发布包括了在四个月前美国硅谷圣何塞 GTC 2017 上一些重磅的关键产品,主要讲到的包括 Project Holodeck、TensorRT 3、人工智能城市、自动驾驶平台以及 Isaac 机器人模拟机这五大部分。
但这一次更值得关注的是 NVIDIA 与中国市场建立的合作,一上来就收获了 BAT 三家巨头云服务的合作,同时还与华为、浪潮和联想在内的中国顶尖 OEM 合作,还有与京东这样物流体系的合作。
面对这样可以说是「广泛」的合作,黄仁勋在接受采访的时候,始终强调,「NVIDIA 是一家开放性的公司,NVIDIA 提供的是一个开放的平台」,他希望平台的合作方都能够成功,而 NVIDIA 需要做的事情就是让平台与时俱进。
NVIDIA 在深度学习领域的芯片供应商中始终占据着主导地位,对于人工智能领域的发力我们也有目共睹。而真正助力 NVIDIA 成长为「帝国」的,是目前市场对能够加速交付各类 AI 服务的技术需求量激增,尤其是中国市场,据 NVIDIA 不完全统计全球各类初创 AI 公司也累计获得了约 66 亿美元的投资。
毫无疑问,为交付这些服务,NVIDIA 的深度学习平台成为了一种极快速、极有效方式。黄仁勋更多的介绍了互联网公司竞相将深度学习 AI 引入受众达数十亿人的服务之中,以及 AI 推理工作负载是如何呈指数级增长的。
但这次来到中国的重点当然是合作,黄仁勋首先宣布,阿里云、百度和腾讯均已在其云服务中部署 Tesla V100 GPU 加速器。
「通过与 NVIDIA 密切合作,我们充分利用 Volta 的强大功能和效率来加强百度云、智能驾驶和其他 AI 相关业务。」百度总裁张亚勤这么评价这次合作。
腾讯集团高级执行副总裁、社交事业群组总裁汤道生也表示:「我们在产品中广泛采用人工智能技术来改善用户体验,例如微信的语音识别技术、QQ 和 QQ 空间的增强现实技术、以及在腾讯云上提供的数据智能服务。」
另外,NVIDIA 还宣布,包括华为、浪潮和联想在内的中国领先原始设备制造商 (OEM) 均已采用 NVIDIA 的 HGX 服务器架构并使用 Tesla V100 GPU 来构建新一代加速数据中心。
「京东每年配送的包裹数量超过 300 亿,且这一数字还在以 50% 的速度逐年增长。」这时候,NVIDIA 宣布将与中国大型在线零售商京东合作。
为应对如此大的增幅,京东正着手推出能够向客户派发包裹的 JDrover,以及能携带 30 公斤包裹的无人机 JDrone。京东的目标是在 2022 年之前建设一支拥有 100 万架无人机的机群。
上述两种配送工具均由京东创新实验室 JD X 负责开发,由 NVIDIA Jetson 超级计算平台提供技术支持,且运行 TensorRT 以实现导航和无人送货。
当然,助力京东实现自动化配送也只是 NVIDIA 针对自动驾驶或者说是运输领域的其中一个部分,在中国,NVIDIA GPU Ventures 也参投了无人驾驶初创公司景驰科技和图森未来。
同时,这次老黄也发布了一个关于自动驾驶的平台 NVIDIA DRIVE AV 平台,但只是综合了目前英伟达在自动驾驶领域所建立项目合集的名称,并没有实质性的项目,老黄解释说这是作为一个开放的平台,它让 NVIDIA 有一个更完整的体系,也更有利于合作伙伴「各取所需」。
同时在接受采访的时候,黄仁勋也表示,「NVIDIA 确实在打造自己的一套完整的自动驾驶系统,但这是为了让自己更了解具体的算法,目的是为了打造更好的自动驾驶运算平台。」
在视频领域,每日运行的推理计算估计有 3000 亿次。在语音领域,每日运行的推理计算估计打 500 亿次以上。在语言翻译领域,每日运行的推理计算更是达到约 7000 亿次以上。
所以为了满足市场需求,NVIDIA 这次发布了 TensorRT 3 AI「推理」软件。该软件能够在生产环境中运行经过训练的神经网络。这款新软件能够大幅提升从云端向终端设备,包括无人驾驶汽车和机器人的推理性能,能并降低成本。
当 NVIDIA GPU 结合 TensorRT 3,就能够在所有框架上开展超快、超高效的推理工作,从而实现众多支持 AI 的服务,例如图像和语音识别、自然语言处理、视觉搜索和个性化建议。
据黄仁勋介绍,搭配 Tesla V100 GPU 加速器的 TensorRT 每秒能够识别多达 5700 张图片,而如今最好的 CPU 则每秒仅能识别 140 张图片。
「这是一套效率和速度兼备的平台。」简单做个对比,搭配 NVIDIA 最新 GPU 的一台服务器顶得上当前 150 台 CPU 服务器。或者换个角度来说,采用 GPU 加速技术的一个数据中心所开展的推理工作相当于 13 个仅采用 CPU 的数据中心。这也不禁让老黄在演讲的时候不断强调「省钱」的作用。
除了 TensorRT 3 以外,黄仁勋还发布了能够实现 AI 加速的软件。其中包括能够大规模提供实时、低延迟视频分析的 DeepStream SDK、以及能够加快 HPC 和深度学习应用速度的加速计算软件平台 CUDA 的最新版本:CUDA 9。
黄仁勋表示:「NVIDIA TensorRT 是全球首款可编程推理加速器。借助 CUDA 的可编程性,TensorRT 将能够加速助推深度神经网络日益多样化、复杂的增长趋势。通过 TensorRT 的加速,服务提供商能够以更经济实惠的成本部署这些计算密集型人工智能工作负载。」
目前已经有超过 1200 家来自各行各业的公司开始采用 NVIDIA 推理平台,亚马逊、微软、Facebook 和谷歌、以及阿里巴巴、百度、科大讯飞、京东、腾讯等中国领先企业均已开始采用 NVIDIA 推理平台。
用于打造 AI 智慧城市的 NVIDIA Metropolis 平台,新增了阿里巴巴与华为这两家合作伙伴。
除了阿里巴巴与华为之外,已经有超过 50 家全球领先公司已经在使用 NVIDIA Metropolis。「到 2020 年,我们城市中的视频摄像头数量将超过 10 亿个,NVIDIA 将与上述公司一起发挥这些摄像头的作用,以解决一系列复杂的问题。」
NVIDIA DeepStream SDK 简化了由深度学习提供支持的、用于 AI 城市与超大规模数据中心的可扩展智能视频分析的开发工作。开发者可以使用 DeepStream 来实时处理、理解并归类视频帧,以满足最严苛的吞吐与延迟的需求。
Metropolis 于今年 5 月份首次发布,是一个包含各种工具和技术从终端到云端的视频分析平台,以构建覆盖交通与停车管理、执法、城市服务等各个方面更智能、更快速的 AI 赋能应用。
尽管数据量增加了 10 倍以上,但之前的合作伙伴海康威视(Hikvision)仍然实现了对识别与匹配技术超过 90% 的检索率,展现了 Metropolis 的超强能力。这使得在人员密集场所寻找失踪者变得更容易。
海康威视将摄像机及网络录像机与 NVIDIA Jetson 终端相结合,使用由 NVIDIA Tesla P4 GPU 加速器提供支持的云服务器,以及利用 DGX-1 AI 超级计算机的大规模计算能力进行训练。
新合作伙伴阿里巴巴的 ET 大脑是阿里云的专有 AI 计划,致力于帮助不同的垂直行业解决现实挑战,释放其开发潜力。例如,阿里云的「城市大脑」为城市规划者提供了 AI 的强大能力,以升级他们的城市治理工作,例如实时交通管理与预测、城市服务与更智能的排水系统等。在杭州的试点区域,「城市大脑」让交通拥堵程度降低了 11% 之多。
从最早的游戏、到现在火热的 AI 、自动驾驶等等,英伟达无疑成为了这一系列产业里不可缺少的一员,GPU 也成为这些工作中必备的「加速器」,而关于 GPU 未来的应用,黄仁勋说「医疗行业是接下来我非常关注的产业,我们相信 AI 可以帮助大家,例如新药的研发、疾病的早期检测、对阵下药的问题、新药临床实验问题等等,都能够通过 AI 来解决。」
最后,英伟达所提供的 GPU 以及一系列的平台服务都让他更像是一个基础服务或者基础能力提供商,他能够帮助几乎所有的人实现 AI 的梦想,而当被问到「对于目前 AI 在不同领域的发展 NVIDIA 是有侧重点的吗?」
黄仁勋回答说:「NVIDIA 所关注的领域都是不能没有 GPU 的领域,而在这之中,NVIDIA 给予的都是独一无二的价值。」