阿里巴巴发布AI芯片:含光 800 NPU

在云栖大会第一天最重要的的主论坛上,阿里云智能总裁张建锋手持一块写着「含光」的小黑块,宣布使用它识别拍立淘 10 亿商品图片把时间缩减到了只要 5 分钟。这颗全称为「含光 800 NPU」的芯片是阿里第一颗人工智能芯片,已开始应用在阿里巴巴内部核心业务中。

根据阿里方面的测试,「含光 800」这颗主要用于云端视觉处理场景芯片,已经成为全球性能最强的 AI 芯片。在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。成本的下降同样明显,大会基于含光 800 的 AI 云服务上线,相比传统 GPU 算力,性价比提升 100%。

这颗芯片的发布是阿里巴巴在 AI 芯片链路规划中「意料之中」的一步。从去年云栖大会宣布成立半导体芯片公司「平头哥」(平头哥是非洲动物蜜獾,以勇于用小个头挑战狮子闻名)开始,阿里就开始在芯片领域陆续发布产品。但含光 800 的发布仍然有特别意义——它意味着在整个芯片链路的设计上,这家互联网科技公司已经形成了一个相对完整的闭环。

这也是阿里在云计算业务战略层面继续高举高打的重要一步。张建锋在接受采访媒体采访时提到,「我们完全是基于我们未来的判断,基于我们自己对于行业的布局来看待这个问题。」

在云应用生态走向成熟的同时,往硬件基础设施补课,「节本增效」成为阿里云看待未来和布局行业的最新选择。这同时开始将云计算战场的重心推向一个新的高度——云计算不再是单纯的业务层面的碰撞,而是从硬件到软件应用的生态碰撞。其中,作为底层基础设施的 AI 芯片扮演的角色至关重要,它将进一步影响云服务的成本和能力。

平头哥「突围」

随着云计算的狂奔猛进,云计算厂商加入芯片战局并不难理解。因为目前主流的芯片如 CPU\GPU,并非训练基于云计算人工智能最佳的训练、推断芯片。这些传统芯片或许综合性能不错,但具体在云业务场景的支持效率并不十分契合。比如,GPU 架构主要针对图像处理设计,其硬件结构、软件生态几乎固化,因此对 AI 任务很难有深度优化。

在云栖大会现场,阿里云用自己的云业务城市大脑实时运行的业务做出了示范。在处理杭州主城区交通视频时,为了反映该地的交通状况,40 颗传统 GPU 一同运行,延时为 300ms,而使用含光 800 仅需 4 颗,延时降至 150ms。

         (图 | 量子位)

自媒体「量子位」曾将含光 800 与业内主流芯片相比发现,与英伟达最新的 T4 相比,含光 800 是 T4 性能的 15 倍,是应用最广的英伟达 P4 的 46 倍。

对于云计算厂商来说,自研芯片的好处是一目了然的。从业务场景出发,可以减少对芯片厂商的依赖,研发出更适配的产品;长期来看,虽然研发成本极高,但一旦成熟落地,就可以通过规模效应,大幅降低成本。

也因此,自研芯片已经开始成为几乎每家企业都会涉足的领域。其中,谷歌第一只吃螃蟹的,它于 2016 年发布了自研的 AI 芯片 TPU,当年打败李世乭的 alphago 用的就是该芯片。此后 AWS 也跟随发布了云端 AI 芯片 Inferentia,国内的玩家除了阿里,华为、百度也有推出自研 AI 芯片。

自研芯片难点也是明显的。张建锋在接受采访时称,一块成熟的大型芯片研发、发布周期大致需要两到三年,「这是一个非常辛苦的一个行业」。平头哥看起来只用了一年多时间就完成了芯片的研发发布,但这背后其实仍有诸多「准备工作」。

(图 | 阿里云)

一块芯片背后需要一套庞大的硬件生态支撑,包括处理器 IP、芯片设计平台等。平头哥也不例外。过去半年,平头哥先后发布玄铁 910、无剑 SoC 平台。随着含光 800 的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器 IP、一站式芯片设计平台和 AI 芯片,最终实现了芯片设计链路的全覆盖。

阿里内部将阿里在芯片全链路研发上的优势总结为「ABCDE」五点,ABC 指的是人工智能的基础:

Algorithm——阿里有业内领先的 AI 技术和算法;

Big data——阿里商业体系中积累的大数据;

Computing——阿里云安全稳定的计算力;

Domain knowledge——专业领域知识;

Ecosystem——比传统芯片公司更容易搭建的业务落地生态

虽然研发含光 800 并推出市场只花了一年多时间,但为了聚集起这套「ABCDE」,阿里从开启云计算业务时就可以开始着手准备了。

从 2017 年成立达摩院前,阿里在内部就已经组建了芯片技术团队,进行 AI 芯片的自主研发。而在 2018 年四月,阿里还全资收购了芯片公司中天微。中天微是中国大陆唯一一家自主嵌入式 CPU IP Core 的公司。此外,阿里还投资了寒武纪、Barefoot Networks、深鉴、耐能(Kneron)、翱捷科技(ASR)等多家芯片公司。

在研发过程中,与传统芯片厂商的综合考量不同,平头哥的算法团队研发方向从一开始就从自身业务需求出发。从视频图像识别、分类、搜索,到城市大脑等都是平头哥的业务落地范畴,未来还将应用于医疗影像、自动驾驶等领域。

不难看出,这些业务都是需要大数据和巨量计算的人工智能业务,云计算则是性价比最低的服务提供方。平头哥半导体公司首席科学家元尊认为,「提供算力之后大大提高计算效率,能真正的把业务的量达到突破」是平头哥在业务上的重要目标。

不过对于这块芯片的商业落地方式,阿里云的选择和几乎所有云计算厂商一样——不卖硬件,只卖算力和服务。戚肖宁将其总结为「软硬结合,端云相融」。


芯片「持久战」

无论在云栖大会上还是在会后采访中,包括张建锋在内的阿里云管理层都对「含光 800」的发布表现兴奋。因为这块独立自主研发的芯片「含光 800」是阿里拿到芯片战事的重要入场券。

虽然阿里云已经完整的走过了芯片设计的一整条流程,但这仍然只是个开始。对于芯片战局的推演,张建锋认识理性,「芯片是非常复杂的产业」,没有那么容易弯道超车。芯片制作完整过程包括芯片设计、晶片制作、封装制作、测试等多个环节。

目前平头哥参与的是竞争中最重要也激烈的一环——芯片设计,它将决定芯片潜在的功和功效。目前主流的芯片公司如英特尔、英伟达、ARM 等都是以芯片设计著称。

         (图 |阿里云)

值得注意的是,芯片战场中,技术固然是核心壁垒,但有没有一个好的应用生态同样至关重要。作为中天微的前 CEO,戚肖宁就曾在阿里收购公司时感叹,杭州中天的生态系统与工具同 ARM 相比还不够全面、成熟,「这是我们的缺点」。

自媒体「半佛仙人」曾在公号中感慨,过去芯片领域,「Intel 的 X86 体系和微软 Windows 组成的 Wintel 联盟,只要是 PC 生态,就绕不过他们的技术。ARM 通过授权技术方案霸占了移动市场,ARM 技术架构是当下移动设备绕不开的基础,苹果华为三星联发科,都是基于 ARM 的 IP 授权进行研发的,虽然都有自己的核心技术,但终究是运行在 ARM 的规则框架内。」

相比之下,中国过去许多年在半导体领域的缺位,固然与技术先天不足有着重要的关系,但在市场中缺少应用场景同样是弊因。但云计算和人工智能给了芯片战场一个突破口。一个已经成为行业共识的事实是,融合人工智能的云计算一定会成为新的互联网基础设施。

         (图 | IDC)

IDC 今年 9 月发布的《2019-2020 中国人工智能计算力发展评估报告》显示,⼈⼯智能与云的融合将进⼀步加速,未来五年,AIaaS 市场规模的年复合增⻓率为 66.0%,将成为推动云计算市场增⻓的重要细分领域。亿欧的《2019 年中国 AI 芯片行业研究报告》则显示,AI 芯片行业,2022 年将从 2018 年的 42.7 亿美元发展至 343 亿美元,市场发展空间巨大。

从目前的用途来看,AI 芯片指向的云端计算和物联网在未来都有着充满发展空间,其中物联网本身也是云计算未来发展的重要场景。通过云计算的落地场景反向向芯片要能力,又通过商业化锻炼芯片能力将帮助包括阿里在那的云计算厂商迅速打开局面,最终形成良性循环。

作为芯片领域的新兴参与者,这场由云计算厂商业务场景推动的芯片发展,包括阿里、华为、百度等云计算厂商的入局将很有可能改变整个未来芯片产业格局。

不过,云计算厂商研发芯片并不意味着它和芯片厂商就站在截然对立面,芯片厂商的研发实力和成熟生态仍然是云计算厂商短期无法企及的,双方合作和竞争将会是一场漫长的拉锯。但至少,如阿里巴巴平头哥首席科学家元尊所说,「AI 时代对于我们芯片设计来讲是一个激动人心的战国时代。」

「平头哥」们的努力或许还是另外一个突破口。2017 年,中国政府在《新一代人工智能发展规划》将 AI 芯片视作整个人工智能发展战略的基础元件,决心加强扶持行业发展,使中国上不再次掉队。目前来看,在未来芯片的核心战场中,凭借云计算服务,包括阿里、华为在内的中国厂商已经为中国曾无法深度参与的领域打开了一道口子。

Like
喜欢 哈哈 哇哦 悲伤 愤怒

评论 0