AICODER大前端培训

AICODER-IT培训专家,前端培训基地,前端培训,全栈培训,大学生IT培训基地,线上IT课程免费自学,线下培训项目实战,实习,html5培训实习-AICODE程序员

在线咨询

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

谦太祥和 发布于: 2019年9月20日 0时42分32秒 阅读223次

  乾明 发自 上海 
  量子位 报道 公众号 QbitAI

  每一次华为新动作,点赞有之,质疑亦随之。

  9 月 18 日刚在全联接大会上发布的“全球最快 AI 产品”就是这样。

  但在现场、在华为内部来看,这只不过是“华为计算战略”艰苦奋斗的开花结果,只是这盘芯片和计算力大棋局里关键一子。


华为 Cloud & AI 产品与服务总裁侯金龙

  而且相比 Atlas(古希腊神话里的“大力神”),实际不到三年时间里,华为已经发布了 10 款商用芯片:

鲲鹏 916、920;麒麟 970、980、810、990、990 5G;昇腾 310、910;鸿鹄 818。

  按外泄的规划,接下来的两年内,至少有 6 款芯片发布落地。

  无论是计算领域,还是半导体行业,如此阵仗,势头都异常猛烈。

  所以背后原因究竟是什么?华为又究竟想做什么?

  计算战略发布后,是时候对这盘大棋来次完整起底,揭秘华为在计算背后的种种规划与布局。

  15 年苦功夫,目前投入 2 万名工程师

  围绕计算这个产业投资,十几年前已经开始了。

  其中最具标志性的事件是 2004 年 4 月,旗下芯片公司海思半导体成立。

  ‍‍华为 Cloud & AI 产品与服务总裁侯金龙透露了这背后的投入:

从 2004 年开始投资研发第一颗嵌入式处理芯片,目前投入超过 2 万名工程师,形成了以“鲲鹏+昇腾”为核心的基础芯片族。

  基础芯片族带来的意义非常直接。华为成为了业界唯一同时拥有计算架构中“CPU,NPU,存储控制,网络互连,智能管理”5 大关键芯片的厂商。

  但俱往矣。

  从产品发布的节奏来看,华为对芯片投资的力度还在快速加强,迭代也越来越快。

  华为投资芯片的策略,此前也有曝光,总结起来就是三个关键词:量产一代、研发一代、规划一代。

  以鲲鹏系列处理器为例,从 2007 年走到现在已历时 12 年,现在是第三代芯片。

  现在华为释放出的最新信号是:鲲鹏+昇腾会长期演进,按照每年推出一代的节奏来提升竞争力。

  这也是华为在不到 3 年内推出 10 款芯片的直接推动力量之一。

  当然,上述种种努力和产品,只是果,细究“因”,则是华为对于行业变迁趋势的核心判断。

  华为芯的机会:趋势变迁下的 2 万亿市场

  在华为看来,当前的计算产业正在发生深刻的变化,尤其是整个社会向智能时代的迈进,这带来了变革与挑战,也带来了机会。

  全联接大会上,胡厚崑援引了 Gartner 的数据——全球计算产业总空间为两万亿美元。在他看来,这是一片大蓝海,华为将坚定在计算领域的投入,并推进落地。

  侯金龙进一步阐释四大趋势,也可以说是华为投资芯片进入这一蓝海的主要切入点:

  首先,数据中心不够用了

  对于数据中心来说,以前其承担的职能更多的是存、但未来更重要的是算,数据中心正在逐步演变为计算中心。

  最直接的体现就是,大规模数据中心中服务器越来越多。就以华为云的数据中心为例,有 60% 都是用于计算的服务器。

  可以说,计算正在成为数据中心的主体,这就是华为推动鲲鹏系列芯片的重要原因之一,也是鲲鹏芯片的使用场景。

  与此同时,整个行业对 AI 算力需求也越来越大,而且来得更加汹涌,从 2012 年到 2018 年,AI 算力消耗几乎增长了 30 万倍。

  现在每年的增长超过 10 倍,到 2025 年,AI 算力将会占据数据中心算力的 80% 以上。

  正是在如此算力需求下,华为推出了昇腾 910 以及 Altas 900 等 AI 计算产品。

  其次,端边芯片与中心芯片还有大差距

  在华为看来,Arm 在生态上的优势会逐渐向数据中心延伸。对于华为来说,这是挑战,也是机会。

  现场,侯金龙也分享了一组数据:

2018 年,Arm 处理器出货量 230 亿片,主要用于端和边,数据中心侧只有 3000 万片,这是数百倍的差距。

每年十几亿部手机都是 Arm 结构的,2019 年华为智能手机总的算力,将是今年全球数据中心新增算力的 2 倍,而且手机上的几百万应用都是基于 Arm 生态。

  以前基于 Arm 的技术,之所以不能在数据中心使用,核心的限制是性能。

  但解决问题导向,华为现已找到对策。

  其今年发布的鲲鹏 920 是兼容 Arm,多核、高并发,把四颗核心并入了一颗核心,其性能超过业内通用 CPU 20% 的性能。

  而且现在的计算,可以让简单的计算在终端进行,复杂的计算可以在云上进。

  如果继续用 X86 架构在云上计算终端的任务,效率就会降低 40%,反之如果运用 Arm 架构,则提升 40%。

  第三,计算该绿

  高性能的计算虽然更有效率,但背后也有大量的碳排放。

  美国马萨诸塞大学阿姆赫斯特分校做过研究,训练一个单一 AI 模型,会产生 180 吨的碳排放。

  这相当于普通汽车整个服役期排放量的 3 倍,平均地球人 30 年日常生活的碳排放。

  算力与效率背后,也需要对能源与环境更友好。从芯片层面上来看,要在更小的功耗下实现更高的性能。

  在这方面,华为的底气很足。

  侯金龙说,华为的 Atlas 900 AI 训练集群,算力达到 256 PFLOPS 只需要 16 个机柜。

  要实现这样的算力,如果用 CPU 需要 6195 个机柜, 用 GPU 需要 208 个机柜,而 NPU 如昇腾只要 128 个机柜。

  这背后,主要归功于昇腾架构对深度学习业务的优化。

  此外,经过华为系统级优化,如板级液冷、柜级密闭绝热等,整个集群的功耗从 4 万 kW 降到 736kW,降低 50 多倍。

  最后,摩尔定律放缓已成事实

  经过数十年的快速迭代发展,高速的摩尔定律已经难以实现。

  过去 5 年,通用 CPU 的发展遇到了许多技术瓶颈,单核性能平均每年提升不足 10%,摩尔定律放缓已经成为事实。

  想要进一步实现提高技术能力,在晶体管上打主意太难了,需要寻找其他路径。

  这也是华为将基础研究作为整体计算战略关键组成部分的原因,最具代表性的成果,就是华为自研的达芬奇架构。

  未来,华为的目标是通过一系列的技术创新,打破能效墙、打破散热墙、打破优化墙、 打破内存墙、打破高速 IO 墙,进一步释放计算潜能。

  总之,在华为看来,计算产业已进入架构创新的黄金时代,充裕、高性能、多样性、绿色、触手可及‍的算力将是智能社会发展的动力。

  这需要更高性能的芯片做支撑,但仅仅依靠芯片还不够。

  在整个华为计算战略中,芯片只是一部分。

  解读华为计算战略:硬件开放与软件开源

  整体来看,华为计算图景可以归为“一云两翼双引擎+开放的生态”。

  其中一云,是华为云。

  这是华为计算的核心输出途径——芯片不直接对外销售,以云服务和部件的形式面向客户,优先支持合作伙伴发展整机。

  双引擎是指“鲲鹏”与“昇腾”。基于此打造芯片簇,构筑异构的计算,是华为计算战略的基础也是主要动力来源。

  两翼则是智能计算业务、智能数据与存储业务,是计算的商业模式和直接应用场景。

  开放的生态,则是整个华为计算战略的“点睛之笔”,也是今年华为全联接大会的重头戏。

  这一方面,主要分为硬件开放和软件开源两大部分,目标是使能广大的合作伙伴, 形成一个开放的产业生态。

  硬件开放

  如何落地?具体到商业模式上,是基于芯片等对外提供主板/SSD/网卡/RAID 卡/Atlas 模组和板卡,优先支持合作伙伴发展服务器和 PC 等计算产品,以及自己的品牌。

  华为也在全联接大会上表示,其 TaiShan 服务器以及华为终端的 PC 机,聚焦做高端和内部配套,条件成熟时,将停止 TaiShan 服务器的销售业务。

  在全联接大会上,除了 Altas,华为也发布了以下硬件新品:

  鲲鹏主板,用于快速开发服务器和台式机产品。采用 xPU 高速互联、多合一 SoC、100GE 高速I/O等关键技术,不仅搭载鲲鹏处理器,还内置 BMC 芯片、BIOS 软件。与此同时,华为也将开放主板接口规范和设备管理规范。

  通用服务器 TaiShan 系列 ,号称“最强算力”的通用服务器。具备至少 64 核、8 个内存通道、PCIe 4.0、多合一 SoC、xPU 高速互联、100GE 高速I/O等六个特征。

  而且,面向数据中心分布式演进需求以及边缘计算需求,华为还提供了存储密集型、计算密集型、边缘计算等多款服务器产品。

  Atlas 全系列产品,覆盖云、边、端全场景,面向训练和推理提供强劲算力。主要基于昇腾 910 和 310 AI 处理器,华为推出 Atlas 900、AI 训练服务器 Atlas 800、和 AI 训练卡 Atlas 300。

  其中,Atlas 800 在 4U 空间集成了 8 颗昇腾 910 AI 处理器,可提供 2 PFLOPS 的超强算力,算力密度是业界同类产品的 2.5 倍,内置 32 个硬件解码器,每秒可完成 16384 张 1080P 图片解码,可以与训练并行处理。


8 个 Atlas 800 组成的机柜,内置 64 颗昇腾 910 芯片,Atlas 900 训练集群最少由 16 个机柜组成。

  Atlas 300 可提供 256 TFLOPS 的算力,是当前业界主流训练卡的 2 倍,每秒训练的图片数量从 965 张提升到 1802 张。可实现梯度参数和数据集并行传输,最高可降低 70% 的梯度同步时延。

  此外,华为也发布了 112 款基于鲲鹏和昇腾的云服务,包括 69 款基于鲲鹏的云服务和 43 款基于昇腾的云服务,让客户和合作伙伴们能更容易的获取鲲鹏和昇腾的算力。

  华为介绍称,基于昇腾的图像搜索服务、内容审核服务,价格下调 70%。

  软件开源

  软件开源,与硬件开放相伴而生,是开放硬件能力的放大器。

  继 8 月 23 日华为宣布开源 AI 计算框架 MindSpore、8 月 31 日放出方舟编译器框架代码之后,全联接大会上华为又放出多个软件开源计划:

2019 年 12 月 31 日开源服务器操作系统,2020 年 6 月开源可覆盖企业 70% 以上的数据库业务场景的 GaussDB OLTP 单机版数据库。

  之后,华为将支持基于 openEuler 的合作伙伴发行商业版操作系统,支持各行业主流应用和软件开发商把软件和应用迁移到基于 openEuler 的操作系统上。

  而且,华为也将与深之度、中标麒麟、天津麒麟、中移苏研、普华等伙伴计划联合推出 openEuler 开源社区 (http://openEuler.org)。

  怎么理解华为有所为,有所不为?

  伴随着华为计算战略的披露,“华为有所为,有所不为”也屡次被摆到台面上。

  到底怎么理解华为有所为,有所不为?

  侯金龙也进一步给出了解释,华为的聚焦点是重点投资计算架构创新,处理器的研发,以及华为云。

  在这之外,华为不做应用,但免费支持主流应用和软件的迁移。

  更能体现这一态度的是华为对开发者的支持。

  侯金龙表示,开发者是产业的灵魂,未来 5 年培养 500 万开发者,将投入 15 亿美金用于发展产业生态。

  那么,华为到底想要做什么?

  胡厚崑也在采访中给出了答案:面向智能时代,华为想要做的是成为数字世界的“底座”。

  如此愿景,你怎么看?

AICODER编辑推荐:



报名就业班送基础班

最近分享