9月18日,上海举行的华为全连接大会(HC大会)上,就提起了岁首年月由DeepSeek惹起的这场全平易近狂欢。“从本年春节起头到4月30日,颠末多团队的协同做和,终究使昇腾(Ascend )910B/910C的推理能力告竣了客户的根基需求。”徐曲军说到,DeepSeek横空出生避世吼,一时间浩繁机构、央企响应接入DeepSeek,做为算力供给商,华为也必需跟进响应。华为自2018岁首年月次发布昇腾310芯片、2019年推出昇腾910芯片以来,持续投入AI根本算力的研发取立异。虽然DeepSeek开创的模式大幅削减了算力需求,但徐曲军认为,要AGI和物理AI,华为认为,算力,过去是、将来也将继续是人工智能的环节。此中,昇腾950系列包含两颗芯片:950PR和950DT,950PR将于2026年一季度上市,950DT将于2026年四时度上市。昇腾950正在多个方面实现底子性手艺提拔:新增支撑FP8/MXFP8/HIF8、MXFP4等低精度数据格局,算力别离达到1 PFLOPS和2 PFLOPS,大幅提拔锻炼取推理效率;大幅提拔向量算力,支撑更精细粒度内存拜候;互联带宽提拔2。5倍,达到2TB/s;并搭载自研HBM手艺HIBL1。0和HIZQ2。0。正在通算范畴,华为规划了鲲鹏950取鲲鹏960,别离将于2026年第四时度和2028年第一季度上市,环绕支撑超节点和更多核、更高机能持续演进。此外,华为正式发布了面向超节点的互联和谈——灵衢,并灵衢2。0手艺规范。自2019年起头研究,灵衢1。0已商用验证,现在灵衢2。0的,旨正在邀请财产界基于灵衢研发相关产物和部件,共建灵衢生态。因为国际等复杂缘由,徐曲军也正在发布会上婉言,华为单片芯片的算力表示比不外英伟达,“但华为有三十年正在毗连手艺的堆集,华为的超节点计较机,能做到世界上算力最强,满脚全世界正在AI锻炼推理上的庞大需求。”超节点(SuperPod)是眼下是智算成长的主要趋向。徐曲军认为,超节点正在物理上由多台机械构成,但逻辑上以一台机械进修、思虑、推理。正在具体的超节点营业进展上,华为发布了Atlas 950 SuperPoD和Atlas 960 SuperPoD。此中基于昇腾950芯片的Atlas 950超节点支撑8192卡规模,由128个计较柜和32个互联柜构成,占地面积约1000平方米,FP8算力达8EFlops,FP4算力达16EFlops,互联带宽高达16 PB,相当于当前全球互联网总带宽的10倍以上。
昇腾950超节点将于2026年第四时度上市,徐曲军强调,Atlas 950超节点将是2026~2028年间全球算力最强的AI超节点。而别的的Atlas 960超节点,支撑15488卡,由176个计较柜和44个互联柜构成,算力、内存和带宽正在Atlas 950根本上再度翻番,徐曲军出格提到,超节点的价值不只限于制制、通信和计较等保守营业范畴。正在互联网财产普遍使用的保举系统方面也有主要感化。华为基于泰山950和Atlas 950可建立夹杂超节点,为下一代深度保举系统开创全新的架构标的目的。例如,若何实现8192卡甚至15488卡规模的靠得住互联,就是行业亟待处理的手艺难题。目前财产界很多已发布的超节点方案未能实现大规模摆设,其焦点瓶颈并非芯片本身,而是互联手艺尚未成熟,具体表现是两方面的挑和:一是若何做到长距离并且高靠得住。大规模超节点机柜多,柜间连接距离长达1000至2000米。当前电互联手艺正在高速信号传输时距离受限,最多仅支撑两个机柜互联;而光互联手艺虽能满脚长距离毗连需求,却无法达到单一计较机系统所要求的高靠得住性。二是若何实现超大带宽取超低时延。当前跨机柜卡间互联带宽取超节点需求存正在5倍以上差距,时延最好仅能达到3微秒摆布,取Atlas 950/960设想方针仍有24%的差距。正在时延已迫近物理极限的环境下,每0。1微秒的提拔都极具挑和。
起首,为领会决长距离且高靠得住问题,华为正在互联和谈的物理层、数据链层、收集层、传输层等每一层都引入了高靠得住机制;同时正在光引入了百纳秒级毛病检测和切换,当呈现光模块闪断或毛病时,让使用无感;而且,华为从头定义和设想了光器件、光模块和互联芯片。这些立异和设想让光互联的靠得住性提拔100倍,且互联距离跨越200米,实现了电的靠得住和光的距离。其次,为领会决大带宽且低时延问题,华为冲破了多端口聚合取高密封拆手艺,以及平等架构和同一和谈,实现了TB级的超大带宽,2。1微秒的超低时延。“恰是由于一系列系统性、原创性的手艺立异,我们才霸占了超节点互联手艺,满脚了高靠得住、全光互联、高带宽、低时延的互联要求,让大规模超节点成为了可能。前往搜狐,查看更多。