2024欧洲杯(中国区)官网-登录入口

首页 资讯 娱乐 新闻 旅游 汽车 电影

2024欧洲杯(中国区)官网-登录入口除了上头提到的英伟达-2024欧洲杯(中国区)官网-登录入口

发布日期:2024-05-22 11:03    点击次数:109

  文|锦缎 启新

  东谈主类社会正在悄然从互联网期间切换到算力网期间。

  鲜有东谈主感知到的是,期间转动序曲中,遭遇的第一批实体进攻,除了GPU、HBM,还有交换机——此前商场鲜关连注的交换机,正在扼住AI算力的咽喉。

  全面出击的英伟达VS蓄势反击的定约,是GPU、HBM之后AI的第三场干戈:一场科技史上围绕交换机的精彩对决行将演出。

  01、想科后遗症

  淌若用东谈主体结构来类比AI算力,不错作念如下交融:AI芯片(由GPU+HBM+CoWoS组成)是腹黑,CUDA等加快软件是大脑,光模块是要津,线缆光纤是血管,以交换机为代表的网罗拓荒是咽喉。不同的拓荒书册,最终呈现的是悉数工作器集群。

  其中AI芯片、CUDA、光模块、线缆,都一经被番来覆去的究诘过多半回,成为阳谋。但令东谈主愕然的是,为什么交换机当作中枢的组网拓荒之一,却一直备受凄惨,只可充任AI暗器。

  凭证界说,交换机(Switch),责任于OSI网罗模子中的数据链路层,智能地决定将数据帧从哪个端口转发出去,从而杀青网罗中的数据交换和流量管制。因此,交换机的中枢作用是提高网罗的性能和效力,并支撑网罗的膨大和管制。浅薄交融,交换机就是“网罗效应”的硬件载体。

  何况从商场界限来看,交换机也相配之弥留。凭证IDC《2023年网罗商场追踪讲明》的最新数据,2023年全球网罗拓荒商场界限为714亿好意思元,其中交换机杰出400亿好意思元,是仅次于AI芯片、工作器的核默算力组件,界限以致要高大于近期被火热究诘的光模块和高速存储HBM。

  黄教主其的确公开地方也抒发过交换机的中枢性位。老黄曾裸露,在AI悉数集群投资中,InfiniBand网罗(以下均简称IB)约占总资本的20%。这里浅易科普一下,IB网罗是英伟达在子公司Mellanox的匡助下,我方搭建的用在工作器之间的算力通讯网罗,其中所使用的中枢交换机为自产的IB交换机。

  既然从技能角度来看如斯弥留、从商场界限看也不小,怎样交换机就恒久不被公共瞻仰呢?

  笔者认为,最主要的原因在于交换机被见地式的认为是网罗架构中破裂的存在,毕竟HBM、CoWoS这些新名词一听就是十倍空间起跳的宏大故事。而一提交换机,公共要求反射式的料想:这不就是2000年互联网泡沫时的想科的居品么,还能炒吗?

  20多年前想科当作全球网罗拓荒的王人备龙头,与现如今的英伟达享受的是一样的地位。在2000年,想科的网罗交换机商场份额杰出6成,路由器份额杰出8成,不错说莫得想科的网罗拓荒,就不会有其后的互联网繁华发展,当年想科被誉为互联网卖铲东谈主。

  其后的故事公共想必每个东谈主都知谈了,跟着互联网泡沫的败坏,想科的股价遭受了重创,从高点下落了杰出70%。公司其后用了20年,才拼凑填平当年估值带来的狂热泡沫。科技行业自然“弃旧恋新”,交换机这个老形貌自然被绕着走,何况当年被深套的惊怖还深深刻在每个投资东谈主的反射弧里。

  但见地一经是以前式,当下时点,例必要从头注目对交换机、尤其是AI交换机的交融了。原因无他,各方面的信号一经终点昭彰,温存举出两例:

  全球龙头企业,一经初始在新式交换机和网罗架构上正面强烈交锋。除了上头提到的英伟达,其实超以太网定约的动作也终点之大,后文会具体分析。

  好意思股投资东谈主也初始追捧交换机标的。在最新的AI交换机中,龙头毫无疑问是英伟达的子公司Mellanox,可是由于不只独上市和裸露财务数据,看不到太多细节;第三方AI交换机的龙头不是前文提到的想科而是后期之秀Arista,其股价在2023年上半年第一轮AI海浪中之中莫得跑赢纳斯达克,可是自2023年底初始加快高涨,这娇傲好意思国投资东谈主正在从头注目它的弥留性。

图:高速交换机龙头Arista股价初始加快高涨图:高速交换机龙头Arista股价初始加快高涨

  02、第三堵墙

  今天再度从头意志交换机必要性,就缘自交换居品的自身发生了紧要变化,何况交换机在网罗中的弥留性也在昭彰素质,以致一经成为AI基础设施中的三堵高墙之一。

  1、AI催生算力网创新

  似乎网罗架构一经停滞很深切。淌若深究网罗架构的变迁史,不难发现OSI网罗模子上一次大的变革,还要追料想十多年前云计较爆发时期的“网随云动”。在停滞十多年后,咱们不雅察到,AI将催生互联网罗拓荒的最新创新,将促使网罗架构从互联网期间切换到算力网期间。

  算力网该如何交融?起始说以前互联网中网罗拓荒的中枢任务,是完成即时通讯,是以交换机骨子上是一个通讯拓荒;而目下AI算力中心中网罗拓荒的构建逻辑,在于齐集力量办大事,即勾通越来越刚劲的算力,交换机不再只是是通讯拓荒,而变成了算力拓荒自身。

  想必有好多东谈主在这儿会持反对气派。无须惊悸,请陆续看背面的讲明。

  人所共知,这一轮AI概况顺利是轻易出遗址的工程学冲破,背后的带领规则是“scaling law”,scaling law描写的模子性能与模子界限之间的幂律关系,这一规则标明,当模子的界限(举例参数数目、数据集大小和计较资源)加多时,模子的性能将获得提高。

  换句话说,为特出到AI大模子智能的表露,scaling law告诉你要连接的堆算力和数据。这亦然为什么,在2024年3月初,黄仁勋斯坦福大学演讲时提到,在畴昔的10年里,英伟达会把深度学习的计较才智再提高100万倍。这并不是泡沫时期的大放卫星,而是AI智能表露的必要要求。

  算力要杀青如斯恐怖的素质幅度来知足scaling law,从硬件的角度来分析,路上有三堵墙:

  1)算力墙:中枢围绕GPU,亦然公共在AI算力硬件中平和度最高的居品。取销算力墙最要害的技能技能是制程和芯片架构的升级。但制程带来的单芯片算力素质濒临着黑洞般的AI需求,已显得煞白无力。毕竟目下的苹果最新的3nm的A17芯片,升级的成果一经聊胜于无。实践上,英伟达的GPU,聘用的只是4nm制程,以致下一代居品B100,也不会升级到3nm。每一代际算力倍增可能一经是单芯片算力素质的极限了。

  2)存储墙:中枢围绕HBM。单芯片算力跟不上,不错靠HBM来大大缓解,在《AI国力干戈:GPU是明线,HBM是暗线》一文中有详确究诘,不错移步于此。HBM反倒成为一个赶紧高出的门径,海力士和好意思光最近股价飙升等于商场初始融会到这一标的的弥留性。

  3)通讯墙:算力和HBM勾通在沿途责罚单卡的问题,但单卡再强也远远跟不高下流的算力需求。进一步的责罚要领是堆料,抛开复杂的技能名词,其实旨趣就是浅易奸诈的轻易出遗址,把尽量多的优质的算力卡连起来组成算力集群,这与猎鹰火箭装27台发动机骨子上是一个兴味,其中的要害技能就在于数据中心的组网技能,因此,交换机的地位今时不同往日。

  从最新的英伟达GB200计较集群网罗架构中,咱们概况终点知道的看到多处堆料组网的技能:1)GPU卡与GPU卡之间,基于NVLink公约的卡间互联,这部分拨套的switch芯片,由于被英伟达把持,莫得太多产业链接头的意旨,因此不再伸开。2)再往上一层,就是IB交换机,它贯串起多个GPU卡群,组成一个齐全的机柜Rack。3)多个机柜再通过交换机互联,酿成强力的AI算力中心。背面两个门径,都离不开AI交换机的支撑。

  这种架构就能终点知道的看到,为了冲破通讯墙打造刚劲的算力基座,交换机不只是是充任算力网罗中的通讯拓荒,而自身也变成算力拓荒的自身。恰是这一产业链门径界说的变化,给了悉数交换机产业链拔估值的基础。

  在这一轮算力网革掷中,交换机认真与GPU、HBM、先进封装、光模块一谈,站到了产业链的C位。

图:GB200计较集群网罗架构,起首:英伟达官网,中金公司图:GB200计较集群网罗架构,起首:英伟达官网,中金公司

  2、初听不识曲满意,再听已诟谇中东谈主

  其实,产业链的这一变化不是2024年英伟达通过GB200才向全天下摊牌的,最早的信号发端于5年前。

  2019年,英伟达豪掷69亿好意思元,打败英特尔和微软收购了彼时绝大部分都还相比生分的Mellanox。笔者当年亦然不睬解一个芯片厂玩什么交换机,只是以为这关于财大气粗的英伟达来说,算一个不大不小的收购,自然亦然莫得仔细分析产业链上的协同效应。

  但跟着AI算力爆发,Mellanox的弥留性飙升,成为英伟达IB交换机、Spectrum-X以太网交换的御用供应商,占据了AI网罗拓荒中的最高份额。绝不夸张的说,目下Arista市值接近1000亿好意思元,Mellanox不错收缩给到3000亿好意思元,较当年看似极其溢价的69亿好意思元增值43倍,远超这5年英伟达的市值高涨幅度。

  老黄其时就对这笔收购终点舒坦,曾说这是两家全球最初高性能计较公司的勾通,早在5年前就一经把Mellanox放在与英伟达同等弥留的位置上,回头来看不得不推奖老黄的目光如实毒辣。

  Mellanox,凭什么能跟英伟达平起平坐?Mellanox提供的主要居品是数据中心内的通讯互联责罚有计算,而其中最为中枢的又是基于IB公约开发的一些列网罗拓荒居品,这儿有必要伸开说一下IB公约。

  1999年,北好意思计较机巨头们牵头组织IB定约,商量是为了取代PCIe总线公约,成为智能拓荒之间互联的新的公约表率,IB内嵌了RDMA(Remote Direct Memory Access)功能,能将工作器间内存、GPU内存直连;比如在AI的GPU集群中,RDMA技能能加快卡之间的交互,大大省俭时延。

  但IB其后声息日渐变小,而智能拓荒之间的互联,仍然是由性价比更高的PCIe公约紧紧占据了中枢位置。这是由于IB公约需要专诚的网卡和交换机来支撑,导致了居高不下的硬件资本,因此在跟以太网的有计算中竞争中败下阵来。头等舱是好,但莫得几个东谈主坐得起。

  其后连IB首发者英特尔都弃取了退出,最终独一Mellanox苦苦的在这条“诞妄”的道路上宝石。Mellanox公司拓荒后不久,便加入了IB定约并推出相干居品,到2015年,Mellanox在全球IB商场上的占有率达到80%,自然最初但在这一小众商场不被东谈主瞩目。2019年被英伟达收入囊中,而这之后,IB基本从一个公开公约变成了英伟达的独有公约,更不为东谈主平和了。

  直到2023年这个算力为王的期间,IB公约才一飞冲天被广为东谈主知。AI大模子的横空出世,算力的缺口一下子被放大到无尽大,而当作并行计较中要害加快器的IB公约,成了最优责罚有计算,这一公约的硬件载体,恰是IB交换机。

  在英伟达及旗下Mellanox的强势带领下,商场纷繁上调高速交换机的出货量,IDC瞻望2023-2024年,商场高速交换机增速差异为54%和60%,2024年以致还呈现加快的迹象。由于Mellanox是英伟达的子公司没法平直投资,好意思股投资东谈主转而追捧最隧谈的交换机标的Arsita,毕竟它自然不如Mellanox优秀,但亦然各大云厂商高速交换机的最大供应商。

  以点带面,通过高速交换机这个纽带,咱们不难发现,信息创新一经从互联网干与到算力网的期间。淌若在本年,你还只在聊互联网,明显一经被期间甩下了车;相同,淌若聊算力还只在聊GPU,明显三轻便点你只收拢了一个。

  03、“失落者定约”

  1、英伟达+mellanox在干什么:意欲吃干抹净

  从交换机的居品谱系图,咱们更能读懂英伟达的布局。这张图其实信息含量极大,提倡反复不雅看。

  起始说,英伟达的贪念很大,它从来都不是只想作念一个卖卡的芯片公司,而是想作念AI期间的算力有计算责罚商。或者说英伟达营业模式的变化:从来不只是想卖铲子,是卖给你悉数矿山,别再用“卖铲东谈主”来刻画英伟达了。

  英伟达2021-2025年的居品道路图,昭昭然的将这个贪念公示全球。其中标粗的是其中枢的GPU居品,从A100迭代到H100,然后再到本年的B100,再到2025年的X100,道路终点知道,亦然AI产业链平和的焦点。

  但频繁被忽略的是图表的下半部分,英伟达同期标注出了配套的交换机型号变化,分为两个IB和以太网两个系列标的:

  采纳英伟达IB公约的,配套的是由Mellanox提供的Quantum系列交换机,将顺次对应从400G升级到本年的800G,再到来岁的1.6T。值得一提的是,在这个历程中,光模块也需要对应从800G升级到1.6T然后到3.2T,Mellanox也不错部分提供。

  目下好多客户由于只可采购英伟达的GPU,一经终点被迫了,因此好多企业并不宁肯采购IB有计算,仍宝石以太网有计算。关于这种客户,英伟达也可配套提供Spectrum-X系列的以太网交换机,相同亦然将顺次对应从400G升级到本年的800G,再到来岁的1.6T,只不外互联效力要弱于IB有计算;这几款交换机亦然由Mellanox来提供。

  是以,在老黄的构想里,淌若一个超算中心是专诚为AI建的,那就用最快的IB交换机有计算;关于存量的以太网算力中心,淌若客户扭扭握握,英伟达也能匹配提供以太网有计算,就用Spectrum-X交换机。浅易来说,就是面向目下和畴昔的生意英伟达给你包圆了。

  从图中也能看到,英伟达不只是只是想同期卖芯片和交换机,它的贪念远超于此。

  淌若客户同期选购了英伟达的芯片、交换机,就离采购英伟达AI算力集群有计算不远了(图表的上半部分)。在举座有计算中,英伟达给下旅客户推自有GPU+自有网罗拓荒+自有CUDA搭建的悉数AI算力集群。这就是AI工场的模式,价值量将是只卖GPU卡的数倍以上。

  更为弥留的是,淌若悉数图杀青,这一轮的AI大潮将被英伟达杀青新版的软硬件解构,软件企业如云厂商负责荒诞氪金和试错营业模式,硬件企业英伟达负责建AI全算力和旱涝保收。

  有必要提的一句题外话是,这张图也能看出英伟达并不准备染指HBM和先进制程,台积电和海力士目下来看如故终点安全的。

图:英伟达居品道路图2、英伟达惊怖症:反击者定约图:英伟达居品道路图2、英伟达惊怖症:反击者定约

  别看各大厂的雇主,求着老黄买卡是对英伟达气派终点好;但实践上,对英伟达惊怖在硅谷正有增无已,大佬们都在牌桌下面热议如何开脱。濒临英伟达如斯凌厉的明牌攻势,此前一盘散沙的非英伟达阵营也展示出了空前的互助。

  GPU芯片和CUDA网罗,似乎壁垒过高,尽管比如谷歌一经死磕TPU多年,但奏效甚微,更多东谈主是弃取了躺平领受了英伟达在GPU上把持的现实,是以英伟达的GPU才能毛利率高达90%以上,号称有史以来最暴力的硬件。

  而交换公约和交换机,由于技能壁垒相对低,且处于产业变革的早期,成为世东谈主攻破英伟达堡垒最优的一致弃取。

  至此,交换机这一永久以来不被瞻仰的网罗拓荒,一下子跃升为AI算力基础中的暗战高地。为了追逐英伟达IB有计算,2023年7月,“超以太网定约”(Ultra Ethernet Consortium)认真拓荒,这一定约迅速成为各个大厂的救命稻草。英特尔、微软、Meta、博通、AMD、想科、Arista、Eviden、HP等陆续加入。

  超以太定约拓荒后,便立地推出了RoCEv2(RDMA over Converged Ethernet)有计算,在软件层接纳了前文提到的要害技能RDMA,剑指的标的终点明确,那就是力图对标IB性能。

  以太网的后发上风目下看有两个:

  凭证产业链调研,英伟达的IB有计算比以太网有计算贵20-30%。以太网有计算不错通过主打性价比来扳回一局。

  东谈主多势众。传统的数据中心,基本都是以太网公约,关于升级到超以太,兼容性要好得多,毕竟公约就是硬件对话的说话,用的东谈主多自然就成了主流。

  在超以太定约中的GPU全球老二AMD,把这两点说得愈加知道:以太网将成为AMD构建算力集群的基础公约,因为以太网领有更好的性能、更刚劲的大界限集群才智,以及最为中枢的绽放性,但愿与头部交换机厂商沿途,裁汰组网资本,打造更具性价比的网罗。

  也恰是基于这两点原因,不少东谈主关于超以太网定约如故很有信心的。到底是以太网胜出,如故IB一统寰宇,最终谜底只可留给时期来考据。但无论怎样样,英伟达与超以太定约的这轮对垒应该是终点精彩的,必将成为科技史上日后被东谈主反复说起的经典桥段。

  但笔者倾向于认为超以太网的胜算如故被高估了。因为Scaling Law的带领之下,AI算力网罗比拼是速率不是价钱,东谈主多淌若不是最优有计算,那可能也只是乌合之众。这就像自行车详情是更经济的出奇迹貌、骑的东谈主也多,可是莫得东谈主会用它来上高速,留赐与太网定约的时期其实未几。

图:超以太网定约3、国产还逾期以太网定约半个身位图:超以太网定约3、国产还逾期以太网定约半个身位

  原来行文至此就不错收笔了,但推断还有不少东谈主平和国产算力网罗中交换机的推崇,在此再赘述一二。

  在互联网期间的算力基础设施投资中,成绩于运营商的超前投资,我国的基础网罗速率、渗入率在全球都处于最初地位,这也在背面平直催生了中国的移动互联网隆盛,中国的互联网公司,也因此具备全球竞争力。

  不少东谈主认为,咱们在AI期间,也不错依样画葫芦,演出其后者居上的戏码。

  但不得不直面的缺憾现实是,而在算力网罗期间,咱们的算力基础设施处于全面逾期景色。咱们不只是在GPU、HBM、先进封装方面有不少课要补,代表着算力集群才智的交换机咱们也并莫得什么上风可言。一方面咱们并莫得IB交换机,只可作念以太网交换机,何况以太网交换机的代际更替上也逾期于国外1代,也就是逾期超以太网定约半个身位。

  好在和其他网罗拓荒一样,中国在交换机上其实一直具备很强的竞争力,这还要成绩于华为20多年前的勉力,以及孵化了其后的新华三。时于本日,国内的AI算力网罗中的交换机仍然救济了主干网和数据中心网罗中的形态,新华三和华为依旧是主要的玩家。

  种一棵树最佳的时期是十年前,其次是目下。自然在AI交换机上咱们逾期了不少,但依靠历史积聚和集体的力量,淌若从目下初始追逐,这一场对弈,咱们或然不成上桌。

海量资讯、精确解读,尽在新浪财经APP

连累裁剪:杨赐



----------------------------------
栏目分类
相关资讯