九游体育 - 九游9Game sports(中国)官网 平头哥甩出首款智能网卡! 400Gbps带宽、发布即量产,存算网全栈拼图就位
智东西
作家 | 程茜
剪辑 | 漠影
智东西4月29日报说念,昨日下昼,阿里平头哥旗下首款智能网卡居品磐脉920负责发布,该居品发布即量产,并来源在阿里云数据中心部署。
这是AI算力波澜下,平头哥在AI基础设施汇集领域的关节落子。
磐脉920的几项性能参数也颇有代表性:采用全自研ASIC芯片架构,国内首个内置PCIe Switch的400G智能网卡,支执多旅途RDMA,最大支执400Gbps费解带宽,可在万卡智算集群、通算集群、高性能存储场景部署。
▲磐脉920
这些性能都指向了当下AI基础设施中的关节一环——数据传输。
大模子正从单一大参数基座走向超大模子、多模态交融、长坎坷文、端边云协同、Agent边界化、及时推理的演进路子,模子参数暴涨、坎坷文窗口扩容、测验数据量级指数级增长、推理并发需求爆发,算力、存力、网力不再是配套基础设施,而是决定大模子性能上限、落地老本、迭代速率与产业边界化的三大中枢底座,三者互为不休、不行偏废。
这次磐脉920的发布,也意味着平头哥完成了算网存的全栈布局。
一、平头哥首款自研智能网卡亮相,买通低时延互联壁垒模子参数边界迈向万亿级、AI运筹帷幄集群边界突破万卡,通讯瓶颈已成为制约算力发展的中枢贫瘠,高性能互联更成为AI基础设施的刚需。
但值得阻扰的是,AI测验与推理两大中枢场景,对汇集及网卡的性能需求存在显赫各异,传统企业级网卡已难以适配其严苛条目。
在AI测验场景,测验任务往往需要数千张以至上万张GPU同期协同运算,不仅要高频、多数目传输测验数据,还要保证扫数节点同步完成数据搬运与运筹帷幄任务。而扫数这个词集群的启动收尾会受限于全网最慢节点,也就是说即便多数GPU运筹帷幄、传输速率出众,只有存在一处慢速链路或节点,扫数这个词任务就需恭候其完成,会株连收尾。
反不雅AI推理场景,其无需高强度同步勾通,但中枢诉求聚拢在小包高并发、低反馈时延,且流量具有澄清突发性。同期,推理场景中羼杂流量并存,各样流量在时延敏锐度、带宽需求、突发脾气上各异显赫,这就条目智能汇集既能完了低时延、高可靠传输,又能兼顾全网流量的高效平衡转发。
平头哥居品总监李旭慧透露,若汇集架构、网卡性能及传输诊疗未作念好优化就会出现算力奢侈,高端GPU的实际运用率往往较低,会导致多量高性能算力闲置。
正因如斯,高性能网卡的要害性不言而谕。而算作平头哥首款居品,磐脉920的性能参数也极端过硬。
磐脉920支执PCIe 5.0和112G PAM4,提供最大400Gbps费解带宽,收发包率超400Mpps,具有512个超线程中枢,搭建高效可编程平台;同期集成芯片级汇集架构、内置PCIe Switch。
硬核筹画对应的恰是磐脉920超低时延互联、多旅途喷洒与传输褂讪性、细粒度拥塞抑止智力、强适配通用性四大上风,以匹配AI训推场景需求。
来源在时延层面,磐脉920依托内置PCIe Switch,能冲破传统网卡的物理限度,确保网卡以极低时延直连GPU和SSD,减少对外部交换芯片的依赖,使系统老本责怪30%。
其次是多旅途喷洒与传输褂讪性,其支执多旅途RDMA突破了传统RDMA依赖单沿旅途的时候限度,可灵验镌汰训推任务完成时刻。李旭慧称,他们里面实测的数据炫夸,基于磐脉920实际测验和推理的完成时刻进步了14%。
第三是活泼拥塞抑止智力,其通过集成细粒度汇集感知妙技和用户可编程拥塞抑止算法,绽放自界说API,可适配智算、通算等不同汇集环境部署,在微秒级拥塞反馈和聘请性重传布局下,能保证通讯褂讪。
终末是强适配通用性,磐脉920是半高半长单宽的范例尺寸,能适配各式主流管事器、兼容主流操作系统和通讯库,作念到即插即用。
在应用方面,九游9Game sports(中国)官网它能为政企、云厂商、AI企业等客户,提供高带宽、低时延、高可靠、可活泼定制的汇集加快智力,灵验责怪算力集群通讯损耗、削减全体运维老本;另一方面,其直面大模子测验、智算集群互联、多模态推理、散播式超算等高速增长的AI中枢场景,为其增长提供了更高效且具性价比的贬责决策。
二、补都AI网力关节一环,算存网全链路自研算力与汇集的臆测密不行分,二者相反相成、不行偏废。
李旭慧作念了形象的比方,要是把算力比作AI期间的石油,网力则是输油管说念,算力提供能源,网力保险收尾,二者协同才能开释灵验算力。但当下在AI算力产业中“汇集拖了后腿”。
如今一个很澄清的产业趋势是,AI算力要点从测验单边主导向测验+推理共同驱动,且推理需求已显赫跨越测验。
永诀于测验,智能体驱动下的推理业务,羼杂流量场景会愈发复杂,对汇集的轮廓诊疗智力条目大幅进步。传统TCP网卡宽阔依赖内核转发架构,数据搬运转发支拨大、性能瓶颈澄清,单路实际灵验费解智力受限,而智能体业务自然具备交互频频、链路复杂、数据流转量大的特色,会进一步放大传统网卡的短板。
在这么的判断下,下一代AI汇集,需要打造大带宽、低时延的高性能网卡决策,才能相连执续高涨的业务需求,同期联动算力、存力协同发力,共建新一代一体化AI基础设施体系。
与绝大多数寂寞芯片公司和互联网公司芯片业务不同,平头哥已完成了算力、存力、网力的全布局。现在其已推出真武系列AI芯片、倚天系列Arm管事器CPU、磐脉系列智能网卡、镇岳系列存储主控芯片四大数据中心中枢芯片,造成竣工的底层芯片矩阵。
这一居品矩阵已造成明晰的单干体系:算力芯片为AI测验、通用运筹帷幄提供中枢地能撑执,存储芯片保险海量数据高速读写与褂讪存储,智能网卡则专攻高速通讯传输贫瘠。而更具联想力的是,昔时这三大居品还可协同优化,提供更有竞争力的基础设施贬责决策。
三、阿里“通云哥”打造全栈AI,产业价值已显现从芯片、云管事到大模子,阿里一直在构建全栈AI上风。
这一布局的底层逻辑,是大家科技赛说念行业巨头竞争范式的迭代升级。单纯依靠单项时候上风的期间决然驱散,拔帜易帜的是全链条协同布局的角逐,秘籍底层中枢芯片、基础硬件设施、大模子,直至云管事,全栈轮廓实力正成为中枢竞争的关节分水岭。
而算作国内科技企业的代表,阿里仍是把通义大模子作事部、阿里云和平头哥构成的阿里巴巴AI黄金三角“通云哥”,打造为一台AI超等运筹帷幄机。
正如李旭慧所说,平头哥布局磐脉920的中枢念念路,弥远围绕AI全栈贬责决策的落地需求伸开:但凡制约全体算力性能的关节步调,即是重点布局的标的。
自研芯片侧,平头哥在算力、存力和网力三大领域均完了了业界最初水平,举例,其“真武”PPU已成为出货量最高的国产GPU之一。
大模子领域,2023年8月起,千问系列模子的编程和Agent智力稳居国内第一梯队,是千行百业繁密头部企业的首选模子。
云管事方面,阿里云已置身大家头部阵营。本年4月,Gartner发布的《2025年大家IaaS公有云管事市集份额》阐澄清示,2025年中国IaaS市集阿里云以32.8%的份额位居第一,较2024年的30.1%进步2.7个百分点。
▲Gartner大家IaaS公有云管事市集份额评释
如今,阿里“通云哥”三位一体的布局全面成型,造成研发、考证、迭代到交易化落地的良性轮回,侧目传统各步调寂寞遐想、节略衔尾的时候款式,通尽头重脚轻紊、双向赋能的闭环效应,构筑起芯片适配模子、平台承载芯模、三者双向优化的深度适配臆测。
放眼大家,能作念到芯片、云、大模子三者的彼此优化协的公司寥寥可数九游体育 - 九游9Game sports(中国)官网,而这亦然阿里在大家AI产业竞争中的中枢壁垒。