当前位置:首页 > 行业动态 > 正文

平头哥展示芯片发展路径 阿里云推进全栈Agent化演进

摘要: 根据报道,阿里云在年度云峰会上发布全面Agent化升级方案,推出“千问云”官网、自研芯片真武M890及旗舰大模型Qwen3.7-...
根据报道,阿里云在年度云峰会上发布全面Agent化升级方案,推出“千问云”官网、自研芯片真武M890及旗舰大模型Qwen3.7-Max,标志着“Agent驱动原生云”成为战略核心,Agent已从概念走向实践,成为云资源的真正使用者,自主完成资源调配,平头哥披露未来两年芯片路线图,真武系列累计出货56万片,阿里云MaaS业务收入增长显著,已实现盈利,并预期2026年占据中国AI云市场近八成增量。

界面新闻编辑 | 文姝琪

在AI云计算领域深耕多年的阿里云,如今正把“Agent驱动原生云”推向战略核心位置,过去,这家科技巨头更常提及“AI云”或“AI原生云”的概念,但在最近的动作中,Agentic Native云成为其新的技术主旋律。

5月20日的年度云峰会上,阿里云以一种前所未有的姿态,发布了覆盖“芯片—云基础设施—模型—推理”的完整Agent化升级方案,在这场密集的新品亮相中,包括全新的AI产品官网“千问云”、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰大模型Qwen3.7-Max一并面世。

这次变革的核心信号在于:Agent正悄悄从概念走向实践,变成云资源的“真正使用者”,它不再只是对话框里的聊天机器人,而能自主完成沙箱开通、服务部署,并直接调用庞大的云计算资源,用阿里云资深副总裁刘伟光的话来说,这在过去是难以想象的——此前,Minimax等客户在一天之内就完成了往常需要人类团队工作两周的云计算资源配给。“云计算的发动机已经切换到了自动驾驶模式。”刘伟光在采访中形象比喻。

几乎在同一时间,谷歌I/O大会也释放出相似的信号:Agent正在重塑整个计算基础设施布局,全球顶尖科技企业的思路正趋于一致——未来的计算架构将是由Agent主导,而构建从底到顶的全栈AI能力,已不再是一个可选项,而是一道必答题。

界面新闻记者 | 程璐
Agentic Native云的战略地位被提升至全新高度(界面新闻记者摄)

这股由智能体(Agent)掀起的变革浪潮,也使得云厂商的进化节奏骤然提速,来自阿里云的内部数据显示,在过去五个月里,其在MaaS(模型即服务)市场上的日均Token收入增长了约15倍,根据阿里最近发布的财报数据,包含百炼MaaS平台在内的AI模型及应用服务的ARR(年度经常性收入)已突破80亿元人民币,预计到年底将迈向300亿元大关。

“智能体一旦突破了临界点的应用密度,它对云资源和AI能力的消费就会呈现出指数级扩张态势。”刘伟光说,这也正是云厂商必须提前备战的关键原因。

从“云芯模”一体化的提法,升级为如今更强的“全栈协同”策略,阿里云的路径变得愈发清晰,在刘伟光的解释中,客户当前得到的最终价值输出,已经必须由模型能力、芯片能力和云基础设施能力三者深度绑定缝合而成。“如果没有芯片层面的自主创新与支撑,谈论开放云和极致性价比,是缺乏底气的。”

作为阿里云底层生态的重要一环,阿里旗下半导体公司平头哥也在这场峰会上首次披露了未来两年的芯片演进路线图(Roadmap),这份蓝图明确展示了接下来两代芯片的核心迭代方向——大幅提升大模型训练以及推理任务的效率。

平头哥新一代AI芯片真武M890,拥有144GB大容量显存和800GB/s的高速片间互联带宽,在基准测试中性能飙升至上一代产品的三倍,路线图预定2027年推出代号V900的下一代芯片,并在2028年面世J900系列,平板哥正力图保持一年一次重大迭代的节奏。“在Agent化时代,一个Agent在执行一套复杂命令时,会在毫秒级别内连续向模型发送数十次调用请求,计算、存储与网络资源的协同链条必须无死角地紧密咬合。”平头哥副总裁高慧在发布会上如此阐释。

界面新闻记者 | 程璐
平头哥亮出未来两年的技术路线图(官方供图)

另据高慧透露,截至今年4月,平头哥真武系列AI芯片累计实现56万片出货量,服务范围覆盖超过20个行业,并为400多家客户提供算力支持。

放眼整个市场,全球AI算力需求井喷与芯片出口管制所带来的抑制效应,恰好为国产算力阵营创造了一个至关重要的发展窗口期,根据国际调研机构IDC的相关数据显示,在2025年中国加速服务器(AI芯片)市场总量预估达到约400万张出货量的背景下,英伟达以220万张的规模保持领先地位,但国产芯片整体正强势补齐,出货总数已达165万张,市占率首次突破41%,平头哥在国产品牌队列中已稳定排在第二的位置。

国产芯片渗透率快速攀升,最底层的逻辑在于当今时代算力事实上已成为强卖方市场,而本土厂商依靠灵活敏捷的算法适配与深度工程优化,有可能打磨出更优秀的性价比表现。

对于“性价比”究竟好在哪里的问题,刘伟光给出了一个极为坦率的阐释:“同样一组节点,同样一片芯片,在特定的大模型推理任务下,有些平台能吐出更多富有价值的高质量Token,有些则不行。”他判断到,如果别家平台拿来阿里云的开源千问模型直接跑,必定很难跑过阿里云自家的百炼系统——因为阿里云的工程优化团队和模型开发团队本就是一体的,每天贴身配合,合作做深度迭代。“这种将软件技术栈与底层硬件融合所带来的竞争壁垒,外界短期复制难度很大。”

经过此次极具力度的升级后,由Agent引擎拉动成长的MaaS收入,也许正在孕育迭代ECS(云服务器)业务,成为阿里云内部的第一大产品线,据相关知情人士对界面新闻透露,在中国大语言模型(LLM)市场领域里,阿里云MaaS业务的收入如今已占据头把交椅。

这种显著的增长,根源于Token产品在核心价值认知上的进阶,在刘伟光去年遍访几百家客户之后他意识到,两年前模型的成熟度还不够高,企业并不会单纯为“AI”支付可观的溢价,但时下的2025年,代码编码(Coding)能力的突破性进化使得整个市场迎来得一个分水岭,模型已逐步摆脱早期纯提效工具的标签,开始在那些人类不可胜任甚至不可能涉足的任务中承担角色。“AI完成了角色跃迁——从企业的成本项演化为实实在在的生产资料。”刘伟光形容道,当这一点落地,它的预算自然会单独剥离出来,同时带动Token相关支出的显著跃升。

据其观察,人工智能原生创业公司的模型调用支出,可占全体投入的近乎百分之百;大中型互联网企业模型支出的占比大体在15%到20%这一区间;相较之下,传统行业体虽还在5%以下徘徊,却表现出极高的增长速度。

提到利润率,刘伟光明确确认了MaaS业务当下已转到盈利模式,“阿里云MaaS从发布第一天定价时就设定了能够盈利的空间。”而在他对未来利润结构演进的描绘里,收入与利润的增长动力有三种主要组成:一、依托高频模型调用本身的公共云MaaS,利润率高于单纯的算力硬件销售;二、私有部署的桌面之下,挖掘企业在私有化环境做定制化模型落地的机会;三、Agent云联动所带来的传统底座需求扩张——每一个Token背后都会有大约对等的CPU力、数据存储服务、网络租金的消耗发生,这形成了一条“每一块钱GPU消费带出一块钱CPU收入”的联动链效应。

在内部,阿里云的效能评价指标也有了改变——它不再一味追求Token调用的绝对额量高低,目光切换到以下三项关键参数:付费Token客户的日增长速率变化、核心系统接入AI模型的效率与纵深,以及智能体在企业一整套生产流中独立闭环任务的成功率比例。

伴随着重大产品迭代,阿里云的销售模型也踏上不可偏废的转型道路。“过去,我们的人进到客户那里,聊的是IT部门,问他们是添多少台服务器、买多少容量的数据库,每个人光是目测对方线下机房服务器数量,一张发票上的营收就能估得没错。”刘伟光表示,但做MaaS时间长了,面对的问题全然不一样了:销售额几乎没有固有指标可循,销售人员不再只跟技术大佬照面,还必须和围绕营收负责的业务骨干,甚至公司CEO畅谈现在的程序编码方式,探讨它们的市场营销模型,洞察哪里能通过智能化优化产线,足有几千人的阿里云销售团队,人人需要扭转过往作业思路、挖掘不存在于以往需求财报清单里的新领地,阿里巴巴的架构也在调整,专门匹配MaaS需求的营销岗目前加速得以落地分化。

从整个战略目标来看,2026年逼近八成的中国AI云市场增量,已成为刘伟光和团队的誓约之意,他现在坦然告知外界:在中国的语言大模型推理市场,阿里云拿到了绝大多数的新增订户增量,而在先前积累多年的金融、车企、政务及运营商头部合作关系网,连带已经覆盖全国纵深的直销分销生态,“全都是到达这个目标不言自喻的基石。”

值得警惕的是,风光背后,整个正在深度迭代的全栈策略最终是否能在大规模商业接受的花园中生根,还待时日辨识,界面新闻掌握了部分来自知情人传递的现实关卡:因为跟今天国外顶尖产品间的真实性能差短期无法抹去,再配合整个供应链从始端便不断抬头送来的芯片原材料涨价,许多平台做自研芯或者买国内设备建立AI云的环节上,“从一瓦芯片的性能转换到AI的价值客户,一本非常精确经济账在对账时根本是打不平的。”自阿里内部向外传递的期许,“性价比”这张牌要想真正生效抓手还有极强的行动前要求。

相关行业人士还提醒,“一家不缺活就代表着供给终也是有限的点”——不仅是算力领先的阿里云,我们正在看的国内整体市场算力总体局势都处于需求大于产能的范围,争夺的算力应该向哪些核心业务倾轧、应当优先保障多少比例的临场忠实商户扩充,已成为在大厂决策人员会桌上必须耐心核定的事项。