根据相关报道,AI公司Anthropic因旗下大模型Claude及编程工具用户激增,正面临严峻的“芯荒”困局,为此,该公司正与股东微软进行深入谈判,计划租用微软自研的Maia 200 AI芯片驱动的服务器集群,此举若成功,不仅将为Anthropic提供“即时算力补充”,也将成为微软自研芯片业务的关键突破,提振Azure云平台在AI算力市场的竞争力,Anthropic已与AWS、谷歌及SpaceX等合作,但算力瓶颈依然严峻。
在人工智能算力争夺战的激烈战场上,一家备受瞩目的AI公司正陷入前所未有的“芯荒”困局,受旗下大模型Claude及编程工具Claude Code用户量暴增的影响,Anthropic这匹行业黑马如今不得不四处寻求算力支援,而最新的突破口,竟然指向了它的重要股东——微软。
据知情人士透露,Anthropic目前正与微软进行深入的服务器租赁谈判,该计划的核心,是租用微软自主研发的Maia 200 AI芯片所驱动的服务器集群,如果双方最终签署协议,这将是微软自研芯片业务迎来分水岭的时刻:拿下Anthropic这样重量级的外部客户,将成为微软打破眼下AI芯片供应僵局的关键一役。
多年来,微软在专用AI芯片市场上一直处于追赶态势,落后于亚马逊AWS的Trainium芯片和谷歌谷歌的TPU加速器,要知道,在过去一个季度中,AWS与谷歌通过自研芯片已经瓜分了大量高端AI工作负载,使得微软在企业级AI硬件生态中形成了明显短板,若能赢得Anthropic的订单,必将大幅提振Azure云平台在AI算力调配方面的竞争力。
Anthropic与芯片厂商的战略合作早已全面铺开,目前该公司的算力布局呈现“多手准备”的特征——它已分别与AWS和谷歌签署了协议,采用这两家科技巨头的自研芯片,但即便如此,Anthropic首席执行官Dario Amodei月初在接受采访时坦言,公司依旧面临极为严峻的算力瓶颈。“这不是短期阵痛,而是一个系统性的供应紧张,”Amodei当时不无焦虑地表示。
有业内人士分析,随着AI开发工具的平民化普及,尤其是以Claude Code为代表的新一代生产力工具的爆火,外界对算力的渴求正在指数级增长,在仅仅半年前,没有人预判到这种情况会发生得如此之快,这也是为什么Anthropic在走投无路之下,甚至不惜“大材小用”——与SpaceX签署了一项临时协议,将该太空探索公司旗下的Colossus 1超级计算机全部交由自己使用,这固然能解一时之渴,但从更加战略性的视角来看,租用专为AI负载优化的硅基芯片才能提供长期的实质性帮助。
值得关注的是,微软于今年1月正式发布了第二代Maia 200芯片,根据微软CEO萨提亚·纳德拉在发布会上披露的数据,这款新品每单位功耗下处理的Token规模相比上一代提升了显著幅度,最重要的是,Maia 200在每美元采买成本的Token产出比上竟提升了超过30%,具体而言,这相当于为企业客户打开了通往高效算力的新世界——本就昂贵的GPU资源在成本敏感场景下尤为难以支撑,而Maia的这种性价比优势正好切中要害。
更有意思的是,如果顺利谈妥合作,那么Anthropic将获得“即时算力补充”,与其坐等其他厂商将其算力订单排期至2025年年底,显然谈判条件中更诱人的部分来自交付时效,供应链上下游更多从业者留意到,与SpaceX之间Colossus 1出租协议的执行并非一帆风顺——过程中甚至因为数据中心制冷系统的配额问题发生过短暂的僵局,而这种“租超算”的方式也并非能以常态运转的做法。
如果微软与Anthropic最终成功合作,还可能带动三大主要公有云在与AI应用深度绑定商业模式方面发生新变化,有数据指出,截至今年第一季度,微软与OpenAI分享的Azure份额已经流入长期租赁协议中,部分客户会要求在付费后共同占用延迟资源的灵活产出,这也预示着接下来AI行业竞合关系正面临更深度的范式调整,尤其是在Anthropic早已在接受微软数十亿级投资的情况下,这场“租借Mei芯片”的合作更缺乏简单的单向依赖特征,而是形成了A提供先进模型倒逼芯片出货、微软用新型硬件扩张平台生态的双向互惠。
不过就在业界讨论谈判可能引发的技术溢出效应时,部分美国AI硬件分析师发出比较保留的看法:虽然Maia带来一定的红利,但还需要更多规模化部署并与更多工作负载兼容,换句话说,“从200芯片到百万级集群的场景部署目前还是早期发展。”一位不愿意公开姓名但已签约微软合作伙伴项目的企业云架构师向我们表示,实际投产层面该芯片是否完全等效于NVIDIA最新H100在软件工具链和环境编排上的整合默契,目前还需要时间检验。
尽管如此,在AI大模型商战快进到今天这个节点,业界对中国AI产业显然也构成倒逼效应与深层映照,AMD及其合作伙伴联想推出基于Kunlun芯片的自主研发CI矩阵时已宣布对外供应24卡配置的运力池,形成特定范围内的竞争腹地联盟,一场关于“全球AI算力链如何最终洗牌”的重要性探讨论述仍在路上持续推进。
值得补充的市场层面观察还可从芯片产线上一窥端倪:在半导体产能面临大环境影响尚未完全消散的前提下,预计自有推理叠加提升资源配置透明度的租备新型AI计算资源,将可能成为全球云计算的第四波趋势风口,全球上市公司第三财政季度财报发布后,云计算领域的资本开支总体以46.7%的增长比例推升创历史纪录,而其中大比例被划入AI创新业务层面中,可以认为,面向即将到来的算力多元化分配模式的变革即将迅猛推开,由此可见,租Maia也好,借其它种自研IC也罢,拼争的是“快速装满可用智能产业工厂的货架”。