深圳具身智能公司“自变量”完成B轮融资,由小米战投领投,成为国内唯一集齐字节、美团、阿里、小米四大互联网巨头投资的具身智能创业公司,其自研基础模型WALL-B亮相,强调“大脑”而非本体硬件是核心竞争力,旨在解决“硬件到位、大脑空心化”的行业困局,公司已进入超100户家庭采集数据,推动机器人从工业迈向家庭服务。

深圳具身智能赛道再次迎来重磅玩家,4月21日,自变量机器人(以下简称“自变量”)同时对外释放了两枚“信号弹”:公司全新B轮融资已尘埃落定,由小米战投担任领投方;其自研的具身智能基础模型WALL-B正式亮相,并宣布了“让机器人进入家庭”的下一阶段战略规划。
值得注意的是,随着小米正式下场布局,自变量已经悄然成为国内唯一一家,同时集齐了字节跳动、美团、阿里巴巴和小米四家互联网巨头作为投资方的具身智能startup,这种“明星资本俱乐部”式的股东阵容,在行业内并不多见。
为什么敢把这么核心的筹码押注在自变量身上?其创始人兼CEO王潜将答案归结于两个字:“技术”。“不论阿里、小米还是字节,他们募投的钱本质上都是投向技术的绝对领先性。”他解读道,这些投资方自身都已经深度涉足大模型研发,具备超乎常人的技术判别视野,它们关注的往往不是短期的账面回报,而是能不能在三五年之后构筑成一道牢固的“技术护城河”。
有人也提出了疑问:这几家巨头不也是在亲自下场搞自己的具身智能底座吗?投资你不会产生“内耗”吗?王潜并不遮掩这种潜在竞争关系,他间接回应称:“首先这个市场本身就大得惊人,足够装得下几位‘巨人’,到了真正‘过窄门’的时候,创业公司在软硬件一体化和适配灵活性上的能力,才是大厂无论如何也无法短期内复制的基因。”
他相信,单兵打仗的灵活性、软硬一体的生态打磨能力以及对具体应用场景的渗透速度,恰恰是大厂效率往往难以匹敌的赛道引擎。“做硬件本身并不是护城河,”王潜补充道,“今天你做一款双足机器人出来,国内供应链不出三天就能跑通,五天就能上同款,但你没法把一个带‘大脑’的机器人拷贝出来,因为技术在迭代速度和数据飞轮中间有个令人绝望的门槛。”
以此次发布的WALL-B为代表的基础模型(即机器人大脑)体系,就是把自变量的发展方向从“组装出流畅的四肢”拉回到了人类进化的本质:大脑是统领一切的中心。
在这套理念下,之前那种只能劈叉、后空翻、按遥控写毛笔字的所谓“酷炫机器人”——统统被王潜视为“空有一身肌肉漂亮但大脑空空的行尸走肉”,他毫不客气地将这些人与他的团队划清了赛道。
“去跑马拉松的机器人和我们是两个行业,完全不同。”他进一步解释说,当前行业割裂局面已经非常明显,不少公司的确把双足、灵巧手指关节等机器人肌肉装备到了极致,硬件几乎到位了,但终端却缺乏感知、决策与实时适应的核心轴承,这就是所谓的“硬件到位,大脑空心化”的尴尬困局。
在他看来,要想真正让机器人取代人类在家服务,难度要比工业工厂里复刻同一个动作上万次困难倍级,王潜用了一组非常直给的对比:“工厂里那套逻辑,一个点焊工作对上万次,环境条件就是锁死的定值,可在家里让它做一件事——从沙发上拿一件有熊宝贝图案的包装递给我’——一次环境一个样,天花板比玻璃储物柜高,橱柜深度也和培训文件夹上的尺寸大不一样,一万个不同的动作、一万个不可控的外界环境,这样的“一万”,才是关卡。
市场讨论在近期的“机器人马拉松”事件中炸开了锅,大量围观者惊叹于“长手长脚”的机身耐力时,业内则在私下争议:如果大厂都入场了,现在竞争的逻辑正在从机械本体转移到最强脑力的全量数据底座;窗口期?某些本体玩家的优势或许仅只会维持几个月。
针对这些问题,自变量的技术人员拿出了一个与众不懂的武器:WALL-B背后的WUM架构(统一模型),CTO王昊用自己的行业积淀做了极其生动又略微硬核的近人比喻:如果将现有的主流VLA架构比作是M1芯片之前的Mac,标准CPU + GPU + 各自分立的内存单元,模块之间随时存在着“搬运损耗”,本来视觉模块读出一副充满细节的视频画面,传到语言小模块再转给动作模组――语言模块给了发个打包后的“特征摘要”,大量动作识别的有效信息就这样在“运垃圾”一般的通道中被丢掉了。
而自变量的WUM正是一种高度类似于Apple Silicon统一内存的做法:让视觉、触觉、语音,甚至是对物理世界引力的预测绑定在一个显存里动,全部在同一个体系里从零训练,共生内置,说白了,一是原生多模态底子:能够“导-出全模态”的小模型能力模型可以对自己要进门的尺寸和动作形成“本体感知”输出;模型甚至可以对重物模拟物理世界的掉落拐弯路径——例如预见一个装着杯具的壶一旦碰到桌角必然会顺势掉落;交互时能抗失机,第一步挤入空隙没对准,可以再次回撤、抬起、判断操作可能性而非直接Standby不动报废任务。
究竟靠什么压制住大厂的技术重置与资金碾压?“大模型的架构半年前的事马上就暴露,大家知道引擎怎么搭并不难,追关键在于数据组织机制那一整套封闭背后的工程奇迹。”王潜对这一系列“秘诀”高度重视。
为加速WALL-B“大脑细胞”的决策经验,自变量甚至已经深入超过100个邻居的家中取经,据了解真实住户环境的地上有时七零八散布满零食、包裹、还有跑来跑去撞台灯的猫,数据显示这些不被捕捉的非工整特写,才能滋养大脑真正自我修正;随着这种内在模型每天产生同步传输的新家数据与尝试完成的任务实例,“笨板生花”自我调优成为现实。
在商业模式层面,整个公司动作也算雷厉:搭载Wall-B版本的机器人预计现在1个月内就可以送入小批封闭半开放内测用户的家中充当“入门实习生”,虽号称是出分离状态下仍不时插错接口或者走走停停,但王潜相信一个月数据训下来,每周的不间断轮转都将促使“便宜普适自律”的大管家越来越机灵——这是个面向新一轮生活形态的先行生态,科技玩家能否击败千万家庭那凌乱日常里不可方物的“人性拓扑分解”?没人能说得清拐点什么到,但在大脑计算的具身智能地图上,这家硬桌者的小跑扇或者己快带出一波重新分配水位的时间之牌。