百川智能创始人王小川发布新一代医疗大模型Baichuan-M4及AI家庭医生“百小医”,强调AI进入医疗必须走“医疗增强”路线,而非仅靠通用大模型,M4在三大医疗评测中登顶,事实性幻觉率压至3.3%,具备低幻觉、强循证、会追问三大能力,百小医则聚焦家庭健康管理,承担筛查、随访等任务,并构建“四级诊疗新范式”,重新衔接医院与家庭,百川宣布开放合作,推动可信医疗AI系统落地。

5月26日中午,一场聚焦AI医疗新范式的高端学术论坛上,百川智能创始人兼CEO王小川正式揭开了新一代医疗大模型Baichuan-M4与AI家庭医生“百小医”的面纱,这位技术出身的创业者用一场干货满满的演讲,勾勒出人工智能切入医疗领域的新路径——不是泛泛而谈的“智能助手”,而是一套能让患者安心、医生信任的医疗增强体系。
王小川在演讲中直言,过去一年,通用大模型在医疗健康咨询领域掀起了一股热潮,平台上,患者发烧了问AI,孩子出疹子查AI,拿到晦涩的体检报告也习惯性丢给AI,粗略统计,这类医疗咨询的调用量已经达到数千万人次,热闹背后是临床一线医生们的“差评”反馈。“通用模型的回答聊起来很顺畅,看起来很有专业范儿,但真实情况是——‘看似对,实际危险’。”王小川毫不避讳地说道,模型产生的虚假信息被包装成了某种笃定的结论,患者带着AI给出的“诊断”走进诊室,反而质疑医生的判断,原本旨在减轻负担的技术工具,却在无形中加剧了医患之间的对立。
“这恰恰说明,AI真正走进医疗行业,光靠通用大模型是不够的,必须走医疗增强的路线。”王小川将这种“刚性需求”拆解为三个维度:第一,低幻觉,医疗领域容不得半点编造,一句错误的建议可能关乎生命安危;第二,强循证,临床诊断有其严谨的循证链条,绝非像猜谜一样“看症状猜病名”;第三,会追问,任何受过正规训练的医生都不会在患者刚说完第一句话时就拍板下结论,反观现在的通用大模型,这三项硬指标几乎全军覆没。
论坛现场,王小川当场展示了百川新一代医疗专用大模型Baichuan-M4的硬核成绩单,在国际医疗评测标杆中标,M4在HealthBench、HealthBench Hard、HealthBench Professional三大榜单中同时登顶世界第一,彻底压过了GPT-5.5、Opus 4.7以及DeepSeek-V4-Pro等知名模型,背后的核心技术是一套原创的“事实性感知强化学习算法”,借助这套机制,M4的裸模型事实性幻觉率被压到3.3%,再次刷新了全球最低纪录。
在循证能力层面,M4将权威医学指南进行原子化拆解,提炼出1000多条标准化的临床路径,每一条都由顶尖临床专家亲自定义和校验,这不仅保证了模型的回答逻辑严谨,还能让它的思考方式尽可能贴近真实医生的诊疗习惯,在深度问诊上,M4大幅领先通用类模型——它不仅会像临床医生一样步步追问,还拥有超长记忆功能,能在多次对话中持续获取患者的详细资料,王晓川形象地总结道:当叠加Harness调度、记忆和自进化能力后,M4会从单纯的“医疗大脑”升级为具备自动行动能力的“医疗智能体”。
面向个人和家庭的AI家庭医生百小医,因此成为现场的另一个重头戏,百小医的产品设计包含两个核心理念:第一,“不替代,而是接手”——它不试图取代真人医生的临床决策,而是精准地接管那些医生看不完、管不过来的碎片化健康管理任务;第二,“不止管单人,统管全家健康”——用户可以通过引导添加企业微信“百小医@百川家医”,随后被自动拉入家庭健康群组,系统为每位成员建立动态且独立的结构化健康档案,在日常对话中,百小医能主动捕捉高危信号,比如某位老人随口提及“最近总有点头晕”,系统背后会联动用药史和体检数据,及时提醒复诊,一句话中蕴含的健康隐患,百小医都能抓住。
依托这一逻辑,百川在现场提出了“四级诊疗新范式”,旨在重新衔接医疗机构与家庭之间的裂隙,目前中国患者大多依托三级医院、二级医院和基层医院搭建的就诊工具体系,但始终缺少一个在挂号前即能主动介入、动态响应的健康基脚,百小医扮演的正是这个“家庭底座”的角色——向上,AI家庭医生在疾病最出现端完成初步筛查和分诊;往下,三级医院的可视随访与疾病管理资源经过AI调度,直接落到每一户家庭,形成闭环。
值得关注的是,百川在产品发布会上表明了更加开放的态度——M4与百小医的能力底座,将全面开放给药企、保险公司、智能硬件平台、以及各级医疗机构,共同探索更宽泛的医疗生态合作,在全球大模型技术加速冲刺的背景下,这对医疗行业而言,可能意味着一种新变量的诞生:即以家庭为核心的,能够真正辅助医生的、可信任的医疗前沿AI系统,这一切,或许始于王小川口中的那三条刚需:低幻觉、强循证、会追问。