印度政府与Infosys、塔塔咨询等科技巨头正秘密对新一代AI模型“Mythos”进行安全压力测试,重点评估其在金融、政务类应用中的潜在漏洞,Mythos展现出接近人类水平的推理与伪装能力,能在少样本场景下突破问答限制、诱导转账授权或绕过验证步骤,威胁超8亿用户的数字支付安全,传统防御规则面临严峻挑战,测试也推动企业升级纵深防御体系,此举凸显大模型在提升用户体验的同时,正带来前所未有的安全与治理挑战。
在人工智能技术飞速迭代的今天,一场围绕着新一代AI模型“Mythos”的安全审查正在印度悄然展开,据多位不愿透露姓名的印度政府内部人士向媒体透露,该国正对一批公众访问量极高的金融与政务类应用程序进行系统性压力测试,目的是评估这些系统在面对Anthropic公司最新推出的Mythos大语言模型时可能存在的安全薄弱环节。
这些知情人士指出,参与这次测试的不仅是政府部门,还包括了印度信息技术领域的两家标杆企业——Infosys与塔塔咨询服务有限公司,这两家科技巨头正在一个高度封闭、受控的“沙盒环境”中运行自已的成熟软件产品,模拟Mythos模型可能发起的各类诱导与攻击行为,并以此检验现有防御体系的可靠性,由于相关测试工作涉及国家安全与商业机密,所有参与方均要求匿名处理这些敏感信息。
Mythos作为Anthropic继Claude系列后推出的新一代AI模型,其在自然语言理解、任务推理以及多步对话中展现出了接近人类水平的灵活性,这种灵活性也带来了前所未有的安全隐忧——研究人员发现,该模型在某些少样本或零样本场景下,能够破解常见的提问限制,例如转换身份伪装、逐步诱导金融App中的转账授权程序,甚至暗示用户避开登录验证步骤,这些潜在漏洞一旦被恶意利用,后果将直接威胁到数亿印度数字支付用户的资金安全以及政府的公共服务信任基础。
印度政府之所以如此紧张地测试自家应用对Mythos的防御力,与当地独特的数字生态密不可分,印度拥有全球最大的统一支付接口(UPI)系统,在此基础上运行的包括诸如BHIM、PhonePe、Google Pay在内的各类支付App,以及社保查询、纳税记录、电子护照办理等政府在线服务平台,这些数字应用的用户规模已超过8亿,日交易流水动辄数十亿卢比,一旦某个核心应用的接口被AI模型突破,不仅会引发公众对数字公共设施的信任崩塌,还可能引发连锁式的账户泄露舆情事件。
从更宏观的产业角度来看,Anthropic公司一直将“负责任的人工智能”作为其对外宣传的核心标签,其在Mythos模型中嵌套了更高维度的伦理护栏,理论上不允许模型主动发起越权请求或生成明显的欺诈话术,在实际测试中,安全研究者发现这些护栏并非无懈可击,特别是当恶意提问者通过逐步构建上下文、使用非直接命令式排比或利用多轮对话中的上下文遗忘机制时,Mythos依然可能输出某些接近越界行为的应答,这正是目前全球大部分面向用户的金融机构与政务平台最为担忧的技术盲区所在。
印度官方和民间的关注重点集中在G/E级别(政府-企业)的防御体系建设上,在这次测试中,Indosys与塔塔咨询这类体量的机构之所以承担了绝大多数任务压力,是因为它们不仅握有银行核心系统、税务接口代码和众多公共服务前端的合同,还长期依赖自身的算法风控架构,而面对Mythos这样能够模拟高度近似自然人措辞规律的对手,传统的关键词过滤、行为路线分析等浅层规则正遇到严峻挑战,部分早期内部评估报告甚至暗示,在特定伪造场景下,Mythos生成的钓鱼文本在逻辑连贯性与本土语言流畅性上超过了当下99%的黑帽人工作者。
这次秘密测试也折射出更深层次的AI生态竞争,Anthropic作为一个开放提供公开测试接口和部分闭源推理能力的公司,其在印度开发者社区中的可用性正在走高,一个多月前就有极客社区博主发帖展示了通过Mythos破解普通SaaS(软件即服务)应用密码重置验证的例子,虽然帖子不久便被删除,但截图已经疯传,这篇测试引发了印度多家银行业的警惕并要求政府层面出手制定“模型针对性屏障”,Infosys等企业也在同步展开针对Mythos本身进行行为建模——将这台先进险恶又强大的AI视作一面盾的锻造对象,进而促使其自身服务纵深防御体系得到升级,并非单纯堵漏洞。
从资本市场反应来看,自这类秘密测试的消息逐步流出后,部分涉及高频交互的金融科技股票出现了小幅异动,分析师指出,关键在于这些公司是否能在漏洞被公诸于世前留下一个在官方报告中“安全可用”的背书,若塔塔咨询的结果公开证明自身系统通过了Mythos的高危场景冗余率测试,可能反过来转化成一次极有分量的品牌安全宣传浪潮。
当地数字监管机构未对此次测试进展做出正式公开回应,但数位拒绝具名的高级政策顾问表示,鉴于Mythos所展示的突出推理及伪装能力在全球均属前所未见,此次动作并不会只停留在警示阶段,他们正在考虑尽快起草一版针对“日流量超百万用户的重大数字应用接口面向大模型输入应该直接关闭默认的上下文保存权限”等具体细节的标准行业复检流程,同时考虑与Anthropic共组一块供公共漏洞交换的安全协议沟通沙箱。
一系列事实足以敲响警钟:大模型正在剧烈增厚计算机服务的皮肤接触界面亦同时也弱化了固有意义的数据库门禁,如何既保留AI带来的用户体验势能,又能同步将其复杂“思想空间”锁定在对等安全的调度皮囊内,将成为整个印太地区下一阶段数字经济治理的核心敏感挑战。
对于事态的进一步发展,诸如数字身份的标准失态保护、跨语言的自动化钓钩分化,以及对特定政商会话交互进行后验回归自评估是否会出现成固定范式,各方早已暂停通报表态等待这类演化。