针对朱自清经典散文《荷塘月色》被AI检测工具判定“疑似AI生成率超60%”的现象,西湖大学研究者鲍光胜博士指出:检测工具并非逐字计数,而是判断文章整体被某一AI从头写成的“可能性”,由于《荷塘月色》这类名篇早已被大量训练数据覆盖,导致检测器因“高度一致性”误判,不同工具模型与方法各异,同一文章测得AI率相差30%属正常,专家建议,避免被机器词语习惯同化,保持个人写作风格才是应对关键。
有网友无意间将这篇经典散文投喂给某AI检测工具,结果却收获了一个令许多人啼笑皆非的结论——文章疑似由AI生成的概率超过了60%,评论区刹那间热闹得像一锅煮沸的粥,有人调侃:“我辛辛苦苦肝出来的论文,AI率80%是不是也能名正言顺了?”也有人嗅到其中的不对劲:“我家那台电脑上显示的随机数都比这检测结果靠谱。”更加戏剧性的是,有心人把同一段文字投到不同的检测器里,测出的AI率竟然相差30%,这个数字差,恐怕比春运会期间的列车越站还要难理解。
这些困惑一环扣一环,记者找到了西湖大学文本智能实验室的研究者鲍光胜博士——他是Fast-DetectGPT的研发者之一,恰好专业“侦测”AI写作。
闲聊不过三分钟,鲍博士就抛出了一个可能会颠覆多数人认知的观点:“大家对‘AI率’的误解,远比想象的深。”他补充说,当某一平台告诉你这篇文章的“AI生成率是60%”,真不是有人拿计算器计数:这每抽9个词就有6个出自机器人之手,理解它的正确方式更像是——检测工具眼里的结论是:这篇文章有六成的可能性是某一款AI从头到尾写的,再说得中要点:目前还没有一台检测设备强到能精准指着某个汉字,义正辞严地说“这是机器伪造的”,因为在单字、短语的微观层面,人类和模型的生成差别几乎是零。
既然技术识别局限在单词之外,那它究竟靠什么捕捉AI的蛛丝马迹?鲍博士比喻道:很像侦探在文本的统计学痕迹中寻找违规信号,机器在用词偏好上,通常有固定的规律;如果某个本来冷僻的词,在整段文字里的使用密度高出人类的正常发挥范围太多,算法就会悄悄给它“敬礼”——举起半红半黄的旗,比如英文论文写作中,“delve”(“深入探究”)成了一个幽灵词语:“学者很少专门用它,但很多大模型的输出文本里却高频出现,自然,这一信号就可以拿来做武器。”
但这把枪也有软肋:它“断案”必须有规模可言,若扔给它的是一段不到100个字的“小短文”,它猜中生成来源的概率近似抛硬币输赢,可一旦字数堆厚到500个字,那份判决书的可靠性一下就站稳了,这算科技测谎中的基本共识。
咱们回头看看最委屈的倒霉蛋——《荷塘月色》,它被判定60%的“疑似AI比例”是最让人费解的片章,怎么一个最经典的人类白话文,反而第一个“中招”?鲍博士的解释一点儿也不绕弯子:“如果让AI去写一篇全新的故事,未必算得很准;但叫它判定那些30年前上过语文课本的东西,准不准另讲,方向经常反过来。”
这个故事实际技术上不出奇:任何成熟的大模型,在接收人类上传的训练数据集时,各种跨时代的文学名篇自然一网打尽,这就相当于一个考官,手头全做着熟悉到能耳语复述的真题,你想,检测器判定某人敲出的文字吻合模型的惯性输出程度(所谓的“一致性”),当模型对某一句话的记忆鲜明到只要蹦半个词就能给出概率极高的下一个字,“一致率”立刻飙升,管你原来是北大教授的温柔风还是民国初年的闲谈笔法,最后它大概率会点头:这个,瞅着像自家人写的。
于是那些饱经沧桑的散文歌赋——“床前明月光”不算,“荷塘月色”却偏偏“翻车”得典型,真相并不离奇:某个时代的文字,经过千万次被模型重读重做后,识别机制玩过了火至非友亦敌。
平台测验分数不一致,热门评论里的质疑也并非小题大倡,鲍博士一语点破关窍:不同工具使用的基线模型和检测方法千奇百怪,有的钟情于词频对比,有的忙着标语法规律,还有的根本只咬住深层语义不放。“在这样百花齐放的打法里,测同一篇散文相差30%,就和走路撞到空调机一样自然。”他说。
<热搜背后还有一个不为人知的吐槽战线——某些平台的生态里,既有AI自写的论文服务,又有配套贩卖降低AI率的“防测评牙膏”,这让很多学术苦手直呼“攻防一气呵成”。
鲍光胜用略带轻松的口调解释了这种市场的逻辑:“那本质上就是在打仗——我跟前面装探照灯的人打游击。”降AI率并不玄乎:去调查那些检测工具爱捕捉什么套路信号,比如具体形容词的无意识泛滥,然后用相近含义的其他词换掉它,意思不变,雷达的光标从警戒绿变回正常白。
抛开市场乱斗,鲍博士悄悄赠送了一条看似容易操作的自保之招:不要让你自己被机器的词语习惯同化,他说:“大多数大模型靠的是学习人类共通的语言习惯来写作,越平顺、老常,越接近AI通用数据的结果,可一旦你本身就写得和《百年孤独》里的手稿一样不拘一格,就算顶尖检测器,也会因为找不到‘套路’而发呆。”
某种意义上说,手搓论文的得高分AI评定不见得公平,也不乏学生沮丧吐槽:分明花了一个晚上手打出来的论文,偏偏平台上写着80% AI率,鲍教练给出了三大可能性假说:或者自己确实一不留神蹭着了AI的句子流;或长期做模板参考改变了个人写作本能;退一万里讲,对面的检测也未必总在正确方向发光。
他坦诚:这场AI写作识别和工具的反扑是一个攻防相长的无穷过程,新的模型更强,旧的工具更快死掉,法克们随后继续迭代。“在大多数人眼里,这款文本侦测机给的结论就是圣旨,但我们得让所有人明白,它跟天气预报给次日城市下雨的概率不差一分:都只能是个‘可能’,但一定有不小的云盘移动偏差。
至于那些不幸“被害”的手写勇士?最好的斗争是清醒者不放过自身草稿的自由呼吸,不做标签跟风者,才是决胜的门牌。