-
日期: 2026-02-05 | 来源: 返朴 | 有0人参与评论 | 字体: 小 中 大
36%,17万,这是让中国科研界无法回避的数字。2026年1月30日,《英国医学杂志》发表了一项震撼学术界的研究。研究显示在1999年至2024年间发表的中国癌症研究论文中,超过17万篇被人工智能标记为疑似论文工厂产物,比例高达36%。
这意味着每3篇中国癌症研究论文中,就有超过1篇被AI识别为可能存在诚信问题。
当然 ,这项 研究并非针对中国,而是展示了一个系统性问题的冰山一角。在这项研究扫描的全球 超过 260万篇癌症论文中,26.1万篇(9.87% )被标记为疑似论文工厂产物, 其中 中国占了17.7万篇,占全球疑似论文的68%。
1月30日,医学领域顶级期刊《英国医学杂志》(The BMJ)发表了一项令人震惊的研究:在1999年至2024年间发表的癌症研究论文中,每10篇就有1篇疑似论文工厂产物;其中中国的情况尤为严重,每3篇就有1篇疑似问题论文。
这项研究的主导者,正是几周前刚刚在Nature杂志上宣布 “ 论文减产50% ” 以践行 “ 慢科学 ” 理念的澳大利亚昆士兰科技大学教授Adrian Barnett。如果说之前他用数据证明 “ 90%的研究是垃圾 ” ,那么这次,他用机器学习找到了最底层的 “ 垃圾 ” ,即由论文工厂批量生产的工业化产品。他的团队开发的BERT机器学习模型,通过分析论文标题和摘要的文本特征,在已知真假的论文中达到了91%的准确率。
更令人不安的是,这个问题不仅存在于低质量期刊。研究显示,那些高影响因子期刊(排名前10%的期刊)的标记率从1999年的接近零,一路攀升到2022年的超过10%。这意味着论文工厂的 “假货” 已经渗透到学术金字塔的顶端,即便是最受尊敬的学术期刊也未能幸免。
这不是针对中国的 “ 抹黑 ” ,而是基于260万篇论文的科学分析。但我们必须直面一个现实:这个数字会被国际学术界长期记住。它不仅影响中国科研的国际声誉,更可能误导全球癌症研究的方向。同时,它也对那些恪守学术诚信的中国研究者造成了不公平的 “ 污名化 ” 。
问题究竟有多严重?论文工厂是如何运作的?AI又是如何识破这些造假的?中国科研该如何应对这场危机?
模板化生产留下 “ 文字指纹 ” :AI如何识破论文工厂
论文工厂(paper mills)通常是指 “ 学术合同作弊组织 ” ,它们为客户批量制造虚假论文。根据BMJ论文引用的数据,过去20年间,超过40万篇疑似论文工厂产物被发表,论文工厂的年收入达到数千万美元。2022年,Wiley出版社在收购Hindawi后,一次性撤回了近1.1万篇疑似论文工厂产物,并关闭了19本期刊,让这个问题获得了前所未有的关注。
这些论文工厂依赖预制句子的模板,只需替换特定领域的术语,以流水线方式大规模制造论文。根据俄罗斯学者Abalkina的调查,论文工厂的收费直接与期刊的影响因子挂钩,影响因子越高,售价越高。
正是因为论文工厂使用模板化生产,这给AI检测提供了可能。Barnett团队的核心假设是:论文工厂使用的文本模板会延伸到标题和摘要,这些模板特征虽然对人类可能不明显,但AI能够识别。他们选择了BERT机器学习模型来分析文本,让AI读了几千篇真假论文后,学会识别 “ 造假腔调 ” 。
研究团队从Retraction Watch数据库筛选出2,202篇标记为 “ Paper Mill ” 的癌症研究论文用于模型训练,并从学术诚信专家数据集获得3,094篇用于外部验证。作为对照组,他们从北欧国家和高影响因子期刊中选择论文,特别纳入了部分中国的高质量论文,以避免模型仅仅学习语言特征而非造假特征。
模型表现令人信服:在验证集上准确率达到0.91-0.93,敏感性为0.87,特异性高达0.96-0.99。更重要的是,在交叉验证中,模型成功标记了72%已知包含错误核苷酸序列和细胞系的问题论文,尽管模型在训练时并未获得这些信息。这说明模型确实学会了识别论文工厂的文本特征本身。
有了这个强大的AI工具,研究团队开始了一项前所未有的大规模扫描:检查1999年至2024年间发表的260万篇癌症研究论文。
全球9.87%,中国36%:癌症研究中的论文工厂有多猖獗?
这是迄今为止针对论文工厂最大规模的检测研究。研究团队从PubMed数据库的3800万篇生物医学论文中,经过严格筛选,最终得到2,647,471篇癌症原创研究论文,跨越11,632本期刊,时间跨度26年。每一篇论文的标题和摘要都被输入到训练好的BERT模型中进行分析。
核心数字令人震惊:在2,647,471篇癌症原创论文中,261,245篇被标记为疑似论文工厂产物,占比9.87%。这意味着每发表10篇癌症论文,就有约1篇可能来自论文工厂,是之前估计的3倍以上。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见