-
日期: 2026-02-05 | 來源: 返樸 | 有0人參與評論 | 字體: 小 中 大
36%,17萬,這是讓中國科研界無法回避的數字。2026年1月30日,《英國醫學雜志》發表了壹項震撼學術界的研究。研究顯示在1999年至2024年間發表的中國癌症研究論文中,超過17萬篇被人工智能標記為疑似論文工廠產物,比例高達36%。
這意味著每3篇中國癌症研究論文中,就有超過1篇被AI識別為可能存在誠信問題。
當然 ,這項 研究並非針對中國,而是展示了壹個系統性問題的冰山壹角。在這項研究掃描的全球 超過 260萬篇癌症論文中,26.1萬篇(9.87% )被標記為疑似論文工廠產物, 其中 中國占了17.7萬篇,占全球疑似論文的68%。
1月30日,醫學領域頂級期刊《英國醫學雜志》(The BMJ)發表了壹項令人震驚的研究:在1999年至2024年間發表的癌症研究論文中,每10篇就有1篇疑似論文工廠產物;其中中國的情況尤為嚴重,每3篇就有1篇疑似問題論文。
這項研究的主導者,正是幾周前剛剛在Nature雜志上宣布 “ 論文減產50% ” 以踐行 “ 慢科學 ” 理念的澳大利亞昆士蘭科技大學教授Adrian Barnett。如果說之前他用數據證明 “ 90%的研究是垃圾 ” ,那麼這次,他用機器學習找到了最底層的 “ 垃圾 ” ,即由論文工廠批量生產的工業化產品。他的團隊開發的BERT機器學習模型,通過分析論文標題和摘要的文本特征,在已知真假的論文中達到了91%的准確率。
更令人不安的是,這個問題不僅存在於低質量期刊。研究顯示,那些高影響因子期刊(排名前10%的期刊)的標記率從1999年的接近零,壹路攀升到2022年的超過10%。這意味著論文工廠的 “假貨” 已經滲透到學術金字塔的頂端,即便是最受尊敬的學術期刊也未能幸免。
這不是針對中國的 “ 抹黑 ” ,而是基於260萬篇論文的科學分析。但我們必須直面壹個現實:這個數字會被國際學術界長期記住。它不僅影響中國科研的國際聲譽,更可能誤導全球癌症研究的方向。同時,它也對那些恪守學術誠信的中國研究者造成了不公平的 “ 污名化 ” 。
問題究竟有多嚴重?論文工廠是如何運作的?AI又是如何識破這些造假的?中國科研該如何應對這場危機?
模板化生產留下 “ 文字指紋 ” :AI如何識破論文工廠
論文工廠(paper mills)通常是指 “ 學術合同作弊組織 ” ,它們為客戶批量制造虛假論文。根據BMJ論文引用的數據,過去20年間,超過40萬篇疑似論文工廠產物被發表,論文工廠的年收入達到數千萬美元。2022年,Wiley出版社在收購Hindawi後,壹次性撤回了近1.1萬篇疑似論文工廠產物,並關閉了19本期刊,讓這個問題獲得了前所未有的關注。
這些論文工廠依賴預制句子的模板,只需替換特定領域的術語,以流水線方式大規模制造論文。根據俄羅斯學者Abalkina的調查,論文工廠的收費直接與期刊的影響因子掛鉤,影響因子越高,售價越高。
正是因為論文工廠使用模板化生產,這給AI檢測提供了可能。Barnett團隊的核心假設是:論文工廠使用的文本模板會延伸到標題和摘要,這些模板特征雖然對人類可能不明顯,但AI能夠識別。他們選擇了BERT機器學習模型來分析文本,讓AI讀了幾千篇真假論文後,學會識別 “ 造假腔調 ” 。
研究團隊從Retraction Watch數據庫篩選出2,202篇標記為 “ Paper Mill ” 的癌症研究論文用於模型訓練,並從學術誠信專家數據集獲得3,094篇用於外部驗證。作為對照組,他們從北歐國家和高影響因子期刊中選擇論文,特別納入了部分中國的高質量論文,以避免模型僅僅學習語言特征而非造假特征。
模型表現令人信服:在驗證集上准確率達到0.91-0.93,敏感性為0.87,特異性高達0.96-0.99。更重要的是,在交叉驗證中,模型成功標記了72%已知包含錯誤核苷酸序列和細胞系的問題論文,盡管模型在訓練時並未獲得這些信息。這說明模型確實學會了識別論文工廠的文本特征本身。
有了這個強大的AI工具,研究團隊開始了壹項前所未有的大規模掃描:檢查1999年至2024年間發表的260萬篇癌症研究論文。
全球9.87%,中國36%:癌症研究中的論文工廠有多猖獗?
這是迄今為止針對論文工廠最大規模的檢測研究。研究團隊從PubMed數據庫的3800萬篇生物醫學論文中,經過嚴格篩選,最終得到2,647,471篇癌症原創研究論文,跨越11,632本期刊,時間跨度26年。每壹篇論文的標題和摘要都被輸入到訓練好的BERT模型中進行分析。
核心數字令人震驚:在2,647,471篇癌症原創論文中,261,245篇被標記為疑似論文工廠產物,占比9.87%。這意味著每發表10篇癌症論文,就有約1篇可能來自論文工廠,是之前估計的3倍以上。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見