-
日期: 2026-05-21 | 來源: 鳳凰網 | 有0人參與評論 | 字體: 小 中 大
2026年的春夏之交,中國學術圈和文學圈接連經歷了兩場“地震”。
學術圈的震中,是壹個叫“耿同學講故事”的B站up主。36天時間裡,他連續實名舉報了5位985高校院長級學者的論文造假,被點名的無壹例外都是手握國家傑出青年科學基金和“長江學者”等頭銜的資深學者。
文學圈的震中,是壹個叫“抒情的森林”的普通網友。從2024年10月開始,他用逐字逐句的文本對比,壹年多時間內點名了近40位作家涉嫌抄襲——從86歲的楊本芬,到賈平凹、賈淺淺父女,再到蔣方舟等中生代與青年作者,覆蓋文壇老中青叁代。
壹個是生物醫學退學博士,壹個是普通讀書人;壹個用的是AI圖片查重和統計學工具,壹個靠的是肉眼比對和查重軟件。兩個普通人,憑著各自的“武器”,正在撼動兩個領域的權威。
這聽起來像是兩個“憤青”打假的故事。但仔細壹想,這裡面還有更多值得思考的地方,那就是AI時代的到來,當普通人也能使用技術工具,監督權不再是少數人的特權,正在交還給每壹個會使用工具的人。
當然,更深層的問題是,當壹個體系需要靠壹個退學博士來糾錯時,到底該從哪些方面來改進?
打假門檻低了
這場風暴最讓人震驚的地方,不是耿同學有多厲害,而是他用的方法竟然出奇地“低門檻”。
在中國學術圈,過往的學術打假是極少數人的能耐。要麼你是同領域學者,要麼得像饒毅那樣有學界影響又有揭露問題的勇氣,普通人連Nature這種期刊的文章都未必能完全讀懂,更別提找出數據造假的痕跡了。造假者占盡了所有便宜,專業壁壘讓外行人無從下手,學術共同體的“熟人社會”讓內行人睜壹只眼閉壹只眼,期刊審稿人時間精力有限只能基於信任評審。這叁個門檻對普通人來說太高了,也因此讓造假長期是壹種“低成本、高回報”的選擇。
而耿同學的打法和所有人都不壹樣。他不跟你討論高深的生物學機制,不需要在Nature發過論文才有資格質疑你。他的武器是AI輔助的圖片和數據查重技術。
他的操作方法被技術圈拆解過,核心流程其實只有叁步:把壹篇論文的PDF拆成文本、表格和圖片,再把數據交給AI做審查。
具體來說,他重點檢查叁個地方:
第壹,看數據末尾數字分布是否過於集中。真實的實驗數據因為測量誤差的存在,小數點後壹位乃至兩位應該是隨機分布的,而造假數據則會出現大量“5”“0”或某個數字完全消失的情況。
第贰,看不同量表之間的數據有沒有雷同。比如基因表達量的數據序列和腫瘤體積的數據序列,本該毫不相幹的實驗卻出現了幾個數值完全相同。
第叁,用視覺大模型檢查圖片有沒有被篡改或重復使用。
耿同學自己有壹句話說得極妙,在揭露中山大學鄺棟明的論文造假時,他說:“這不僅是學術界的恥辱,更是造假界的恥辱。連隨機數生成器都不會用的人,也配學術造假?”
數據造假被發現,根本原因往往不是造假者技術太差,而是太敷衍。中山大學康鐵邦論文中被質疑的實驗圖片,被網友形容為“像是從不同論文裡直接復制粘貼的”。上海大學蘇佳燦的論文數據中,壹組數據直接呈等差數列,“人為編造痕跡明顯”。就連同濟大學王平的那篇Nature論文,196只小鼠的體重數據中也出現了壹只末位為“0”的離群值,這在統計學上是極不自然的。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見