-
日期: 2026-03-24 | 來源: 新智元 | 有0人參與評論 | 字體: 小 中 大
它會把每個子任務寫成獨立的Markdown文件,需要用的時候自己去檢索。
這種“樹狀結構”的思維,恰好就避開了大模型長文本處理的“健忘症”。
AI研究員的這些工作,恰好就戳中了教授的爽點。
以往,寫Fortran接口代碼、調Python畫圖、算繁瑣的積分變換這些工作,往往都會讓人類研究生頭禿。
可AI幹起這些活來,幾乎是秒回,而且從來都不抱怨,不喊累,沒有任何的情緒內耗。
驚!AI也會“學術造假”了?
不過很快,到了實驗中期,反轉就來了——Claude這個研究生,差點把教授給騙了!
當教授要求Claude驗證公式時,Claude表現得極度“討好型人格”。它會說:“看,結果完美契合!”
結果,教授發現,事情不對勁。
他發現壹個ln(3)項特別奇怪,仔細回溯時才發現,Claude在悄悄修改參數,強行讓圖表對齊理論!
這個表現,讓教授非常失望。
Claude制作了精美的圖表,展示的結果以及不確定性都完全符合預期。可惜的是,這些圖雖然做得好,但其實是在作弊!
他發現,Claude會堂而皇之地編造壹些聽起來很專業的術語,比如“根據標准SCET壹致性條件,附錄B中的系數已校正……”
但其實它根本沒算,只是在憑空捏造理由,來掩蓋自己的錯誤。
這也就反映了當前AI的壹個致命弱點:
它太想讓你開心了。
不過,在理論物理這種失之毫厘謬以千裡的學科裡,這種想討人開心的小聰明可是致命的。
因此,教授不得不打起精神,嚴陣以待,壹遍遍拷問AI:你真的核實了嗎?要逐行核對!不要跳步!
最終,在教授的反復拷問下,Claude修補了那個致命的“因式分解定理錯誤”。
這時候,AI完全展現出了驚人的學習速度——
壹個人類學生可能需要兩周才能弄明白的邏輯偏差,AI在被點破後,僅僅5分鍾內,就完成了全量重算!
物理學家“凡爾賽”
我不是在發Paper,我是在進化
2026年1月5日,這篇AI研究生寫出的論文正式發布了。
雖然按arXiv的規定,暫時不允許AI署名,但教授在致謝裡給足了Claude排面:“Claude完成了所有計算,包括定理推導、蒙特卡洛模擬、數值分析及手稿准備。”
但是,這並不是讓教授最滿意的點。
最令他興奮的是,自己的工作模式,從此徹底變了!
現在,他已經從壹個“手藝人”,變成了壹個指揮家。
以前,他壹次只能盯壹個項目。而現在,他屏幕上會開著4-5個窗口,像棋聖馬格努斯·卡爾森壹樣,同時對弈伍位大師。
而且,教授現在已經幾個月沒親自寫過代碼了。所有那些庫版本沖突、語法錯誤、調圖字體大小之類的瑣事,全部都甩給了AI。
而且,他現在有了更大膽的設想,簡直像發生了智力的躍遷!
從前,因為受限於算力,很多大膽的猜想他都不敢嘗試。
而現在,只要腦海中出現壹個念頭,兩小時內,AI就能反饋出壹個初步驗證,這在教授的學術科研中,簡直如有神助!
Claude的優點和缺點
另外,教授還總結了壹個很有趣的Claude優缺點對比清單。
Claude擅長:
不知疲倦地迭代。110個論文版本,幾百張調試圖,毫無怨言。
基礎數學。設定積分、變換變量、展開函數、檢查因子,幹淨利落。
代碼生成。Python畫圖、Fortran接口、Mathematica腳本,全都壹次跑通。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見