AI寫論文兩周幹完博士壹年工作!沖擊頂刊

日期: 2026-03-24 | 來源: 新智元 | 有0人參與評論 | 字體: 小中大
AI的解法見鏈接https://www-cdn.anthropic.com/c993ead637f1a102fe1f5346e89f59e82c579b37.pdf

為什麼要給AI這個課題？原因很簡單，Schwartz自己很理解這個問題，作為量子場論的權威，他寫過這個領域的教科書。

他知道坑在哪，也知道標准答案是什麼樣。“如果連這種我已知答案、能逐行檢查的題目AI都做不了，那更別說那些需要創造力的前沿問題了。”

可以說，這就像壹場“帶教實驗”——教授想知道：AI到底是真懂，還是在裝模作樣？

兩周，110版草稿，3600萬Token

實驗開始，教授建立了壹套嚴苛的規則——禁止套娃。

過程中，只能通過文本給Claude指令；不直接編輯任何文件；不粘貼自己的計算結果；完全讓Claude自己跑代碼、改bug、做圖、寫文章。

接下來，實驗開始了。

整個實驗的過程，簡直就是壹場算力的豪賭。

短短兩周內，Claude 4.5生成了110個獨立版本的草稿，消耗了3600萬個Token（相當於讀了上百部《紅樓夢》），跑了40多小時的本地CPU模擬計算！

叁天，Claude就寫出20頁論文了

具體來說，教授讓Claude按以下步驟，幹了叁件事。

第壹件，就是定計劃。

他讓Claude、GPT和Gemini各自出壹個研究方案，然後把叁個方案合並、優化，最終拆分成7個階段、102個任務。

第贰，是搭結構。

他用Claude Code建立了壹個樹狀目錄，不是塞給AI壹個幾百頁的對話上下文，而是讓它自己維護壹堆markdown文件，每個階段壹個匯總，每個任務壹個詳情。

每個任務都有明確目標：比如“任務1.1：回顧BSZ論文”“任務1.2：回顧Catani-Webber論文”。

Claude需要什麼就去查什麼，而不是死記硬背。

第叁，就是逐級推進。

在這個步驟裡，Claude需要壹個階段壹個階段地推進下列任務：運動學、NLO結構、SCET分解、異常維度、求和、匹配、文檔。每個階段大約15-35分鍾，整個核心計算只用了2.5小時。

在初稿中，Claude進行了模擬（直方圖）和分析計算（實線），發現兩者高度吻合。

結果，到了第叁天，Claude已經完成了65個任務，寫出了第壹篇20頁的LaTeX論文草稿，有公式，有圖表，還有參考文獻。

論文草稿地址：https://www-cdn.anthropic.com/f6381ceefdfb6ead62ae185c4bd4b555c8a584fc.pdf

最讓人類頭禿的工作，AI都幹了

最神奇的地方，就在於AI的自我管理能力了。

教授發現，現在的AI竟然已經神奇地學會了“分而治之”。

比如在第贰階段，Claude會自己制定壹個包含102個子任務的“作戰計劃”，橫跨運動學、因式分解、數值模擬等柒大階段。

在教授眼裡，Claude已經不再是壹個簡單的對話框，而是壹個“首席研究員”！
- 新聞來源於其它媒體，內容不代表本站立場！
原文鏈接
原文鏈接:

上壹頁 1 234 5 6 下壹頁

在此頁中閱讀全文

我們的贊助商

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

相關功能

新聞