-
日期: 2026-05-20 | 來源: DeepTech深科技 | 有0人參與評論 | 字體: 小 中 大
近日,美國耶魯大學博士畢業生李昊特和合作者開發了壹套叫 MOSAIC 的 AI 系統,把化學合成知識分成了 2,498 個專業領域,每個領域訓練壹個專家模型。
這套系統在測試中對超過 35 種全新化合物的合成成功率達到了 71%,甚至幫研究人員完成了之前文獻報道失敗的化學反應和前所未見的新反應。
使用時給定 AI 壹個化學結反應式,它不光告訴你這物質形態,還直接給你壹份可以進實驗室操作的詳細步驟,包括用什麼試劑、加多少量、加熱多久、怎麼提純,甚至連每壹步的注意事項都寫好了。日前,相關論文發表於《自然》。
這項研究的出發點,來自於研究人員對化學學科現狀的觀察。化學是壹門以實驗為基礎、經驗性極強的學科。人們學到的知識和技巧大多來自前人的積累,這本來是好事,但問題在於,今天每年有上百萬篇化學論文發表,沒有任何壹個化學家能讀完所有文獻,更不用說記住其中的細節了。
化學滲透在生活的方方面面,從制藥、材料、催化到農業和消費品,新藥物的開發、新材料的合成都需要大量的試錯。
壹個有機化學反應的優化往往涉及多個參數:溶劑、濃度、反應順序、時間、溫度曲線,而且這些參數還會相互影響。探索壹個新反應,通常需要大量的時間投入和試錯成本。
在這樣的背景下,研究人員想做壹個系統:輸入壹個目標分子,系統不僅告訴你能不能合成,還能給出可以直接進實驗室操作的詳細步驟。
然而,通用大模型雖然能聊天,但你要讓它給出壹個具體化學反應的實驗步驟,它經常說得驢唇不對馬嘴。它會用看起來很專業的術語編造壹套方案,溫度不對、試劑不對、順序也不對,按照它說的去做很可能什麼都得不到,甚至炸掉反應瓶。
(來源:《自然》)
MOSAIC 的做法則是把整個化學合成知識空間分割成 2,498 個小區域,每個區域選壹個專家。比如某個專家專門負責壹種叫 Buchwald-Hartwig 的偶聯反應,尤其是氯代芳香環的那種。
當你輸入壹個新的化學反應時,系統先在知識空間裡找到離它最近的專家,然後讓這個專家來回答。
為了判斷哪個專家離得近,研究人員先訓練了壹個叫 KMN 的神經網絡。這個網絡能把化學反應轉化成 128 維的數字向量,專業上叫反應特異性指紋。向量之間的距離越近,說明兩個反應越相似。
有了這個空間,他們用了壹個叫 FAISS 的高效檢索工具,把知識庫聚類成 2,498 個沃羅諾伊單元,每個單元就是壹個專家的地盤。
訓練的時候,先讓壹個基礎模型把所有數據都學壹遍,再針對每個專家所在的子集做贰次微調。對壹個新反應做預測時,系統先算出它的向量,找到最近的幾個沃羅諾伊單元,激活對應的專家,然後讓專家輸出完整的實驗方案。
研究人員最初嘗試了訓練壹個完整的大模型,但很快意識到需要的計算資源太大了,幾百上千張 GPU 卡,大多數實驗室無法長期測試。
後來他們轉換思路,從最基礎的做起,只把模型在單個類型反應上微調。結果發現,簡單的辦法反而取得了好的效果。
傳統方法需要幾百上千張 GPU 卡,MOSAIC 只需要幾張卡就能跑,而且是可持續生長的。新數據來了不需要重新訓練整個系統,只需要在知識空間裡加新的沃羅諾伊單元,訓練新的專家,已經存在的專家不受影響。
搜索的時候系統會同時從已有和新索引裡找結果,合並排序後輸出。這種去中心化的設計對資源有限的學術實驗室非常友好。對大多數研究者來說,用單個或幾個 A100 GPU 就能讓這個架構持續進步。
研究人員用 MOSAIC 預測了 37 種新化合物的合成路線,其中有 35 種在第壹次嘗試時就成功了。更讓人意外的是壹個 5-氮雜吲哚衍生物的合成,這類化合物在之前文獻報道中被標注為是難以用現有方法制備的。
而 MOSAIC 給出的預測距離最近的專家中心距離是 320,遠高於通常的置信閾值 150,這意味著這個反應在知識庫裡幾乎找不到相近的先例。
但是,研究人員完全按照預測做了實驗並成功實現了產物,同時 MOSAIC 找到了壹個之前未被報道過的環化方法。這說明這套系統不只是照搬已有知識,它有壹定的泛化能力,能在已有知識的邊緣組合出新的方法。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見