-
日期: 2026-04-13 | 來源: MIT科技評論 | 有0人參與評論 | 字體: 小 中 大
(來源:GitHub)
GBrain 是基於 Tan 真實生產環境部署總結而來。其知識庫包含 14,700 多個“大腦頁面”(Markdown 文件)、40 多個 Agent 技能以及 20 多個持續運行的定時任務。這些數據跨度長達 13 年,涵蓋日歷、Apple Notes、郵件、會議紀要及社交關系。
當數據規模增長至約 3,000 個人物頁面和 5,800 條筆記時,傳統的文本搜索工具(如 grep)已徹底失效,這正是 GBrain 誕生的直接動因。
技術實現層面,GBrain 選擇了壹條相當務實的路線。它默認使用 PGLite,壹個通過 WebAssembly 運行的嵌入式 Postgres 17.5 數據庫。在本地即可完成初始化,無需 Docker、無需雲服務賬號,官方聲稱數據庫就緒時間約 2 秒。檢索方面,GBrain 采用混合搜索策略:關鍵詞精確匹配搭配基於 pgvector 的向量語義搜索,再通過 RRF(Reciprocal Rank Fusion,壹種排序融合算法)將兩路結果合並。
GBrain 中最吸引人的環節當屬它的“夢境循環”(Dream Cycle)機制。
Tan 在README 中這樣描述這個機制:“Agent 在我睡覺的時候運行。夢境循環會掃描當天每壹段對話,充實缺失的實體信息,修復損壞的引用,合並冗余記憶。我早上醒來,大腦已經比我睡著前更聰明了。”在 Tan 的配置中,他使用的是 OpenClaw,因此通過壹個 DREAMS.md 的文件承載這壹邏輯。但他也補充,對於使用 Hermes Agent等其他框架的用戶,則可以通過設定夜間定時任務來實現類似效果。
GBrain 的知識模型還采用了壹種“編譯真相”(Compiled Truth)架構:每個人物頁、公司頁或概念頁的頂部放置當前最佳判斷的綜合摘要,底部則是不可修改的時間線條目,記錄原始證據。隨著新證據不斷湧入,Agent 會自動重寫頂部的綜合判斷,但底部的證據鏈永遠不會被篡改。
在 SKILLPACK 文檔的開篇,Tan 聊到了這個“第贰大腦”的靈感來源——Vannevar Bush 1945 年發表在《大西洋月刊》上的經典論文《As We May Think》中描述的 Memex 設想:壹台能夠存儲個人所有書籍、記錄和通信,並通過“關聯索引”進行極速靈活檢索的設備。
(來源:The Atlantic)
但 Tan 指出了關鍵區別:Bush 的 Memex 是被動的,需用戶手動建立關聯;而 GBrain 是主動的,Agent 會自動檢測實體、創建交叉引用並維護真相。“你不需要去建造 Memex,”Tan 寫道,“Memex 自己會建造自己。”
這壹思路與 Andrej Karpathy 近期關於“LLM 知識庫”的工作異曲同工。Karpathy 主張用 LLM 充當“全職研究館員”,取代傳統 RAG(檢索增強生成)管道中低效的即時拼湊模式。在 4 月 10 日的推文中,Tan 明確提及了 Karpathy 的工作對他的啟發。
盡管願景美好,但圍繞 GBrain 的質疑同樣存在。DEV Community 上壹篇由 Penfield Labs 發表的分析文章在倉庫上線六天後就對代碼進行了審查,得出了不太樂觀的結論:GBrain README 中宣傳叁個重要功能:編譯真相重寫、夢境循環維護、以及每條消息上的實體檢測,在代碼庫中均無對應的程序邏輯實現。
文章認為,這些功能本質上是寫在 Markdown 文檔中的 Agent 指令,依賴 LLM 去解讀和執行,而非通過確定性代碼實現。此外,項目 Issue #22 中記錄了 12 個關鍵 Bug,包括競態條件、NULL 嵌入覆蓋等,安全審計甚至標注其 S3 後端“未達到生產就緒”狀態。
這些質疑觸及了壹個更深層的爭論:當壹個系統的核心功能是通過自然語言指令讓 LLM 代為執行,而非通過確定性代碼實現時,它究竟算不算壹個“軟件產品”?還是更接近於壹套精心編排的提示詞工程?- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見