-
日期: 2024-03-13 | 來源: 量子位 | 有0人參與評論 | 專欄: 加州 | 字體: 小 中 大
Ps. 就是利用ControlNet來做這件事。
Devin接到請求後,首先詢問了更為詳細的需求,然後開始閱讀博客文章,並像平常壹樣規劃出了行動方案。
有了詳細的行動方案後,它立刻就在數分鍾內進行代碼編寫和調試。
同樣的,在這裡遇到bug也不用驚慌,Devin同樣有能力直接進行修復。
完成工具的搭建後,Devin也沒有勞煩人類自行配置使用,而是壹氣呵成,最終生成了咱們要的帶隱藏文字的圖像:
可以說表現相當令人驚艷。
而在具體測試中,Devin取得的成績同樣亮眼。
在評估Devin的表現時,團隊沒有使用常見的HumanEval,而是用了更具挑戰性的SWE-bench。
這個數據集是由GitHub中的實際問題組成的,Devin不借助任何輔助,就取得了13.86%的最高解決率。
而同樣在無輔助的條件下,GPT-4的問題解決率為零,此前的最佳水平是1.96%,加入輔助也才4.8%。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見