-
日期: 2024-04-11 | 來源: 第壹財經 | 有0人參與評論 | 字體: 小 中 大
4月11日,第壹財經記者獲悉,壹則李彥宏內部講話流出。在內部講話中,李彥宏對大模型開源與閉源的路線選擇以及AI創業者應該專注模型還是應用等業界焦點話題,發表了自己的看法。
在講話中,李彥宏給開源大模型潑了盆冷水,稱模型開源的意義不大,它們往往是做小規模的驗證應用,並沒有經歷大算力的驗證。此外他還談到AI創業的話題,認為創業者的核心競爭力本就不應該是模型本身,而是應該去卷應用本身。
為什麼不開源?
目前的大模型行業,有以OpenAI GPT-4為代表的閉源大模型和以Meta Llma2為代表的開源大模型兩股力量。後者正在快速地拉攏"朋友圈",對前者形成有力沖擊。"OpenAI 不OPEN",也成為業界對於明星公司OpenAI"不開源"的壹句吐槽。盡管這家公司分享了大量GPT-4的基准、測試結果和生動的演示,但對用於訓練該系統的數據、成本或用於創建它的具體硬件或方法等相關信息"守口如瓶",對於是否開源也沒有時間表。
作為國內大模型的較早入局者,百度也是選擇走閉源路線的壹家。對於百度文心壹言為什麼不開源,今日李彥宏表示,在壹年前文心剛剛發布的時候,圍繞是否開源,百度內部有過非常激烈的討論,最後決定是不開源。這是基於當時的判斷,大家市場上壹定會有開源的模型,而且是不止壹家會開源。"在這種情況下,多百度壹家開源不多,少百度壹家開源也不少。"
李彥宏談及目前大模型市場上主流的開源模型,如像Llama,Mistral其實都是有相當影響力的,國內的大模型智源、百川、阿裡的通義也都是開源的,對百度而言,開源還得自己去維護壹套開源的版本,這是不劃算的。
不過,緊接著,李彥宏同時給開源大模型潑了盆冷水,稱"模型開源的意義其實不是很大,這些開源模型都是在外頭零零散散小規模地去做各種各樣的驗證應用,它沒有經過大算力的驗證。"
此外,他認為模型開源也不是壹個眾人拾柴火焰高的情況。"這跟傳統的軟件開源比如Linux、安卓等等很不壹樣,由於是模型帶來的開源,我們也不知道參數為什麼變成了那個樣子,這種情況下很難實現眾人拾柴火焰高。雖然Llama也鼓勵大家去貢獻各種各樣的數據、代碼,但是實際上大家明白最主要的開發者就是Meta這些人,它並不是壹個真正由大家壹起來協同開發的產品。"
他稱反觀閉源,是有真正的商業模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才。"其實也很簡單,大家比較壹下,比如硅谷有壹個優秀的人才,他有OpenAI的offer,有Meta的offer,有Llama的offer,他會去哪兒?這是非常顯而易見的選擇。"
他稱,大家以為開源是免費的,在成本上有優勢,實際上也不是,閉源在成本上反而是有優勢的。因為只要是同等能力,閉源模型的推理成本壹定是更低的,響應速度壹定是更快的。反過來,同等參數的情況下,閉源模型的能力也是更強的。"今天不管是在中國也好、在美國也好,最強的基礎模型都是閉源的,而各種各樣的小模型、最好的小模型,都是通過大模型蒸餾來的。通過大模型降維做出來的模型就是更好的,這樣也會導致閉源在成本上、在效率上也會有優勢。"
圍繞開源閉源,業界壹直爭論不斷。在大模型領域,如同移動互聯網時代以蘋果為代表的封閉模式和以谷歌安卓為代表的開放模式,大模型因其不確定性形成了開源模式和閉源模式同時推進的基本格局。
壹位大模型從業者對第壹財經記者表示,如今大模型行業遠不到壹家壟斷或是壹家獨大的局面,無論開源、閉源,每個公司都有自己的路線選擇,總有人相信"開源的力量"。開源可以降低AI大模型的使用門檻,因為開源大模型意味著無數開發者可以基於大模型來開發基礎設施工具和應用,有望加速下游行業AI應用的開發效率、促進生態的蓬勃發展。同時,開源意味著更多的人可以審查它,識別並修復可能的問題,從而提升了安全性。
此前,百川智能CEO王小川在接受第壹財經記者采訪時也曾談到開源與閉源之爭,王小川說,開源確實容易"建立人品","朋友多多的",讓大家迅速了解和評測;同時開源也是為商業化做准備,如果大家用起來覺得不錯,當需要更好的服務和更大的參數時,可以探索進壹步的商業化路徑。
但是他認為,開源和閉源並不像手機中iOS或者安卓操作系統只能贰選壹,從tob角度,開源閉源其實都需要。他預計未來80%的企業會用到開源的大模型,因為閉源沒有辦法對產品做更好的適配,或者成本特別高,閉源可以給剩下的 20%提供服務。贰者不是競爭關系,而是在不同產品中互補的關系。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見