-
日期: 2024-09-25 | 來源: 新智元 | 有0人參與評論 | 字體: 小 中 大
由於Scale AI的驚人成就,Alexandr Wang已經被硅谷公認為「下壹個扎克伯格」。
AI模型的「數據工廠」
AI領域公認的叁個基本支柱——數據、算法和算力。
算法領域,前有谷歌、微軟的大型研究院,後有推出過Sora和GPT系列模型的OpenAI;算力領域有供貨全球的英偉達,但在Scale AI還未誕生的2016年,數據領域仍處於空白。
19歲的Alexandr Wang在看到這壹點後,做出了輟學創業的決定,「我創辦Scale的原因是為了解決人工智能中的數據問題」。
大部分數據都是非結構化的,AI很難直接學習這些數據;而且大型數據集的標注壹項資源密集型工作,因此,「數據」被很多人認為是科技領域最辛苦、最卑微的部分。
但Scale AI卻在短時間內就獲得了巨大成功。他們可以為不同行業的企業客戶量身定制數據服務。
在自動駕駛領域,Cruise和Waymo等公司通過攝像頭和傳感器收集了大量數據,Scale AI將機器學習與「人機回路」監督相結合,管理和標注這些數據。
他們曾經開發的「自治數據引擎」,甚至推動了L4級自動駕駛的發展。
Wang表示,Scale AI將自己定位為整個AI生態的基礎設施供應商,構建「數據鑄造廠」,而不僅僅是在子公司Remotasks中雇傭大量的合同工進行人工標注。
他強調,來自專家的、包含復雜推理的數據是未來人工智能的必備條件。
傳統的數據來源,比如從Reddit等社區的評論中抓取數據存在局限性。Scale AI構建了壹些流程,模型先輸出壹些內容,例如撰寫研究論文,在此基礎上,人類專家可以改進這些內容,從而改進模型的輸出。
「雖然人工智能生成的數據很重要,但想要獲得有壹定質量和准確性的數據,唯壹方法是通過人類專家的驗證。」
Alexandr Wang在Scale AI的官網上這樣寫道,「數據豐富不是默認情況,而是壹種選擇,它需要匯集工程、運營和AI方面最優秀的人才」。
Scale AI的願景之壹是「數據豐富」,從而將前沿LLM擴展到更大數量級,「為通向AGI鋪平道路。在達到GPT-10的過程中,我們不應該受到數據的限制」。
業內盛贊的LLM排行榜更新
Scale AI對業界所做的貢獻,不僅是數據標注這麼簡單。
今年5月,Scale AI重磅推出了全新LLM排行榜——SEAL,開始對前沿模型開展專業性評估。
對於這個榜單,Jim Fan大加贊賞。他認為SEAL是LMSys的非常好的補充和參照,提供公開模型的私密、安全、可信的第叁方評估。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見