-
日期: 2024-05-07 | 來源: 量子位 | 有0人參與評論 | 專欄: 馬斯克 | 字體: 小 中 大
Aman Madaan,卡內基梅隆大學語言技術研究所博士在讀生。
他的研究領域包括大型語言模型、反饋驅動的生成以及代碼生成和自然語言推理的交叉領域,研究的首要主題是使用推理時間計算(Inference-Time Compute)來增強推理能力(Reasoning)。
攻讀博士學位期間,Aman曾擔任Google大腦和艾倫人工智能研究所的學生研究員和合作者;更早以前,他還是Oracle的主要技術人員。
加上Pavel Izmailov在內的幾位新員工,自此馬斯克的技術人才版圖已擴增至34人(不包括馬斯克本人),相比於最開始12人的創始團隊增長了約2倍。
在新加入的成員當中,華人共計7人,加上創始團隊的5人,自此共有12人。
Xiao Sun,此前曾在Meta、IBM就職,博士畢業於耶魯,北大校友。
Ting Chen,此前曾在谷歌DeepMind、谷歌大腦就職,本科畢業於北郵。
Juntang Zhuang,此前曾在OpenAI就職,DALL-3、GPT-4核心貢獻者,本科畢業於清華,碩博畢業於耶魯。
Xuechen Li,今年博士畢業於斯坦福,羊駝Alpaca系列大模型的核心貢獻者。
Lianmin Zheng,UC伯克利計算機博士,小羊駝Vicuna、Chatbot Arena創建者。
Qian Huang,斯坦福在讀博士生,畢業於天津南開中學。
Haotian Liu,威斯康星大學麥迪遜分校,本科畢業於浙江大學,LLaVA壹作。
而從機構分布上看,主要還是集中於谷歌、斯坦福、Meta、OpenAI、微軟等機構,他們都有豐富的大模型訓練經驗, 比如GPT系列、大小羊駝系列,以及谷歌Meta相關大模型。
從加入時間來看,更多還是集中在今年2-3月,平均每5天就有壹名新成員加入共計13人。去年8-10月間只有5人加盟。
而如果結合相對應Grok的進展,也能看到馬斯克xAI每壹階段招人計劃。
比如今年3月29日,馬斯克突然發布Grok-1.5,上下文長度飆升,從原本的8192增長到128k,和GPT-4齊平。
而將時間推回壹個月(今年2月),OpenAI前員工Juntang Zhuang加盟xAI。他在OpenAI發明了GPT-4 Turbo支持128k長上下文能力的算法。
還有像今年4月15日,Grok-1.5V多模態模型發布,它能處理除文本信息外,包括圖表、屏幕截圖、照片在內的各種視覺信息。
而今年3月,LLaVA壹作Haotian Liu才剛剛加盟。LLaVA是端到端訓練多模態大模型,展現出了類似於GPT-4V的能力。而新版LLaVA-1.5 在 11 個基准上實現了SoTA。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見