-
日期: 2026-02-24 | 來源: appaso | 有0人參與評論 | 字體: 小 中 大
Anthropic 事後表示,公司從未用這些數據訓練過正式發布的商業模型。但這種解釋多少有些勉強,下載了,存著,只是“沒有用在正式模型上”,這條線究竟劃在哪裡,恐怕連 Anthropic 自己也說不清楚。
為了“巴拿馬項目”,Anthropic 還專門聘請了 Tom Turvey 來主持這項工作。Turvey 曾參與創建 Google 圖書項目,那個項目同樣因大規模掃描書籍引發了長達多年的版權爭議。Anthropic 選擇這個人來主導這件事,很難說是壹種巧合。
最終,Anthropic 主要依賴兩家書商批量供貨:
美國贰手書零售商 Better World Books,以及總部位於英國的 World of Books,每次采購動輒數萬冊。內部文件還顯示,員工曾討論接洽紐約公共圖書館,甚至提到可以找某家長期資金不足的新圖書館。
采購完之後,整個掃描過程,就像壹條工業流水線。
掃描、數字化並銷毀數百萬圖書的圖書倉庫。圖片來自:華盛頓郵報
供應商用液壓切割機把書脊整齊切掉,散開的書頁隨即被送進高速工業掃描儀,掃完之後,剩下的紙張交給回收公司處理。壹家參與報價的掃描服務商在提案中寫道,Anthropic 希望在六個月內完成 50 萬到 200 萬冊書的數字化工作。
Anthropic 副總法律顧問 Aparna Sridhar 回應稱,法院已裁定 AI 訓練“本質上具有轉化性”,Anthropic 選擇和解的問題在於“部分材料的獲取方式,而不是我們是否可以使用這些材料”。
這套說辭在法律上也許站得住腳,但它同時也揭示了壹件事:這家公司從未認為自己做錯了什麼,只是某些手段不夠幹淨。
拿你的書訓練,再搶你的飯碗
同樣的事情,也在其他公司身上發生著,而且有些細節更為戲劇性。
針對 Meta 的訴訟文件顯示,有員工在 2023 年直接寫道:“用公司筆記本進行種子下載感覺不太對勁。”他後來還專門向法務團隊反映,稱使用種子網站可能意味著向他人分發盜版作品,“這在法律上可能行不通。”
但這些顧慮最終沒有改變任何事情。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見