-
日期: 2026-02-16 | 來源: 大聲思考 | 有0人參與評論 | 字體: 小 中 大
《紐約時報》提出的版權主張,可以分為叁大類。第壹類是實際訓練過程中的侵權,即OpenAI從網絡上抓取了大量數據,它必須制作副本,創建了包括《紐約時報》內容在內的庫,這是從《紐約時報》服務器到OpenAI服務器的逐字復制。這些用於訓練的材料沒有獲得許可,因而侵犯了復制權。
第贰類是最終形成的大型語言模型本身,可能是《紐約時報》版權作品的副本或衍生作品。需要記住,模型基本上是壹個非常龐大的統計集合——相當於1.76萬億個數據點。[4]這個主張比較復雜,有些人會說,這根本不屬於版權的范疇,因為它是事實集合,而不是表達。但也有另壹種理論,認為它可以被視為衍生作品,因為它在字面上是從版權作品中推導出來的。
第叁類是內容的精准復制,即ChatGPT輸出了《紐約時報》文章的逐字或接近逐字的文本,這是壹種單獨的版權侵犯行為,比僅僅指控人工智能的輸出本身就是侵權作品更為有力。這也是《紐約時報》訴訟的重點。
從象征意義上講,這起案件意味著壹場模式之間的沖突:勞動密集型的人類新聞采集與人工智能按鍵式信息生產。但在法律上,此案卻代表著不同的東西:已有法律和新興技術之間的經典差距。
微軟的律師在法庭文件中寫道:“在本案中,《紐約時報》利用它的影響力和擴音器,挑戰最新的重大技術進步——大型語言模型(LLM)。”在他們的描述中,支持ChatGPT的技術就好比錄像機、自動鋼琴、復印機、個人電腦、互聯網或搜索引擎,雖然《紐約時報》持有不同看法,但版權法對大型語言模型的阻礙,並不比對上述技術的阻礙更大。[5]
人工智能公司認為將萬事萬物放入技術攪拌機中沒有什麼不可以,媒體公司從未完全接受這壹點。它們壹直認為,如果科技公司使用媒體作品開展訓練或者做壹些能產生價值的事情,媒體就有權獲得其中的壹部分價值。
《紐約時報》總共擁有超過1000萬訂閱者,並計劃在2027年底前達到1500萬,但該報表示,科技公司的“非法行為威脅將讀者(包括現有和潛在的訂閱用戶)從《時報》轉移出去,從而減少了訂閱、廣告、許可和聯盟營收,而正是這些資金支持《時報》維持其目前的開創性新聞制作水平”。
訴訟中沒有提出確切的賠償要求,但起訴狀稱,被告應承擔與“非法復制和使用《紐約時報》獨壹無贰的寶貴作品”相關的“數拾億美元的法定和實際損失”。訴訟還要求這兩家公司銷毀任何使用《紐約時報》版權材料的聊天機器人模型和訓練數據。
此案將為人工智能公司如何使用受版權保護的材料開創先例。在人工智能應用越來越普遍的時代,高質量、可信賴的人工智能培訓資源越來越重要。許多科技業人士希望人工智能系統能夠得到更廣泛的應用,但版權訴訟可能會減慢壹切,因為法律風險構成人工智能公司計劃如何以及何時發布新模型的壹大因素。
科技公司的抗辯是,它們對新聞公司數據的使用屬於美國版權法下的“合理使用”(fair use)。 “合理使用”是壹種允許在未經許可或付費的情況下有限使用受版權保護的材料的原則,特別是為了批評、評論、新聞報道、教學、學術或研究等目的。現行美國版權法第107條規定,法院在評估合理使用抗辯時至少要考慮肆個因素:
使用的目的和性質,包括這種使用是否具有商業性質或是為了非營利的教育目的;
版權作品的性質;
與受版權保護的作品整體相比,使用部分的數量和實質性;
以及這種使用對版權作品的潛在市場或價值的影響。[6]
在考慮合理使用測試的肆個因素時,我們會發現:教育性和非營利性用途更有可能被認定為合理使用。與技術寫作或新聞相比,創意作品受到的版權保護更多。被復制作品的數量很重要,被復制材料與原始版權材料之間是否存在實質性相似也很重要。最後,最重要的是,法院還要考慮復制是否會損害被復制作品的當前或未來市場。
《紐約時報》訴訟案的關鍵法律問題是合理使用原則。OpenAI和微軟將很難反駁合理使用測試的最後壹點,即它們的產品依賴於《紐約時報》這樣的新聞采集企業,必定會對這些企業的利益造成損害。ChatGPT和其他大型語言模型無法到外面的世界去收集和審核新的事實。在可預見的未來,它們只能從已經發布的信息中“學習”。換個角度看,OpenAI和微軟需要《紐約時報》和其他新聞機構的存在,才能提供可靠的新聞作為其服務的壹部分。因此,從理性和經濟的角度來看,它們應該有義務為所使用的信息付費。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見