應用

技術

物聯(lián)網世界 >> 物聯(lián)網新聞 >> 物聯(lián)網熱點新聞
企業(yè)注冊個人注冊登錄

消息稱 Meta 無視自家律師警告,使用盜版書籍訓練 AI 模型

2023-12-13 17:19 IT之家
關鍵詞:Meta

導讀:?12 月 13 日,據路透社報道,根據一起版權侵權訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書籍訓練其 AI 模型存在法律風險的情況下,仍然一意孤行。

12 月 13 日,據路透社報道,根據一起版權侵權訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書籍訓練其 AI 模型存在法律風險的情況下,仍然一意孤行。

image.png


據IT之家了解,該訴訟由喜劇演員 Sarah Silverman、普利策獎得主 Michael Chabon 等著名作家于今年夏天聯(lián)合發(fā)起,他們指控 Meta 未經許可使用其作品訓練人工智能語言模型 Llama。本周一起,該案與另一起類似訴訟合并審理。

上個月,加州一位法官駁回了 Silverman 的部分訴訟,但表示將允許作者修改訴訟內容。新訴狀中包含了 Meta 一名研究員在 Discord 聊天服務器上討論獲取數(shù)據集的聊天記錄,這可能是 Meta 知曉使用書籍可能存在版權風險的重要證據。聊天記錄中的對話顯示,他們曾討論過使用盜版書籍訓練 AI 模型的法律風險。其中,一位 Meta 研究員 Tim Dettmers 提到,Meta 的法律部門律師曾表示,如果使用這些書籍訓練 AI 模型,可能會存在法律問題。律師稱,這些數(shù)據無法使用,如果使用了的話,模型也無法發(fā)布。

今年,多家科技公司都面臨著內容創(chuàng)作者的類似指控,他們指責這些公司在構建生成式 AI 模型時侵犯了作品版權。

如果這些訴訟成功,可能會給生成式 AI 的發(fā)展帶來不利影響,因為這可能會增加構建 AI 模型的成本,迫使 AI 公司向藝術家、作者和其他內容創(chuàng)作者支付使用其作品的費用。

與此同時,歐盟關于人工智能的新臨時規(guī)則可能會迫使公司披露其用于訓練模型的數(shù)據,這可能會使他們面臨更大的法律風險。

Meta 于今年 2 月發(fā)布了其第一版 Llama 大型語言模型,并公布了用于訓練的數(shù)據集列表,其中包括“ThePile”數(shù)據集的“Books3”部分。根據訴訟文件,該數(shù)據集的創(chuàng)建者曾表示,其中包含 196,640 本書籍。該公司沒有披露其最新版模型 Llama 2 的訓練數(shù)據,該模型于今年夏天面向商業(yè)用戶開放。