為什麼 Anthropic 案的訓練數據來源被認定為侵權?
Answer
Anthropic 案中訓練資料來源侵權的認定
在 Anthropic 因使用盜版書籍訓練 AI 模型 Claude 一案中,法官 William Alsup 明確區分了 AI 訓練與資料來源的法律性質。如果 AI 公司使用合法取得的書籍進行模型訓練,這可能被視為法律允許的轉化性使用。然而,如果 AI 公司從盜版網站獲取受版權保護的書籍,則明顯構成侵權。
合法與盜版來源的關鍵差異
法官 Alsup 的區分強調了 AI 模型訓練數據來源合法性的重要性。合法取得的書籍在版權法上可能被視為合理使用,但透過盜版途徑取得的資料則無疑侵犯了版權。Anthropic 案件中,由於其訓練數據來自盜版網站,因此被認定為侵權,最終以支付高達 15 億美元的和解金告終。
對 AI 產業的影響與警示
此案不僅創下美國史上最高金額的版權和解紀錄,也為 AI 產業敲響了警鐘。律師 Justin Nelson 指出,這起和解案為 AI 時代開創了先例,AI 公司必須為其使用的版權內容付費,從盜版網站竊取作品是錯誤的。這意味著 AI 公司在訓練模型時,必須更加注重數據來源的合法性,避免觸犯版權法,確保在資料來源上站得住腳。