AI企業未來可能透過哪些方式取得合法授權的訓練資料?
Answer
AI 企業取得合法授權訓練資料的未來方向
AI 企業在面臨版權侵權訴訟的壓力下,勢必需要尋找合法授權的訓練資料來源,以確保其模型的開發與運營符合法律規範。以下列出幾種可能的途徑:
- 與版權所有者協商授權協議: AI 企業可以直接與出版商、作者、音樂公司、影視公司等版權所有者進行談判,以獲得使用其作品進行模型訓練的授權。這種方式可以確保資料來源的合法性,但可能會增加開發成本。
- 建立資料授權市場: 建立一個專門的資料授權市場,讓版權所有者可以將其作品以授權的方式提供給 AI 企業用於模型訓練。這種市場可以提高資料授權的效率,並為版權所有者提供合理的報酬。
- 開發開源資料集: AI 社群可以共同開發開源資料集,這些資料集可以在開放授權下免費使用於模型訓練。這種方式可以降低 AI 開發的成本,並促進 AI 技術的普及。
- 利用公共領域資料: 公共領域資料是指不受版權保護的作品,AI 企業可以自由地使用這些資料進行模型訓練。然而,公共領域資料的品質和數量可能有限,需要仔細篩選和處理。
- 政府立法規範: 政府可以制定針對 AI 訓練的專門規範,例如強制要求「資料使用授權」或設立「AI 版權許可金制度」,讓 AI 公司付費取得訓練素材的使用權。這種模式可以為作者提供合理報酬,也避免 AI 企業因侵權風險被迫停滯。
產業升級的契機
Anthropic 盜用書籍案,表面上是企業的危機,但深層來看,這是一場 AI 與法律的「接軌考驗」。如果 AI 企業能在這次衝擊中找到新的商業模式,甚至建立「資料合法化」的新秩序,這場危機將成為產業升級的契機。