当前位置:首页 > 综合

是敵?是友?人類創作者與生成式AI的「不對稱訴訟戰」

文:閻紀宇

阿瓦德(Mona Awad)、敵友特倫布雷(Paul Tremblay)、人類凱德瑞(Richard Kadrey)、創作稱訴高登(Christopher Golden)四位美國驚悚小說家最近兩人一組走上法院,生成式A訟戰挑戰全球矚目的不對新一代「生成式人工智慧」(Generative AI),並且得到一位大咖名流加持:喜劇女伶/作家、敵友艾美獎(Emmy Awards)得主莎拉席佛曼(Sarah Silverman)也投入戰局。人類

前兩位控告生成式AI應用ChatGPT的創作稱訴研發公司OpenAI,後三位還加碼控告另一款AI應用LLaMA的生成式A訟戰研發者Meta,也就是不對臉書(Facebook)的母公司。原告指稱OpenAI與Meta在訓練其AI應用的敵友過程中,「複製並攝取」原告受版權保護的人類作品,而且「未經同意、創作稱訴未做引述、生成式A訟戰未曾付費」,不對顯然構成侵權,而且獲取利益,因此要求損害賠償與禁制令。

生成式AI近年來勢洶洶,它能夠與個別人類「聊天」,接收對方的提示(prompt),藉助於海量的資料庫與超人的學習能力,完成各種以自然語言(人類使用的語言)構成的任務。換言之,生成式AI已經可以進行一定品質的「委託創作」,從文案、歌詞、論文、劇本到小說,未必能登大雅之堂,但絕對足以吸引一般讀者/內容使用者。

但這類大型語言模型(LLM)AI的訓練過程需要大量文本,尤其是高品質、堪稱「作品」甚至「著作」的文本。一個重要來源是多倫多大學( UToronto)與麻省理工學院(MIT)建置的「BookCorpus」資料集,擁有逾一萬一千本(近十億字)未出版書籍。但原告指控,合法資料集之外,ChatGPT與LLaMA顯然還用了規模更大、但侵犯著作權的「影子圖書館」(shadow library),五位原告的作品也因此成為AI的訓練材料。

生成式AI的訓練用資料有如恆河沙數,如何證明涉及侵權?其實比想像中簡單:以子之矛攻子之盾,以席佛曼的案子為例,律師團要求ChatGPT「摘要敘述席佛曼《尿床女孩》(The Bedwetter)一書的細節」,於是ChatGPT非常認真、洋洋灑灑寫出一千五百字,充分顯示它真的「讀過」席佛曼這本2010年出版的回憶錄,結果自然是讓控方「人贓俱獲」。

當然,律師團接下來還必須證明AI的侵權行為造成作家的財務損失,並要求相應的賠償,這個過程相對困難。生成式AI前程似錦,OpenAI目前市值上看三百億美元,靠山微軟(Microsoft)更是「兩兆美元俱樂部」成員,Meta也是一兆美元等級,兩巨頭必然會好好呵護旗下的金雞母,最可能的結果是花錢擺平、庭外和解。

看似一場小蝦米對大鯨魚的不對稱訴訟戰,不過有一點值得注意:五位作家打的是一場集體訴訟(class action),所謂的「集體」代表「所有在美國擁有版權、其作品曾被OpenAI語言模型當成訓練資料、在美國居住個人或實體」,這些作者隨時可以共襄盛舉。也就是說,本案的「潛在原告」成千上萬。

五位原告並非孤軍奮戰。美國作家協會(The Authors Guild)上個月發布一封公開信,呼籲兩家生成式AI公司(OpenAI與Stability AI)與科技業四巨頭(Alphabet、Meta、IBM、微軟)的執行長,強調「沒有我們的作品,AI將平平無奇,發展極度受限」,並提出三點要求:AI程式使用有版權材料須獲同意;作品被生成式AI使用的作家須獲合理報酬,並溯及繼往;作品被AI產出使用的作家須獲合理報酬。這封公開信得到四千多位作家聯署。

而且只要是藝術創作者,應該都會非常在意侵權這回事。今年一月,一批視覺藝術家率先發難,控告三家圖像AI大廠Stability AI、Midjourney與DeviantArt侵權。Stability AI另外還被影像公司Getty Images控告。相關案件如果持續發酵,有可能成為美國司法史的一座里程碑,深刻影響AI的發展方向。

回到文本的領域,除了蜂湧而來的版權侵權爭議,依賴大型語言模型的生成式AI還面臨另一項危機:供訓練用的高品質文本日益青黃不接,一項研究甚至預測二〇二六年就將耗盡。畢竟這類文本——書籍、新聞報導、科學文獻、維基百科、篩選過的網路內容——創作主力仍然是人類,而「工人智慧」的生產速度當然跟不上「人工智慧」的消化速度。

這就透顯出多重弔詭。生成式AI對人類創作者生成莫大威脅,動搖「人類創作」作為文化與文明運作基礎的價值。ChatGPT與其AI同儕「寫出」暢銷書指日可待,但《紐約時報》應該將它列入排行榜嗎?作家提告AI一方面是維權,一方面也頗有「打不過它就加入它」的意味,希望至少在這個生態系中站穩有利可圖的一席之地。

然而AI業者也必須有所體悟,不能再堅持「未經同意、未做引述、未曾付費」、竭澤而漁的掠食者/食物模式,如此才不會斷絕文化與文明運作的活水泉源,進而與人類創作者攜手摸索出共存共榮的可能性。AI大軍已經進城,但「征服者」未必是最後的贏家,近來這一波創作者提告潮反倒有可能是一個柳暗花明的契機。


分享到:

京ICP备19007577号-5