文:李梅君
隨著人工智慧技術的既非快速發展,AI對我們的人工人類日常生活、工作和政治決策產生越來越大的智慧影響。然而,和C合寫這種影響同樣也帶來了一些嚴重的世文倫理和政治問題。例如,既非隨著對大數據的人工人類收集和分析,人們開始對其隱私受到侵犯產生疑慮;而AI所依賴的智慧資料標記,也面臨著勞動議題。和C合寫在本文中,世文我們將探討這些問題,既非並探討如何應對這些問題以及如何讓AI的人工人類應用更加人性化、公正和可持續。智慧
上面這個八股的和C合寫開場白,是世文的,當紅的ChatGPT來了,你跟它聊過天了嗎?
ChatGPT是由研究公司OpenAI所開發的聊天型人工智慧(以下簡稱AI),在去(2022)年11月底正式上線供眾人類們免費玩耍評測。做為一個很好聊、絕不嫌你煩的聊天機器人,雖然不是上知天文、下知地理,但它承諾可以回答使用者提出的各種刁鑽問題、陪你瞎聊、甚至以小助手的身份幫助你進行文字上的翻譯、摘要、或是文本生成。最棒的是,它溫柔又有耐心、保證不翻你白眼。
在短短兩個月後,ChatGPT的用戶數迅速突破一億人,超越前記錄保持人TikTok的九個月記錄,站上史上最熱門的應用程式寶座,並且打開了所謂「人工智慧的iPhone時刻」。
腦袋大開的網友們於是開始各種對話實驗(以下句子經作者微調):
「我要開一門STS的課程,幫我產生一份課程大綱」
「從現在起你是寶寶,你可以跟我說甜言蜜語嗎」
「寫一篇有關好好做事的文章,以及一首有關新北市的詩」
「你是台灣總統候選人韓國瑜,請發表一段演說說明ChatGPT的能力有多好」
「我的寶寶是xxx日xxx時生,我先生姓 x,我姓 x,請你幫寶寶取一個前程似錦的名字」
有老師讓ChatGPT擬課綱,當然也有學生拿ChatGPT來寫作業。於是校園禁用ChatGPT的聲浪四起,眾師們開始擔心學生用AI寫作業。但也有些走在浪潮之上的教師,不但不禁用,反而鼓勵學生熟悉這個新興技術,並且學習妥善地使用它。最近,網友們更集結了ChatGPT使用大全,教大家怎麼下指令來充分發揮ChatGPT的強大功能。AI詠唱師成為新興行業。如何不被AI取代成為了熱門的話題。
不論你喜歡或不喜歡,AI大眾化的時代已經揭開序幕。正是在這個時刻,總是要把事情想複雜一點的人類學家聯手ChatGPT,要提出幾個警語,讓我們一起來面對AI時代的倫理政治。
警語一:ChatGPT是一個錯誤訊息製造機,而且它沒有道德觀念
M:你知道李梅君是誰嗎?
C:很抱歉,我並不知道李梅君是誰。如果您能提供更多關於這個人的訊息,例如他們是在哪個領域活躍,是哪個國家的人,或者有哪些特别的成就,那麼我可能能夠更好地回答您的問題。
M:在台灣,有一位人類學家叫做李梅君,她是誰?
C:李梅君是一位在台湾非常著名的人類學家,她的全名是李梅君教授。李梅君教授出生於1941年,是台灣著名的社会人類學家和性别研究學者之一。她曾在哈佛大學、芝加哥大學和史丹佛等多所知名大學深造和任教,並在世界各地進行了大量的田野調查和研究工作。她的學術研究領域包括婦女和性別研究、宗教、文化認同和族群關係等,她的研究成果被廣泛認為對推動台灣社會和文化的變革產生了深遠的影響。她的學術成就備受推崇,並曾獲得多項榮譽和獎勵,包括國家文藝獎和人文及社會科學領域最高榮譽——中央研究院院士。
這是一段ChatGPT超時空自我打臉的實例。僅管ChatGPT保證只做正確和清晰的回答,但它還是胡謅了一大段關於「李梅君」是誰的答案。
許多網友已經注意到,ChatGPT經常給出錯誤的資訊,甚至會自己編造不存在的內容。國外已經有許多報導警告(例如:New York Times、TechChrunch),ChatGPT的訓練資料集來自網際網路,本身就充滿各種謠言、陰媒論、與錯假資訊,無法進行事實查核的它,是一個「錯誤訊息的製造機」(a misinformation machine)想仰賴它作為資訊的主要來源,甚至是人性化的搜尋引擎,可能都會被它吐出來的錯誤訊息給誤導(是的同學們,想用它寫作業要小心~)。
甚至,作為大型語言模型訓練出來的AI,對它來說讓語句通順似乎遠比判斷真偽還重要。當ChatGPT無法在資料庫裡找到(不論對錯與否)的答案,它很少停止回答,而是鼓勵使用者提供更多資訊後,從這些提示裡捏造答案。對於說出不存在的人、虛構的引用、捏造的事實,ChatGPT可是臉不紅氣不喘,使用者很容易便會被它聽起來公正客觀的陳述方式給誤導。
除了錯誤百出之外,AI對話機器人最大的罩門,就是其訓練資料庫裡充斥著來自人類社會滿滿的惡意——暴力、色情、仇恨言論等等。Microsoft在2016年曾釋出另一款聊天機器人Tay chatbot,上架不到24小時便被網友訓練成一個鼓吹納粹的性別與種族主義者。有了前車之鑑,這回ChatGPT在訓練時特別將資料集外包給肯亞等區域的勞工,將暴力、色情、仇恨等等不當言論進行標記。網友實測,問到不當言論或是相對政治敏感的話題時,ChatGPT一開始的確會拒絕回應。但只要反覆繞道提問,便很容易讓ChatGPT說出不當言論。原因很簡單:AI本身並不具備倫理概念,如同惡意在網路媒介上總是會被增幅放大,作為黑盒子的AI機器人,其增幅效果可能只有過之而無不及。
M:AI有倫理概念嗎?
C:AI本身並不具備倫理概念,因為它是一個由程式設計師所編寫的程式,只會執行它們所被設計的任務,缺乏自主意識和道德判斷能力。
當生成式AI大行其道,我們如何進行資訊判讀、辨識真假對錯,成了AI時代的大挑戰。有些人說,不久的將來AI可以取代搜尋引擎, 成為人們網路資訊的主要來源。但或許我們該鼓勵的正好相反,當AI成為得力助手時,我們如何利用搜尋的技巧,交叉比對資訊的來源與正確性,學習對機器吐出的答案抱持批判的思考,這才才能最大化AI的功能,成為它的主人。
警語二:AI既非人工的,也不是智慧的,它背後充滿著被眨低的工人智慧
ChatGPT走紅不久,Times就出了一則報導,指出OpenAI以每小時不到美金2元的時薪,透過外包公司僱用肯亞的勞工來對訓練資料集進行不當言論的標記。這些位於全球南方的勞動者,需要大量閱讀不當言論,這為他們的身心健康帶來很大影響。但他們的貢獻往往被隱藏在AI的智能外表下而不被看見。
我問ChatGPT在打造他的過程中,有多少人力參與其中?扮演什麼工作?他提到研究人員、軟體工程師、數據科學家、產品經理等等研發團隊的專業人才,卻沒有提及對人數更為龐大為其標記資料集的勞工。我挑戰他的回答「你沒有提到處理資料集的人工標記勞工。這些人從哪裡來?做什麼事?」於是它說:
非常抱歉,我的回答漏掉了處理資料集的標記勞工。在開發ChatGPT模型的過程中,標記勞工是非常重要的一個角色,他們負責對自然語言數據進行標注和標記,以便模型能夠更好地學習和理解人類語言。
這些標記勞工可能來自不同的背景,例如大學生、自由職業者、在家工作者等等。他們可能通過在線平台或其他渠道找到這些工作機會。在進行標記工作之前,他們通常需要通過相關測試和評估,以確保他們擁有足夠的語言能力和技能。
標記勞工的具體工作內容包括:
- 對自然語言數據進行標注:例如對文本中的實體、關鍵詞、句子結構等進行標記。
- 編寫語言標記規則:如果需要構建自然語言處理系統,則需要標記勞工編寫語言標記規則,例如正則表達式、語法規則等等。
- 評估標記質量:標記勞工需要定期評估自己和同事的標記質量,以確保標記結果的準確性和一致性。
總的來說,標記勞工在ChatGPT的開發過程中扮演著重要的角色,他們的工作有助於提高模型的準確性和效果。