当前位置:首页 > 探索

AI創作時代來臨,寫作、說話、畫圖、做影片樣樣行——職場「大風吹」,人類坐哪裡?

文:Crystal(創新拿鐵)

2022年末,網路上最受討論的創作吹人,是時代說話一隻聊天機器人—「ChatGPT」。由美國人工智慧研究機構「OpenAI」發表,來臨類坐裡短短兩週內吸引了上百萬人使用。寫作專家認為「ChatGPT」的畫圖出現,跟智慧型手機、做影職場網際網路的片樣出現一樣,將根深蒂固地改變人類的樣行工作和生活。

「ChatGPT」的大風「生成式AI」(Generative AI)技術,讓任何人都可以用簡單的自然對話(而非程式語言),指揮AI創作各種內容。創作吹人

什麼是時代說話「生成式AI」?如何爆紅?目前有哪些應用?而人類在AI創作時代如何「另謀高就」?

創新點:AI已能根據簡單的文字指令來創作文字、圖片、來臨類坐裡影音、寫作設計。原本做這些事的人怎麼辦?

這篇文章的首圖是我用AI繪圖工具「Stable Diffusion」完成的,而文字是由我和「ChatGPT」一起完成。猜得出哪些是AI寫的?哪些是真人寫的嗎?謎底在文章最後揭曉。

「生成式AI」(Generative AI)的發展歷程

生成式AI(Generative AI),是指讓「機器學習模型」研究類似作品的數據,然後去創造一個全新的作品,可以是文字、圖像、音訊檔、影片、程式碼、甚至建築設計。

過去七年,Google、Meta等科技巨頭、以及微軟投資的OpenAI,都在打造Generative AI的「語言模型」(Language Model)。這三家先驅者用大量電腦運算能力和數據「訓練」這些「語言模型」,讓它們能自己創作內容。訓練過程,可分成三個階段:

A. 萌芽期(2015年之前):

只有小型模型。這些模型在「數據分析」上表現出色,如預測外送抵達時間、詐騙訊息分類……等。但在模仿人類語言的「內容創作」上並不及格,無法像真人一般寫作、寫程式、畫圖。

B. 突破期(2015年至2022年):

2017年,Google Research 發表「Transformer模型」,是自然語言運算(Natural Language Processing, NLP)領域的里程碑。Transformer模型需要被訓練的時間比以往少,產出的品質卻大幅提高,並且容易針對各應用領域的需求客製化。(詳細可參考維基百科之介紹)

如Google開發出BERT、LaMDA。Meta開發的OPT-175B、BlenderBot。微軟投資的OpenAI開發出GPT-3(用於文字)、DALL-E2(用於繪圖)、Whisper(用於語音辨識)。

0fdrbld6fcyh2q6ptdfjwv8nuecnl3Photo Credit: GettyImages

為什麼都是富可敵國的大公司?因為訓練這些模型的成本很高。

例如,GPT-3最初在45TB的數據上進行訓練、運用了高達1750億個參數來預測結果,單次訓練就要1200萬美元。中國的悟道預訓練模型,則使用了1.75兆個參數進行訓練,動員了清華大學、北京大學、中國科學院等機構的資源。

2015年到2020年之間,訓練這些模型的計算量增加了六個數量級,使得這些模型能夠以近乎、甚至超越人類的水平,來執行任務。

只不過在這個階段,這些模型並未進入大眾視野。因為他們需要龐大資源才能運轉,成本也還沒降低到可以供大眾在雲端使用。

C. 業界落地期(2022年~):

隨著電腦運算成本降低、新技術如擴散模型(Diffusion Model)出現,訓練和營運行逐漸降低。Google等公司陸續公開這些模型,讓開發者可以試用。

當核心的生成模型被訓練出來後,不用太大量的數據,就可依據各領域進行客製化調整。於是Google開發的BERT便有專注生醫領域的模型BioBERT、法律領域的模型Legal-BERT。這讓很多專業人士也開始試用。

然後在2022年,生成式AI在一般大眾之間爆紅。

文字影音等多種內容,AI都可以做得比人更好

2022年,生成式AI出現了殺手級應用,讓一般大眾開始使用。如繪圖領域的Midjourney、Stable Diffusion、DALL·E2,以及聊天機器人ChatGPT。

同時,先驅者公開它們的語言模型(如OpenAI開放GPT-3),讓新創公司省掉耗費金錢和時間的訓練階段,直接在各專業領域推出應用產品。

這些新創涵蓋的範圍,不僅是透過文字生成文字、圖片、聲音、程式、音樂、影像、3D、NFT,甚至可以反向操作,用語音生成文字(如逐字稿應用)、圖片生成圖片(如快速去背、圖像編輯)、連結生成文字(如快速擷取url網頁內文產出腳本)、影片生成影片(如從會議影片快速生成部落格文章、推特推文、精彩花絮......等等)。這裡有網友整理出的生成式AI的各類型應用。

以商機龐大的行銷產業為例,生成式AI的商業應用潛力已經相當驚人。

從部落格文章撰寫、SEO優化、影片編輯、社群行銷文案產生、廣告素材生成……等,全部有AI可幫你代勞。各賽道都塞滿競爭者:

(以下只列出部分)

行銷工作

新創公司

部落格文章點子產生器

Hubspot Blog Ideas Generator, Portent Idea Generator

部落格文章、社群貼文、email文案、SEO優化內容產生器

Jasper, Writesonic, TextCortex

文字生成廣告素材圖片

Memorable

文字生成行銷影片

Synthesia, Movio

(文字生成行銷文案公司Jasper的使用情境)

(文字生成行銷影片公司Synthesia的使用情境)

從點子發想,到實際撰寫內容、拍攝圖片、拍攝影片,如今生成各式各樣的行銷素材,都可以坐在電腦前面一鍵完成。不需抓耳撓腮、腸枯思竭,也不必為了打光跑進跑出,NG重來數遍。

美國已有許多公司開始採用這類的AI工具。如雲端運算大廠VMWare的內容行銷人員,就運用Japser產出行銷郵件內容、廣告文案、社群內容。當AI已經可以執行大部分的寫作任務時,寫手就可以專注於尋找更好的寫作題材、研究內容方向、制定內容策略方向。這種跟AI玩「大風吹,換位子」的現象,已經在大企業發生。


分享到:

京ICP备19007577号-5