AI圖像生成技術與人類的“智商稅”
2023-04-27 11:27:11 來源:法治日報·法治周末
■圖像時代的法律?
AI在拼命學習,人類也不能放慢學習的腳步,“AI只會淘汰那些不會使用AI的人,幫助會使用AI的人”
□ 吳志攀
有許多網民用ChatGPT生成名人的搞笑圖像,如著名球星在蹬老式縫紉機、著名歌星在小鎮路邊賣燒烤、著名影星挑著竹筐走在街巷的路上等。
更有甚者,還有網民用AI生成“美國警察抓捕前總統特朗普”的各種圖像。如果不仔細看圖像中人物的“手”,只看人臉的話,我幾乎難以分辨這是攝影師拍攝的照片還是AI生成的虛擬圖像。
AI生成圖像的能力正在接近真人
好在人類看圖像不僅用眼睛,還用腦子。那時美國法院還沒有發出傳訊這位前總統的命令,時隔一周后特朗普才到紐約當地法院接受傳訊。后來發生的事觀眾都看到了,特朗普是由律師陪同去法院的,并未拒絕出庭。
由于AI生成圖像時關注的焦點是人臉,對人手的學習目前還比較欠缺。
在繪畫和照片中,AI觀看的焦點往往是人臉,人手處于次要位置。但人手在各種動態中十分生動,被稱為“第二表情”,而且人手運動時的結構關系復雜,真人畫家尚且需要長期練習才能把握要領,AI也不例外。除非人工智能經過較長時間的專門訓練,否則其不會準確掌握。
這種情況也印證了那句老話:“畫人難畫手,畫虎難畫走?!?/p>
繪畫和攝影創作的“看點”往往在那些不處于“畫心”的其他局部細節。
當然,還有一種可能就是,AI已經具有準確表達人手的能力,只是人們在給AI指令時,沒有具體關于手部的描繪造成了這種畫面缺陷。
AI生成的圖像還難以達到“神似”
AI生成圖像的創作過程與真人畫家或攝影師不同。真人藝術家創作的那些好的作品,通常不會是基于“概念”來創作的,因為那樣會出現類似“命題作文”的效果,例如繪制(或拍攝)人物肖像,如果是基于某種“概念”來創作,畫面效果往往缺乏生命力,也不感人,更不會“神似”。
真人畫家和攝影師在創作時,沒有“算法”,也不需要“符號”標注與組合,主要是“見景生情”,創作“沖動”占主導地位。教科書上將創作沖動叫做創作的“動機”。動機是藝術創作的基礎,不僅是繪畫和攝影,小說、詩歌、音樂、舞蹈、戲劇等也都是如此?!皠訖C”大多不是理性的,是感性的,好像有一種無形的精神力量,催促著藝術家們抓起畫筆或舉起相機,迅速將這種“動機”捕捉住。如果此時不抓緊,擱置一會兒,再想畫或拍攝時,沖動的興奮點過去了,便“機不可失,時不再來”。也有人說,這是藝術創作的“靈感”,也就是“突發奇想”。
相比之下,AI生成圖像既沒有“沖動”,也沒有“靈感”,而是依靠理性和邏輯的算法,按照程序執行“概念化”和“描述性”文字指令來生成圖像的。
就這一點來說,AI生成的圖像不可能代替真人繪畫和攝影創作的作品,但可能在視覺效果上“不斷接近”。這已經是人工智能十分了不起的進步,并足以作為圖像設計的“神級”助手。它可以給真人設計師提供創作中所需要的各種可能性和效果圖。我這樣說也許低估了AI人工智能的潛力,因為如果那些真人畫家和攝影師還在基于“概念”創作的話,如果真人藝術家的作品缺乏生命力的話,那就會被AI圖像作品替代。
AI圖像生成迭代發展的速度可能還會超過人們的預期,可以相信,照這個速度發展下去,在不久將來,只要地球上的電能能夠滿足,AI生成的圖像一定會越來越接近真人畫家和攝影師的創作。到那時,觀眾將難以分辨哪些是AI生成的作品,哪些是真人畫家和攝影師創作的作品了。
這還不要緊,要緊的是我們因為不能分辨AI生成圖像與真人藝術家的創作,誤把AI作品當作真人創作的作品時,我們就很可能要為此交納“智商稅”了。
或許會出現圖像“真偽鑒別”行業
“智商稅”是一種比喻說法,形容人的智商被假象欺騙所付出的代價:浪費時間、精力和情感,或者浪費了人力、物力和財力等。例如,美國前總統特朗普任上,他看到前眾議院議長佩羅西罵他“笨蛋”的短視頻,竟然信以為真,立即在推特上轉發并反擊。
后來,人們又看到另一位前總統奧巴馬在短視頻中說特朗普是個“笨蛋”。這一次,包括特朗普本人在內的大部分網民都看出是惡搞把戲。當時看到上述短視頻的網民,大多數不是從奧巴馬口音和說話的口型上看出問題來的,因為“深度偽造”軟件幾乎能將這種短視頻做到“天衣無縫”。網民們主要是根據奧巴馬做人做事的一貫風格判斷,認為這位前政要不會在公眾場合說出這樣粗魯的詞。在上述例子中,凡是看到上述深度偽造短視頻信以為真的人,都被造假者收了“智商稅”。
更早一些時候,微信有傳“美國某知名大學校長批評我國高校教育”的演講稿“中譯版”。不熟悉高等教育的人很容易被這種虛假信息所迷惑。這位外國校長不會知道,自己在萬里之外已經“躺槍”了。但是,從事高等教育和國際交流的人一看標題,就知道相關內容是國人偽造后,再盜用外國校長的名字發出來的。因為只有借用外國公眾人物的口來說,才能吸引眼球。
有些高教和國際交流常識的人都知道,在公開場合,外國大學校長不會批評中國大學,反之亦然。因為這些高等教育界的公眾人物在講話時,非常注意禮貌和所在學校的形象,他們不想因為自己的言行對本校招生產生不利影響。即便是不熟悉高等教育,也不熟悉國際交流的人,只要他熟悉國內的話語體系和用詞習慣,從這篇講稿中也能感覺到外國人不會像國人這樣說話。
就算是“中譯”時選用國人習慣語言風格,也不可能在價值觀和邏輯推理上沒有國別文化差異。因為中譯也無法將我們的價值觀和邏輯推理強加給外國公眾人物身上。這就好像哪怕中餐與西餐不加標簽,但只要擺在我們面前,看上一眼,就能分辨出來。東西方公眾人物講話也是一樣的道理。
隨著AI圖像生成技術的進步,人工智能生成的圖像與真人繪制的圖畫或拍攝的照片越來越相似,以至于造成“真假難辨”和“以假亂真”的情況。如果到那時,觀眾中的一部分人由于知識、經驗、價值觀和方法等諸多方面的局限,分不清真假,導致“以假當真”,甚至還可能轉發他人蒙蔽更多的人。還有一種惡劣的做法是:有些人欺負不懂得外語的國內網民,將外國政要的演講配上杜撰出來的完全不相干的中文字幕,以達到不可告人的目的。這種情況讓網絡短視頻的真實性大打折扣,讓善良的觀眾為此白白付出時間和精力,甚至還付出情感。
或許,在不久的將來,圖像“真偽鑒別”工作將成為一種類似鑒定師那樣的“職業”。到那時,“真”的作品將越來越珍貴,不真或“不對”的作品就像現在藝術品市場中的“贗品”一樣,只能糊弄沒有經驗的買家,但很難混過行家的“法眼”。
在現實中的文物市場上,有專門做文物鑒定的專家和機構,許多電視臺也開辦過“鑒寶”欄目。鑒定專家分工也越來越細。例如,有的專家擅長鑒定陶瓷,有的則擅長鑒定古代字畫,有的專門做青銅器鑒定,有的對明代家具很有研究,有的則對古籍善本經驗豐富。我認為,將來很可能會出現AI合成的繪畫與AI合成的照片兩大類鑒定,用以鑒定評判圖像作品是AI生成的,還是真人所為。
而且在我看來,傳統官方媒體的可信度依然比網絡短視頻高得多,并且官媒的公信力因為AI圖像生成技術,不但不會削弱,反而會恢復和增強。此外,多學幾門外語,也不是浪費時間。因為即便沒學通,不能使用,但學過與沒學過還是不同,至少用來辨別微信上的那些短視頻真偽是足夠的了。AI在拼命學習,人類也不能放慢學習的腳步,正像網上流行的人類如何處理與AI關系的一句話:“AI只會淘汰那些不會使用AI的人,幫助會使用AI的人?!?/p>
(作者系北京大學法學院教授。北京大學外國語學院孫建軍教授對本文亦有貢獻)