【人工智能寫的詩,你有本事分辨出來嗎】

ADVERTISEMENT

聽說這幾天古詩詞很火,各種專業騷客、民間高手、百年才子如雨後春筍湧現於神州大地,令人歡欣振奮。

恰好,澎湃新聞記者看到一些人工智能、AI、機器人——隨便怎麼叫都好——反正是非人類作的詩,被唬得不要不要的。各位姿勢水平很高的澎友給看看。

先上詩,第一組:

ADVERTISEMENT

是不是大寫的服?

如果說二選一還是比較容易判斷(蒙中)的,那再來第二組:

1、雲峰

白雲生處起高峰/鬼斧神功造化成/古往今來誰可上/九重宮闕握權衡

2、畫鬆

孤耐淩節護/根枝木落無/寒花影里月/獨照一燈枯

3、悲秋

幽徑重尋黯碧苔/倚扉猶似待君來/此生永失天台路/老鳳秋梧各自哀

4、春雪

飛花輕灑雪欺紅/雨後春風細柳工/一夜東君無限恨/不知何處覓青鬆

5、落花

紅濕胭豔逐零蓬/一片春風細雨濛/燕子不知無處去/東流猶有杜鵑聲

問:這五首哪些是機器作的?

沃剛人的詩在宇宙里可能發生的最壞的事里排名第三位。——《銀河系漫遊指南

公布答案:第一組左邊一首,第二組中2、4、5是機器所作的詩。

從詞語拚湊到基於深度學習技術的造詩機

實際上,以上的機器詩可以說是當下機器所能達到的較高,甚至可能是最高水準了。

知乎專欄作者蕭瑟在《當AI邂逅藝術:機器寫詩綜述》一文中,認為機器詩歌生成的工作,起始於20世紀70年代。但在計算機誕生之前,就有好事者弄了個高頻詩歌詞語轉盤,轉到哪個詞就記錄下來,然後連起來形成一首“詩”。這種詩自然會出現類似“蘋果吃姑娘,殘紅殺馬特”,邏輯不通,不倫不類的句子。當然,也可能偶然搞出“澎湃是個好新聞”這樣的佳句。

這個套路叫做“word salad”——把各種詞語像沙拉一樣拌在一起,在有了計算機後,被引入進去,成為早期的機器詩歌生成方法。

根據蕭瑟的介紹,在詞語沙拉法之後,機器詩歌的傳統生成辦法還有基於模板和模式的、基於遺傳算法的、基於摘要生成的方法以及基於統計機器翻譯的方法。這些方法,要麼是詩句之間缺乏語義連貫性,要麼缺乏靈活性,而且都有別於詩詞領域的專業知識,需要專家設計大量的人工規則,對生成詩詞的格律和質量進行約束。

但是,隨著深度學習技術的發展,造詩機迎來了春天。基於RNN語言模型的方法,將詩歌的整體內容,作為訓練語料送給RNN語言模型進行訓練。訓練完成後,先給定一些初始內容,然後就可以按照語言模型輸出的概率分布進行采樣得到下一個詞,不斷重複這個過程就產生完整的詩歌。

原理很複雜,記者也看不懂,就不多說了。反正結果就產生了開篇第一組中的那首。當然,正如前文說的,這首是水準較高的例子。還有這樣的:

這樣的:

ADVERTISEMENT

這兩首詩,上面的是網友用網絡在線詩歌生成機器人——“編詩姬”生成的,下面的是澎湃新聞記者剛剛用該姬生成的,似乎很鍾意“龜”這個意象。該姬的自我介紹是:編詩姬是采用語義分析與深度學習技術開發的詩歌生成機器人。在熟讀了全唐詩五萬首後,本姬可以自動根據您的需要三秒吟詩。雅韻傳情,原創保證,來分享給您關心的人一首小詩吧。

看來同樣是深度學習技術,學習的能力還是有差別的。

“機器詩猶如塑料花,入手即知”?

開篇第二組的機器詩,來自清華大學清華大學語音與語言實驗中心(CSLT)。去年,就在AlphaGo戰勝人類當下最傑出的一批圍棋選手後,CSLT網站宣布,他們的作詩機器人“薇薇”通過社科院等唐詩專家評定,通過了“圖靈測試”。所謂“圖靈測試”是指通過對話分辨真實人類和人工智能的試驗,通過“圖靈測試”意味著人類無法通過語言對話分辨出人類和人工智能。

CSLT網站公布結果,“薇薇”創作的詩詞中,有31%被認為是人創作的。不過,在本次比賽中,“薇薇”創作古詩的水平還是未能超越現代人類詩人,雙方的比分為2.72比3.20(滿分5分)。

看來不僅是普通人,即便擁有一定創作經驗的作者,要區分這種比較高明的機器詩也是有一定困難的。

澎湃新聞記者也將開篇兩組詩,發給了一些舊體詩人。《荊棘鳥》譯者、舊體詩人曾胡對於第一組詩歌,初始感覺是:很難判斷,但覺得右邊一首是人寫的可能性較大,理由是“恨竹”這兩個字機器很難仿寫出。

曾胡隨後將這兩首詩發到了朋友圈進行測試,結果:“一半人猜對,都是學問比較好的,未見學問好的猜錯。一位朋友說,機器詩猶如塑料花,入手即知。”

不過曾胡的這位朋友在面對第二組的五首詩時,卻未能入手即知。曾胡則在反複細度之後,通過“孤耐淩節護”(句意不明)、“一夜東君”(東君指太陽,一夜東君語義矛盾)、“細雨濛”(濛字一般不單用)等語詞、語義方面,判斷出2、4、5為機器詩。

曾胡認為,因為測試的對比樣本是現代人的古體詩詞,與機器詩的分野並不明顯,如果是唐詩,即便不是那麼名篇佳作,那麼可能就會容易許多。畢竟無論是Alpha Go還是百度機器人“小度”,這些人工智能所挑戰甚至戰勝的都是該領域人類最傑出的一批頭腦,如果機器詩的比較樣本,本身都沒有多少獨特性、創造性,那麼該如何檢驗作詩機器人是否具有創造力呢?

藝術會成為人類最後的陣地嗎?

AlphaGo、“小度”、搜狗“汪仔”、新聞寫稿機器人,以及各種各樣的人工智能不斷的出現,並且取得了不俗的效果後,似乎未來獨屬於人類的領域越來越少,機器無法涉足的人類空間越來越少。

現在,被視為人類最後陣地的藝術也成為人工智能進軍的方向。但是,無論是在文字藝術、圖像藝術還是聲音藝術方面,機器的表現都很難與人類媲美。

在清華作詩機器人之前,達特茅斯學院舉辦的“創意圖靈測試”(Turing Tests in Creative Arts)周三宣布,這場競賽並未選出最終優勝者,因為人工智能算法未能創造出與人類媲美的故事和詩歌。

在詩歌測試中,有兩支參賽隊伍分別創作了兩首14行詩;在文學競賽中,有3支隊伍分別創作了一個簡短的故事。這些內容都與人類創造的內容混在一起。最終結果顯示,沒有一篇故事或詩歌成功蒙混過關,只有一篇短篇故事讓一位人類評審員判斷失誤。

看看穀歌人工智能所的英文詩,你或許就會明白為什麼沒人判斷失誤。

no. he said.

“no,” he said.

“no,” i said.

“i know,” she said.

“thank you,” she said.

“come with me,” she said.

“talk to me,” she said.

“don’t worry about it,” she said.

而在繪畫和作曲上,機器的表現要比在文字上的好些,但也不盡如人意。

ADVERTISEMENT

上圖是德國貝特格實驗室里進行的研究,研究人員能將畢加索、梵高、康定斯基和蒙克的風格應用到數字圖像上。原照片(左上)分別被轉換為不同的風格:特納(J.M.W. Turner)的《米諾陶戰艦的傾覆(The Shipwreck of the Minotaur)》風格(右上)、文森特·梵高(Vincent van Gogh)的《星夜(The Starry Night)》風格(左下)、以及愛德華·蒙克(Edvard Munch)的《呐喊》風格(右下)。

上圖是穀歌Deep Dream根據照片所作的繪畫,仍然是風格轉移,也就是美圖秀秀的濾鏡水平。

眾所周知,人與機器最本質差別是人擁有意識,機器沒有。越高級的意識活動越具有獨特性,這種獨特性要求催生這種意識的對象獨一無二:獨一無二的詩歌,獨一無二的繪畫,獨一無二的音樂。就目前來看,無論機器所寫的詩、畫的畫、譜的曲多麼以假亂真,甚至在審美上多麼令人讚歎,但是不具有獨特性、創造性的仿品也就不具有藝術價值,就像小孩子隨意塗鴉也可以很好看一樣。

參與研發搜狗人工智能“汪仔”的一位研究人員也對澎湃新聞記者表示,“從目前已經產出的人工智能寫的詩歌、所畫的畫作來看,人工智能已經能做一些‘類藝術活動’,但和真正的‘創造’還有一定距離。”

“在一些重複性的腦力勞動中,機器已經開始具備比人類做得更好的能力。但是在一些需要創造力的領域中,目前機器的能力還需要繼續提升。

“機器目前還有兩個限制條件:第一個限制條件是它的工作環境相對封閉,輸入的是一些固定有限的信息;第二個限制條件是有標準化解答。所以一項工作如果面臨的環境越簡單,最後的動作越標準,比如審計師、司機,就越有可能被機器取代。

“但是還有很多機器解決不了的問題,比如:創造力的問題、認知上的問題、人的好奇心的問題。人工智能到今天為止還只是幫助完成簡單的重複性的腦力勞動,圍棋其實也是接近重複性的腦力勞動,更加具有挑戰性、更有創造性的事情還需要人類來完成。”

顯然,在藝術的道路上,人工智能要走的路還很遠。但是,沒人能斷定,未來不會真像科幻小說劉慈欣預言的那樣,人工智能可以擁有自我意識,產生情感,具備藝術創造性。

不過到那時候,又該如何界定人和機的界線呢?搜狗的這位專家的回應是:如果真有那麼一天,那麼未來人工智能與人的融合將會帶來新的物種,這也是人類的自我進化。

這說法,是不是有點像《攻殼機動隊》呢?

ADVERTISEMENT