用戶登錄投稿

中國作家協(xié)會主管

何平:機器制造文學(xué)? ——關(guān)于當(dāng)下AI寫作的技術(shù)問題
來源:《花城》 | 何平  2021年09月15日08:40
關(guān)鍵詞:AI寫作 文學(xué)性

原標(biāo)題:目前的機器寫作,不是文學(xué),更不能取代作家創(chuàng)作

人工智能技術(shù)會不會代替獨立的人,來完成文學(xué)寫作?在本期“花城關(guān)注”中,作家陳楸帆、王元分別與AI寫作軟件“創(chuàng)新工場”“彩云小夢”合作完成小說的寫作。他們的實踐恰恰證明,AI寫作目前還停留在簡單模仿的層面。人類靈魂的深度,尚不是當(dāng)前的機器算法所能測量。本文系專題引文。

——編者

這一期的兩篇小說是人和機器共同完成的,雖然最后署的是人名,但我們以楷體字標(biāo)志出機器完成的部分。和陳楸帆合作的是創(chuàng)新工場的“AI科幻世界”。這款產(chǎn)品可學(xué)習(xí)和模仿陳楸帆的小說句法和行文風(fēng)格。而與王元合作的則是網(wǎng)絡(luò)上很多人都用的寫作軟件“彩云小夢”。該軟件不是專門為特定寫作者定制的,是一款公共的AI寫作產(chǎn)品。機器(AI)參與到需要人類高級思維和想象能力才能完成的文學(xué)、藝術(shù)及其他活動在當(dāng)下不斷成為大眾傳媒的話題,像會唱歌的“洛天依”、會寫詩的“小冰”、會下棋的機器人等。一些對風(fēng)潮敏感的研究者將這些目前只是依靠大數(shù)據(jù)、算法等計算機技術(shù)的初級文學(xué)藝術(shù)行為徑直解讀為機器(AI)寫作正在取代人類文學(xué)。而事實上卻不是如此。以“小冰”寫詩為例,與文學(xué)界的熱捧不同,“小冰”的開發(fā)者,微軟(亞洲)互聯(lián)網(wǎng)工程院小冰團隊首席科學(xué)家宋睿華在2018年10月26日的CNCC技術(shù)論壇之“自然語言生成:讓機器掌握文字創(chuàng)作的本領(lǐng)”的演講中就明確表示,機器并不會取代人類寫詩。他在演講的最后以他上幼兒園的女兒的一首即興的小詩為例,認(rèn)為:“人類在作詩的時候是非常奇妙的,是AI所不能企及的,因此我們的空間還很大?!蔽依斫馑晤HA所說的“我們的空間還很大”應(yīng)該是兩個方面的:一方面是人類的寫作及其他審美藝術(shù)的潛力;另一個方面,則是機器(AI)介入審美藝術(shù)等領(lǐng)域的前景,這兩個方面都有著遼闊的空間。

普通人對AI的好奇,乃至焦慮和恐懼,和科技進(jìn)步,和人文社科研究者、大眾傳媒的宣傳有著密切關(guān)系;另外一股力量可能來自科幻文藝對未來世界的想象。這種想象典型地體現(xiàn)在宇宙旅行和人工智能上。其中,人工智能很容易讓人聯(lián)想到當(dāng)下的機器(AI)寫作。電影工業(yè)產(chǎn)品從20世紀(jì)80年代的《銀翼殺手》到新世紀(jì)的《攻殼機動隊》等,對人工智能的可能疆域作出了許多開拓,而《銀翼殺手》則由賽博朋克風(fēng)格的開創(chuàng)者菲利普·迪克的小說《仿生人會夢見電子羊嗎》改編。人工智能也是當(dāng)下中國文學(xué)的熱點話題之一,“花城關(guān)注”發(fā)表的年輕作者杜梨和周婉京的小說都探索過這一主題。人工智能不局限在我們現(xiàn)在技術(shù)上已經(jīng)實現(xiàn)了并還在拓展的增強身體的領(lǐng)域,而是智能人從類人、近人到“人”,乃至超人的成長。這種生物體和機器的混合體,“既是社會現(xiàn)實的生物,也是虛構(gòu)的生物”(哈拉維),也就是所謂的“賽博格”。在科幻文藝描述的未來世界中,智能人從為人所用到逃逸出人的掌控和奴役,成為自足的“另一種人”?!八鼈儭迸c人類一起分享、占有和競爭生存空間,也實現(xiàn)著自身的成長和進(jìn)化。而最令人憂慮的不只是人和“另一種人”之間交往的諸多倫理問題,在對未來世界的想象中,“另一種人”可能會反噬,甚至轉(zhuǎn)而奴役人類。

但至少目前的機器(AI)寫作,無論是“小冰”,還是參與王元的《他殺》的“彩云小夢”,還是陳楸帆合作的創(chuàng)新工場,最終的成品并不是自足的文學(xué),只是技術(shù)輔助,而且只是初級的技術(shù)。說到技術(shù),我們當(dāng)然要把技術(shù)的歸到技術(shù)。同時,可以看陳楸帆的實踐和他是怎么說的。

陳楸帆生于1981年,他出生的第二年,1982年,電影《銀翼殺手》上映。2017年陳楸帆開始嘗試與AI共同寫作,這就是《人生算法》這本關(guān)于人與AI之間共生的六個故事中的《出神狀態(tài)》。下面是陳楸帆自述機器寫作的技術(shù):

GPT本質(zhì)是一個語言模型,如同物理模型是用來理解和描述這個物理世界的本質(zhì)一樣,語言模型用來理解和描述語言的本質(zhì)是什么。人類有世界觀,也有語言觀,比如說語言是什么,構(gòu)成語言的詞或短語之間的關(guān)系又是什么。

簡單抽象來說,語言模型主要用來做兩件事:一是對自然語言做理解,比如給出兩個句子,語言模型會判斷哪個句子更像自然語言、句子里面的詞或短語的依賴關(guān)系是什么;二是對自然語言做預(yù)測,比如只給出一句話的前幾個字,來預(yù)測后面的字是什么。

傳統(tǒng)意義的語言模型主要用在語音識別、機器翻譯、OCR(光學(xué)字符識別,即針對印刷體字符,采用光學(xué)的方式將其轉(zhuǎn)換為電子文本格式)等序列到序列任務(wù)里,對目標(biāo)序列做預(yù)測和判斷。

最常見的兩種用途之一是,機器會將一句中文翻譯成不同的英文,語言模型會對每句英文翻譯進(jìn)行打分,從而選擇最優(yōu)的翻譯。另一種是,在語音識別中,僅說到“我們正在聊……”,語言模型就會預(yù)測出,你大概率要說的是“我們正在聊天”,即使沒聽到“天”的聲音就能判斷出你將要說什么話,而聽到的聲音則是這個信號的加強。

如果把訓(xùn)練一個模型類比成培養(yǎng)一個學(xué)生,我們一般遵從一種叫作“先預(yù)訓(xùn)練、后微調(diào)”的教學(xué)方法。具體來說,我們先給機器很多書本讓他自己讀,這就是所謂的無監(jiān)督預(yù)訓(xùn)練(pre-training);然后給它很多有答案的題目讓它做練習(xí),這就是所謂的有監(jiān)督的微調(diào)(fine-tuning)。經(jīng)歷這個學(xué)習(xí)過程,模型就訓(xùn)練出來了,接下來就可以對它進(jìn)行各種考試了,比如說給它一句話,讓它接著寫下一句。

此次與人類配合創(chuàng)作的AI模型來自創(chuàng)新工場DeeCamp 2020人工智能訓(xùn)練營中的大學(xué)生創(chuàng)新項目“AI 科幻世界”,它是一個在一千多塊顯卡上訓(xùn)練出來的超大規(guī)模預(yù)訓(xùn)練模型,用了300GB的中文語料,其參數(shù)規(guī)模與GPT-2 Large相當(dāng),訓(xùn)練完畢后又用了少量故事數(shù)據(jù)做微調(diào)。今年大火的GPT-3上體現(xiàn)出來的一些模型特色,在“AI 科幻世界”上也能有所體現(xiàn),“并且是中文的”。

從操作層面看,人類作家與模型的交互十分簡單,只需要給定場景與人物關(guān)鍵詞,AI就能自動生成幾個段落供作家們選擇。人類作家可以在其基礎(chǔ)上進(jìn)行修改,而后AI將在經(jīng)過修改的前文的基礎(chǔ)上繼續(xù)進(jìn)行創(chuàng)作,如此往復(fù),完成人類作家和AI的“共同作品”。

今天對于AI來說,一些簡單的財經(jīng)新聞報告已經(jīng)不是難事,因為這些都是可以結(jié)構(gòu)化處理的語句結(jié)構(gòu)。不過,要涉及文學(xué)創(chuàng)作就是另一回事,如果從創(chuàng)作者的角度理解人工智能創(chuàng)作文本的不同階段,最初的階段是用統(tǒng)計學(xué)對語言要素進(jìn)行排列組合,可以創(chuàng)作出簡單的詩歌;后來進(jìn)階到人工智能在網(wǎng)絡(luò)文本數(shù)據(jù)集里無監(jiān)督地學(xué)習(xí)各種符合人類語法的規(guī)則和客觀知識、去模擬人類的寫作風(fēng)格;可能更進(jìn)一步的是AI可以從一個意象、一段話,去生發(fā)出來一個邏輯自洽、人物關(guān)系清晰、具有典型敘事結(jié)構(gòu)的完整故事。

所以,至少目前機器(AI)寫作所提供的只是一種技術(shù)路徑和文字組合的片段實驗,并沒有實現(xiàn)真正意義上的機器制造的文學(xué)。同樣的,王元也持這種觀點,關(guān)于《他殺》,7月13日,我和王元在微信上有一個交流。

何平

王元

何平:問一個問題,森北和玄理、“我”和婧、光子和“我”,這三個“小夢”完成的場景是如何選擇的?還是先有其他部分,然后讓“小夢”完成這一段未完成的部分呢?再有,如果選擇中間某一個點,讓“小夢”自由地寫下去,最后邏輯能自洽嗎?(我給王元發(fā)了豆瓣小組討論一篇“彩云小夢”完成的小故事,還有一篇關(guān)于“彩云小夢”寫作的討論)豆瓣小組的這些故事也是“彩云小夢”完成的嗎?

王元:首先是要在那個“彩云小夢”的在線頁面內(nèi)進(jìn)行寫作。我先寫一段,然后隨機點擊生成,就會續(xù)寫出幾個自然段,可以挑選一個滿意的,都不滿意,可以重新生成。沒有特別讓“彩云小夢”去生成哪些內(nèi)容。因為這個在線續(xù)寫軟件不夠智能,我在文章中也對生成的文本做了吐槽。

《他殺》里楷體字部分都是生成的,但是經(jīng)過了修改,不然語義有點太不通順,我已經(jīng)盡量保留了行文的原貌,以做區(qū)別。

豆瓣上那些我不太清楚,也沒有做參考,我只是使用了在線生成功能來完成一次人機交互寫作,對這個軟件沒有做太多了解。這個遠(yuǎn)不如“創(chuàng)新工場”編寫的程序好用,使用感并不好,更適合用來寫網(wǎng)文水字?jǐn)?shù),很難產(chǎn)生真正的互動。

我覺得很重要的兩點吧:一是,“彩云小夢”不能像“創(chuàng)新工場”的寫作軟件可以錄入作者的文本,讓生成的風(fēng)格貼近作者的敘事語言。二是,生成的本文很多時候與已有故事情節(jié)特別割裂,所以體驗感不是很好。

我覺得人機交互寫作是一個非常有趣的嘗試,但要說人工智能取代作者還任重道遠(yuǎn)。人工智能更適合生成新聞通稿和報告,這些文本的措辭比較雷同,而且,可以完全避免敏感詞。

何平:《他殺》用的是“創(chuàng)新工場”嗎?

王元:《大成若缺》是“創(chuàng)新工場”寫的,《他殺》是“彩云小夢”寫的。當(dāng)時“創(chuàng)新工場”的軟件服務(wù)費到期不能用了,我就從網(wǎng)上找免費的續(xù)寫軟件。

何平:所以我覺得《他殺》里的“彩云小夢”所寫的恰恰證明了“彩云小夢”的程式化。

王元:對,玩一玩還行,正經(jīng)要靠這個寫作不太夠用。或者說沒有太多驚喜的發(fā)散。楸帆的《大有》的機器部分,我覺得比《他殺》要復(fù)雜一些。

何平:所以,這種寫作基本上還是嘗試?!端麣ⅰ非∏∽C明目前寫作軟件不可能完成文學(xué)性內(nèi)容。

王元:相比文學(xué)性,我覺得創(chuàng)造性更適合一點。文學(xué)性的界定相對模糊。創(chuàng)造性就好說了,就是說給我們一個主題,或者已有的內(nèi)容,機器能制造出什么?

何平:網(wǎng)文的類型化也許可以適應(yīng)這種寫作軟件。機器能制造“文學(xué)”嗎?這正是我們要討論的話題。

王元:交互寫作是一個人機合作和博弈的過程,得有碰撞才行。兩次寫作感受下來,碰撞都不夠,“彩云小夢”比“創(chuàng)新工場”更差一些。對,一個是網(wǎng)文,一個是通稿。就是類型化比較明顯和簡單的文體。這些相對來說,不用那么多創(chuàng)造性。

至此,我們可以看到當(dāng)下機器(AI)寫作的大致邊界。介入其中的實踐者是清醒的,聒噪的往往是旁觀者。對我個人而言,也是一次技術(shù)啟蒙。想象這個專題之初,受前沿學(xué)者和大眾傳媒的蠱惑,我對機器寫作(AI)抱有厚望,希望最終的文本不是“小冰”的詩,而是完整的敘事單元,但最終實踐者陳楸帆和王元所展示的實踐成果,恰恰證明,到目前為止,基于算法和語料的機器寫作(AI)并不能獨立完成“文學(xué)”文本,哪怕是小說中的局部片段也不能完美地嵌入陳楸帆和王元的敘事中。而這種不完美,甚至是失敗,對比夸大“小冰”詩歌的完美和成功,正是這個專題的意義所在?!靶”痹姼璧奈膶W(xué)性則是詩歌文體本身曖昧模糊為闡釋者帶來了想象的空間。換句話說,“小冰”詩歌的文學(xué)性并不是“小冰”“寫”出來的,而是闡釋者“說”出來的。如果真要算文學(xué)成就,這個成就只能記在闡釋者的名下。但這不意味著世界范圍內(nèi)與機器寫作相關(guān)的“賽博格”的廣泛討論和憂慮沒有意義,相反,初級的機器寫作已經(jīng)引發(fā)了我們?nèi)绱硕嗟慕箲]和恐懼,如果科幻文學(xué)所描繪的賽博空間有一天真正兌現(xiàn),人類準(zhǔn)備好了嗎?