用戶登錄投稿

中國(guó)作家協(xié)會(huì)主管

何平:機(jī)器制造文學(xué)? ——關(guān)于當(dāng)下AI寫作的技術(shù)問題
來源:《花城》 | 何平  2021年09月15日08:40
關(guān)鍵詞:AI寫作 文學(xué)性

原標(biāo)題:目前的機(jī)器寫作,不是文學(xué),更不能取代作家創(chuàng)作

人工智能技術(shù)會(huì)不會(huì)代替獨(dú)立的人,來完成文學(xué)寫作?在本期“花城關(guān)注”中,作家陳楸帆、王元分別與AI寫作軟件“創(chuàng)新工場(chǎng)”“彩云小夢(mèng)”合作完成小說的寫作。他們的實(shí)踐恰恰證明,AI寫作目前還停留在簡(jiǎn)單模仿的層面。人類靈魂的深度,尚不是當(dāng)前的機(jī)器算法所能測(cè)量。本文系專題引文。

——編者

這一期的兩篇小說是人和機(jī)器共同完成的,雖然最后署的是人名,但我們以楷體字標(biāo)志出機(jī)器完成的部分。和陳楸帆合作的是創(chuàng)新工場(chǎng)的“AI科幻世界”。這款產(chǎn)品可學(xué)習(xí)和模仿陳楸帆的小說句法和行文風(fēng)格。而與王元合作的則是網(wǎng)絡(luò)上很多人都用的寫作軟件“彩云小夢(mèng)”。該軟件不是專門為特定寫作者定制的,是一款公共的AI寫作產(chǎn)品。機(jī)器(AI)參與到需要人類高級(jí)思維和想象能力才能完成的文學(xué)、藝術(shù)及其他活動(dòng)在當(dāng)下不斷成為大眾傳媒的話題,像會(huì)唱歌的“洛天依”、會(huì)寫詩的“小冰”、會(huì)下棋的機(jī)器人等。一些對(duì)風(fēng)潮敏感的研究者將這些目前只是依靠大數(shù)據(jù)、算法等計(jì)算機(jī)技術(shù)的初級(jí)文學(xué)藝術(shù)行為徑直解讀為機(jī)器(AI)寫作正在取代人類文學(xué)。而事實(shí)上卻不是如此。以“小冰”寫詩為例,與文學(xué)界的熱捧不同,“小冰”的開發(fā)者,微軟(亞洲)互聯(lián)網(wǎng)工程院小冰團(tuán)隊(duì)首席科學(xué)家宋睿華在2018年10月26日的CNCC技術(shù)論壇之“自然語言生成:讓機(jī)器掌握文字創(chuàng)作的本領(lǐng)”的演講中就明確表示,機(jī)器并不會(huì)取代人類寫詩。他在演講的最后以他上幼兒園的女兒的一首即興的小詩為例,認(rèn)為:“人類在作詩的時(shí)候是非常奇妙的,是AI所不能企及的,因此我們的空間還很大。”我理解宋睿華所說的“我們的空間還很大”應(yīng)該是兩個(gè)方面的:一方面是人類的寫作及其他審美藝術(shù)的潛力;另一個(gè)方面,則是機(jī)器(AI)介入審美藝術(shù)等領(lǐng)域的前景,這兩個(gè)方面都有著遼闊的空間。

普通人對(duì)AI的好奇,乃至焦慮和恐懼,和科技進(jìn)步,和人文社科研究者、大眾傳媒的宣傳有著密切關(guān)系;另外一股力量可能來自科幻文藝對(duì)未來世界的想象。這種想象典型地體現(xiàn)在宇宙旅行和人工智能上。其中,人工智能很容易讓人聯(lián)想到當(dāng)下的機(jī)器(AI)寫作。電影工業(yè)產(chǎn)品從20世紀(jì)80年代的《銀翼殺手》到新世紀(jì)的《攻殼機(jī)動(dòng)隊(duì)》等,對(duì)人工智能的可能疆域作出了許多開拓,而《銀翼殺手》則由賽博朋克風(fēng)格的開創(chuàng)者菲利普·迪克的小說《仿生人會(huì)夢(mèng)見電子羊嗎》改編。人工智能也是當(dāng)下中國(guó)文學(xué)的熱點(diǎn)話題之一,“花城關(guān)注”發(fā)表的年輕作者杜梨和周婉京的小說都探索過這一主題。人工智能不局限在我們現(xiàn)在技術(shù)上已經(jīng)實(shí)現(xiàn)了并還在拓展的增強(qiáng)身體的領(lǐng)域,而是智能人從類人、近人到“人”,乃至超人的成長(zhǎng)。這種生物體和機(jī)器的混合體,“既是社會(huì)現(xiàn)實(shí)的生物,也是虛構(gòu)的生物”(哈拉維),也就是所謂的“賽博格”。在科幻文藝描述的未來世界中,智能人從為人所用到逃逸出人的掌控和奴役,成為自足的“另一種人”。“它們”與人類一起分享、占有和競(jìng)爭(zhēng)生存空間,也實(shí)現(xiàn)著自身的成長(zhǎng)和進(jìn)化。而最令人憂慮的不只是人和“另一種人”之間交往的諸多倫理問題,在對(duì)未來世界的想象中,“另一種人”可能會(huì)反噬,甚至轉(zhuǎn)而奴役人類。

但至少目前的機(jī)器(AI)寫作,無論是“小冰”,還是參與王元的《他殺》的“彩云小夢(mèng)”,還是陳楸帆合作的創(chuàng)新工場(chǎng),最終的成品并不是自足的文學(xué),只是技術(shù)輔助,而且只是初級(jí)的技術(shù)。說到技術(shù),我們當(dāng)然要把技術(shù)的歸到技術(shù)。同時(shí),可以看陳楸帆的實(shí)踐和他是怎么說的。

陳楸帆生于1981年,他出生的第二年,1982年,電影《銀翼殺手》上映。2017年陳楸帆開始嘗試與AI共同寫作,這就是《人生算法》這本關(guān)于人與AI之間共生的六個(gè)故事中的《出神狀態(tài)》。下面是陳楸帆自述機(jī)器寫作的技術(shù):

GPT本質(zhì)是一個(gè)語言模型,如同物理模型是用來理解和描述這個(gè)物理世界的本質(zhì)一樣,語言模型用來理解和描述語言的本質(zhì)是什么。人類有世界觀,也有語言觀,比如說語言是什么,構(gòu)成語言的詞或短語之間的關(guān)系又是什么。

簡(jiǎn)單抽象來說,語言模型主要用來做兩件事:一是對(duì)自然語言做理解,比如給出兩個(gè)句子,語言模型會(huì)判斷哪個(gè)句子更像自然語言、句子里面的詞或短語的依賴關(guān)系是什么;二是對(duì)自然語言做預(yù)測(cè),比如只給出一句話的前幾個(gè)字,來預(yù)測(cè)后面的字是什么。

傳統(tǒng)意義的語言模型主要用在語音識(shí)別、機(jī)器翻譯、OCR(光學(xué)字符識(shí)別,即針對(duì)印刷體字符,采用光學(xué)的方式將其轉(zhuǎn)換為電子文本格式)等序列到序列任務(wù)里,對(duì)目標(biāo)序列做預(yù)測(cè)和判斷。

最常見的兩種用途之一是,機(jī)器會(huì)將一句中文翻譯成不同的英文,語言模型會(huì)對(duì)每句英文翻譯進(jìn)行打分,從而選擇最優(yōu)的翻譯。另一種是,在語音識(shí)別中,僅說到“我們正在聊……”,語言模型就會(huì)預(yù)測(cè)出,你大概率要說的是“我們正在聊天”,即使沒聽到“天”的聲音就能判斷出你將要說什么話,而聽到的聲音則是這個(gè)信號(hào)的加強(qiáng)。

如果把訓(xùn)練一個(gè)模型類比成培養(yǎng)一個(gè)學(xué)生,我們一般遵從一種叫作“先預(yù)訓(xùn)練、后微調(diào)”的教學(xué)方法。具體來說,我們先給機(jī)器很多書本讓他自己讀,這就是所謂的無監(jiān)督預(yù)訓(xùn)練(pre-training);然后給它很多有答案的題目讓它做練習(xí),這就是所謂的有監(jiān)督的微調(diào)(fine-tuning)。經(jīng)歷這個(gè)學(xué)習(xí)過程,模型就訓(xùn)練出來了,接下來就可以對(duì)它進(jìn)行各種考試了,比如說給它一句話,讓它接著寫下一句。

此次與人類配合創(chuàng)作的AI模型來自創(chuàng)新工場(chǎng)DeeCamp 2020人工智能訓(xùn)練營(yíng)中的大學(xué)生創(chuàng)新項(xiàng)目“AI 科幻世界”,它是一個(gè)在一千多塊顯卡上訓(xùn)練出來的超大規(guī)模預(yù)訓(xùn)練模型,用了300GB的中文語料,其參數(shù)規(guī)模與GPT-2 Large相當(dāng),訓(xùn)練完畢后又用了少量故事數(shù)據(jù)做微調(diào)。今年大火的GPT-3上體現(xiàn)出來的一些模型特色,在“AI 科幻世界”上也能有所體現(xiàn),“并且是中文的”。

從操作層面看,人類作家與模型的交互十分簡(jiǎn)單,只需要給定場(chǎng)景與人物關(guān)鍵詞,AI就能自動(dòng)生成幾個(gè)段落供作家們選擇。人類作家可以在其基礎(chǔ)上進(jìn)行修改,而后AI將在經(jīng)過修改的前文的基礎(chǔ)上繼續(xù)進(jìn)行創(chuàng)作,如此往復(fù),完成人類作家和AI的“共同作品”。

今天對(duì)于AI來說,一些簡(jiǎn)單的財(cái)經(jīng)新聞報(bào)告已經(jīng)不是難事,因?yàn)檫@些都是可以結(jié)構(gòu)化處理的語句結(jié)構(gòu)。不過,要涉及文學(xué)創(chuàng)作就是另一回事,如果從創(chuàng)作者的角度理解人工智能創(chuàng)作文本的不同階段,最初的階段是用統(tǒng)計(jì)學(xué)對(duì)語言要素進(jìn)行排列組合,可以創(chuàng)作出簡(jiǎn)單的詩歌;后來進(jìn)階到人工智能在網(wǎng)絡(luò)文本數(shù)據(jù)集里無監(jiān)督地學(xué)習(xí)各種符合人類語法的規(guī)則和客觀知識(shí)、去模擬人類的寫作風(fēng)格;可能更進(jìn)一步的是AI可以從一個(gè)意象、一段話,去生發(fā)出來一個(gè)邏輯自洽、人物關(guān)系清晰、具有典型敘事結(jié)構(gòu)的完整故事。

所以,至少目前機(jī)器(AI)寫作所提供的只是一種技術(shù)路徑和文字組合的片段實(shí)驗(yàn),并沒有實(shí)現(xiàn)真正意義上的機(jī)器制造的文學(xué)。同樣的,王元也持這種觀點(diǎn),關(guān)于《他殺》,7月13日,我和王元在微信上有一個(gè)交流。

何平

王元

何平:?jiǎn)栆粋€(gè)問題,森北和玄理、“我”和婧、光子和“我”,這三個(gè)“小夢(mèng)”完成的場(chǎng)景是如何選擇的?還是先有其他部分,然后讓“小夢(mèng)”完成這一段未完成的部分呢?再有,如果選擇中間某一個(gè)點(diǎn),讓“小夢(mèng)”自由地寫下去,最后邏輯能自洽嗎?(我給王元發(fā)了豆瓣小組討論一篇“彩云小夢(mèng)”完成的小故事,還有一篇關(guān)于“彩云小夢(mèng)”寫作的討論)豆瓣小組的這些故事也是“彩云小夢(mèng)”完成的嗎?

王元:首先是要在那個(gè)“彩云小夢(mèng)”的在線頁面內(nèi)進(jìn)行寫作。我先寫一段,然后隨機(jī)點(diǎn)擊生成,就會(huì)續(xù)寫出幾個(gè)自然段,可以挑選一個(gè)滿意的,都不滿意,可以重新生成。沒有特別讓“彩云小夢(mèng)”去生成哪些內(nèi)容。因?yàn)檫@個(gè)在線續(xù)寫軟件不夠智能,我在文章中也對(duì)生成的文本做了吐槽。

《他殺》里楷體字部分都是生成的,但是經(jīng)過了修改,不然語義有點(diǎn)太不通順,我已經(jīng)盡量保留了行文的原貌,以做區(qū)別。

豆瓣上那些我不太清楚,也沒有做參考,我只是使用了在線生成功能來完成一次人機(jī)交互寫作,對(duì)這個(gè)軟件沒有做太多了解。這個(gè)遠(yuǎn)不如“創(chuàng)新工場(chǎng)”編寫的程序好用,使用感并不好,更適合用來寫網(wǎng)文水字?jǐn)?shù),很難產(chǎn)生真正的互動(dòng)。

我覺得很重要的兩點(diǎn)吧:一是,“彩云小夢(mèng)”不能像“創(chuàng)新工場(chǎng)”的寫作軟件可以錄入作者的文本,讓生成的風(fēng)格貼近作者的敘事語言。二是,生成的本文很多時(shí)候與已有故事情節(jié)特別割裂,所以體驗(yàn)感不是很好。

我覺得人機(jī)交互寫作是一個(gè)非常有趣的嘗試,但要說人工智能取代作者還任重道遠(yuǎn)。人工智能更適合生成新聞通稿和報(bào)告,這些文本的措辭比較雷同,而且,可以完全避免敏感詞。

何平:《他殺》用的是“創(chuàng)新工場(chǎng)”嗎?

王元:《大成若缺》是“創(chuàng)新工場(chǎng)”寫的,《他殺》是“彩云小夢(mèng)”寫的。當(dāng)時(shí)“創(chuàng)新工場(chǎng)”的軟件服務(wù)費(fèi)到期不能用了,我就從網(wǎng)上找免費(fèi)的續(xù)寫軟件。

何平:所以我覺得《他殺》里的“彩云小夢(mèng)”所寫的恰恰證明了“彩云小夢(mèng)”的程式化。

王元:對(duì),玩一玩還行,正經(jīng)要靠這個(gè)寫作不太夠用?;蛘哒f沒有太多驚喜的發(fā)散。楸帆的《大有》的機(jī)器部分,我覺得比《他殺》要復(fù)雜一些。

何平:所以,這種寫作基本上還是嘗試?!端麣ⅰ非∏∽C明目前寫作軟件不可能完成文學(xué)性內(nèi)容。

王元:相比文學(xué)性,我覺得創(chuàng)造性更適合一點(diǎn)。文學(xué)性的界定相對(duì)模糊。創(chuàng)造性就好說了,就是說給我們一個(gè)主題,或者已有的內(nèi)容,機(jī)器能制造出什么?

何平:網(wǎng)文的類型化也許可以適應(yīng)這種寫作軟件。機(jī)器能制造“文學(xué)”嗎?這正是我們要討論的話題。

王元:交互寫作是一個(gè)人機(jī)合作和博弈的過程,得有碰撞才行。兩次寫作感受下來,碰撞都不夠,“彩云小夢(mèng)”比“創(chuàng)新工場(chǎng)”更差一些。對(duì),一個(gè)是網(wǎng)文,一個(gè)是通稿。就是類型化比較明顯和簡(jiǎn)單的文體。這些相對(duì)來說,不用那么多創(chuàng)造性。

至此,我們可以看到當(dāng)下機(jī)器(AI)寫作的大致邊界。介入其中的實(shí)踐者是清醒的,聒噪的往往是旁觀者。對(duì)我個(gè)人而言,也是一次技術(shù)啟蒙。想象這個(gè)專題之初,受前沿學(xué)者和大眾傳媒的蠱惑,我對(duì)機(jī)器寫作(AI)抱有厚望,希望最終的文本不是“小冰”的詩,而是完整的敘事單元,但最終實(shí)踐者陳楸帆和王元所展示的實(shí)踐成果,恰恰證明,到目前為止,基于算法和語料的機(jī)器寫作(AI)并不能獨(dú)立完成“文學(xué)”文本,哪怕是小說中的局部片段也不能完美地嵌入陳楸帆和王元的敘事中。而這種不完美,甚至是失敗,對(duì)比夸大“小冰”詩歌的完美和成功,正是這個(gè)專題的意義所在?!靶”痹姼璧奈膶W(xué)性則是詩歌文體本身曖昧模糊為闡釋者帶來了想象的空間。換句話說,“小冰”詩歌的文學(xué)性并不是“小冰”“寫”出來的,而是闡釋者“說”出來的。如果真要算文學(xué)成就,這個(gè)成就只能記在闡釋者的名下。但這不意味著世界范圍內(nèi)與機(jī)器寫作相關(guān)的“賽博格”的廣泛討論和憂慮沒有意義,相反,初級(jí)的機(jī)器寫作已經(jīng)引發(fā)了我們?nèi)绱硕嗟慕箲]和恐懼,如果科幻文學(xué)所描繪的賽博空間有一天真正兌現(xiàn),人類準(zhǔn)備好了嗎?