无码孕妇一区二区三区,国产精品后入,一级操逼大片

何平：機(jī)器制造文學(xué)？ ——關(guān)于當(dāng)下AI寫作的技術(shù)問題

來源：《花城》　|　何平　　2021年09月15日08:40

原標(biāo)題：目前的機(jī)器寫作，不是文學(xué)，更不能取代作家創(chuàng)作

人工智能技術(shù)會(huì)不會(huì)代替獨(dú)立的人，來完成文學(xué)寫作？在本期“花城關(guān)注”中，作家陳楸帆、王元分別與AI寫作軟件“創(chuàng)新工場(chǎng)”“彩云小夢(mèng)”合作完成小說的寫作。他們的實(shí)踐恰恰證明，AI寫作目前還停留在簡(jiǎn)單模仿的層面。人類靈魂的深度，尚不是當(dāng)前的機(jī)器算法所能測(cè)量。本文系專題引文。

——編者

這一期的兩篇小說是人和機(jī)器共同完成的，雖然最后署的是人名，但我們以楷體字標(biāo)志出機(jī)器完成的部分。和陳楸帆合作的是創(chuàng)新工場(chǎng)的“AI科幻世界”。這款產(chǎn)品可學(xué)習(xí)和模仿陳楸帆的小說句法和行文風(fēng)格。而與王元合作的則是網(wǎng)絡(luò)上很多人都用的寫作軟件“彩云小夢(mèng)”。該軟件不是專門為特定寫作者定制的，是一款公共的AI寫作產(chǎn)品。機(jī)器（AI）參與到需要人類高級(jí)思維和想象能力才能完成的文學(xué)、藝術(shù)及其他活動(dòng)在當(dāng)下不斷成為大眾傳媒的話題，像會(huì)唱歌的“洛天依”、會(huì)寫詩的“小冰”、會(huì)下棋的機(jī)器人等。一些對(duì)風(fēng)潮敏感的研究者將這些目前只是依靠大數(shù)據(jù)、算法等計(jì)算機(jī)技術(shù)的初級(jí)文學(xué)藝術(shù)行為徑直解讀為機(jī)器（AI）寫作正在取代人類文學(xué)。而事實(shí)上卻不是如此。以“小冰”寫詩為例，與文學(xué)界的熱捧不同，“小冰”的開發(fā)者，微軟（亞洲）互聯(lián)網(wǎng)工程院小冰團(tuán)隊(duì)首席科學(xué)家宋睿華在2018年10月26日的CNCC技術(shù)論壇之“自然語言生成：讓機(jī)器掌握文字創(chuàng)作的本領(lǐng)”的演講中就明確表示，機(jī)器并不會(huì)取代人類寫詩。他在演講的最后以他上幼兒園的女兒的一首即興的小詩為例，認(rèn)為：“人類在作詩的時(shí)候是非常奇妙的，是AI所不能企及的，因此我們的空間還很大。”我理解宋睿華所說的“我們的空間還很大”應(yīng)該是兩個(gè)方面的：一方面是人類的寫作及其他審美藝術(shù)的潛力；另一個(gè)方面，則是機(jī)器（AI）介入審美藝術(shù)等領(lǐng)域的前景，這兩個(gè)方面都有著遼闊的空間。

普通人對(duì)AI的好奇，乃至焦慮和恐懼，和科技進(jìn)步，和人文社科研究者、大眾傳媒的宣傳有著密切關(guān)系；另外一股力量可能來自科幻文藝對(duì)未來世界的想象。這種想象典型地體現(xiàn)在宇宙旅行和人工智能上。其中，人工智能很容易讓人聯(lián)想到當(dāng)下的機(jī)器（AI）寫作。電影工業(yè)產(chǎn)品從20世紀(jì)80年代的《銀翼殺手》到新世紀(jì)的《攻殼機(jī)動(dòng)隊(duì)》等，對(duì)人工智能的可能疆域作出了許多開拓，而《銀翼殺手》則由賽博朋克風(fēng)格的開創(chuàng)者菲利普·迪克的小說《仿生人會(huì)夢(mèng)見電子羊嗎》改編。人工智能也是當(dāng)下中國(guó)文學(xué)的熱點(diǎn)話題之一，“花城關(guān)注”發(fā)表的年輕作者杜梨和周婉京的小說都探索過這一主題。人工智能不局限在我們現(xiàn)在技術(shù)上已經(jīng)實(shí)現(xiàn)了并還在拓展的增強(qiáng)身體的領(lǐng)域，而是智能人從類人、近人到“人”，乃至超人的成長(zhǎng)。這種生物體和機(jī)器的混合體，“既是社會(huì)現(xiàn)實(shí)的生物，也是虛構(gòu)的生物”（哈拉維），也就是所謂的“賽博格”。在科幻文藝描述的未來世界中，智能人從為人所用到逃逸出人的掌控和奴役，成為自足的“另一種人”。“它們”與人類一起分享、占有和競(jìng)爭(zhēng)生存空間，也實(shí)現(xiàn)著自身的成長(zhǎng)和進(jìn)化。而最令人憂慮的不只是人和“另一種人”之間交往的諸多倫理問題，在對(duì)未來世界的想象中，“另一種人”可能會(huì)反噬，甚至轉(zhuǎn)而奴役人類。

但至少目前的機(jī)器(AI)寫作，無論是“小冰”，還是參與王元的《他殺》的“彩云小夢(mèng)”，還是陳楸帆合作的創(chuàng)新工場(chǎng)，最終的成品并不是自足的文學(xué)，只是技術(shù)輔助，而且只是初級(jí)的技術(shù)。說到技術(shù)，我們當(dāng)然要把技術(shù)的歸到技術(shù)。同時(shí)，可以看陳楸帆的實(shí)踐和他是怎么說的。

陳楸帆生于1981年，他出生的第二年，1982年，電影《銀翼殺手》上映。2017年陳楸帆開始嘗試與AI共同寫作，這就是《人生算法》這本關(guān)于人與AI之間共生的六個(gè)故事中的《出神狀態(tài)》。下面是陳楸帆自述機(jī)器寫作的技術(shù)：

GPT本質(zhì)是一個(gè)語言模型，如同物理模型是用來理解和描述這個(gè)物理世界的本質(zhì)一樣，語言模型用來理解和描述語言的本質(zhì)是什么。人類有世界觀，也有語言觀，比如說語言是什么，構(gòu)成語言的詞或短語之間的關(guān)系又是什么。

簡(jiǎn)單抽象來說，語言模型主要用來做兩件事：一是對(duì)自然語言做理解，比如給出兩個(gè)句子，語言模型會(huì)判斷哪個(gè)句子更像自然語言、句子里面的詞或短語的依賴關(guān)系是什么；二是對(duì)自然語言做預(yù)測(cè)，比如只給出一句話的前幾個(gè)字，來預(yù)測(cè)后面的字是什么。

傳統(tǒng)意義的語言模型主要用在語音識(shí)別、機(jī)器翻譯、OCR（光學(xué)字符識(shí)別，即針對(duì)印刷體字符，采用光學(xué)的方式將其轉(zhuǎn)換為電子文本格式）等序列到序列任務(wù)里，對(duì)目標(biāo)序列做預(yù)測(cè)和判斷。

最常見的兩種用途之一是，機(jī)器會(huì)將一句中文翻譯成不同的英文，語言模型會(huì)對(duì)每句英文翻譯進(jìn)行打分，從而選擇最優(yōu)的翻譯。另一種是，在語音識(shí)別中，僅說到“我們正在聊……”，語言模型就會(huì)預(yù)測(cè)出，你大概率要說的是“我們正在聊天”，即使沒聽到“天”的聲音就能判斷出你將要說什么話，而聽到的聲音則是這個(gè)信號(hào)的加強(qiáng)。

如果把訓(xùn)練一個(gè)模型類比成培養(yǎng)一個(gè)學(xué)生，我們一般遵從一種叫作“先預(yù)訓(xùn)練、后微調(diào)”的教學(xué)方法。具體來說，我們先給機(jī)器很多書本讓他自己讀，這就是所謂的無監(jiān)督預(yù)訓(xùn)練（pre-training）；然后給它很多有答案的題目讓它做練習(xí)，這就是所謂的有監(jiān)督的微調(diào)（fine-tuning）。經(jīng)歷這個(gè)學(xué)習(xí)過程，模型就訓(xùn)練出來了，接下來就可以對(duì)它進(jìn)行各種考試了，比如說給它一句話，讓它接著寫下一句。

此次與人類配合創(chuàng)作的AI模型來自創(chuàng)新工場(chǎng)DeeCamp 2020人工智能訓(xùn)練營(yíng)中的大學(xué)生創(chuàng)新項(xiàng)目“AI 科幻世界”，它是一個(gè)在一千多塊顯卡上訓(xùn)練出來的超大規(guī)模預(yù)訓(xùn)練模型，用了300GB的中文語料，其參數(shù)規(guī)模與GPT-2 Large相當(dāng)，訓(xùn)練完畢后又用了少量故事數(shù)據(jù)做微調(diào)。今年大火的GPT-3上體現(xiàn)出來的一些模型特色，在“AI 科幻世界”上也能有所體現(xiàn)，“并且是中文的”。

從操作層面看，人類作家與模型的交互十分簡(jiǎn)單，只需要給定場(chǎng)景與人物關(guān)鍵詞，AI就能自動(dòng)生成幾個(gè)段落供作家們選擇。人類作家可以在其基礎(chǔ)上進(jìn)行修改，而后AI將在經(jīng)過修改的前文的基礎(chǔ)上繼續(xù)進(jìn)行創(chuàng)作，如此往復(fù)，完成人類作家和AI的“共同作品”。

今天對(duì)于AI來說，一些簡(jiǎn)單的財(cái)經(jīng)新聞報(bào)告已經(jīng)不是難事，因?yàn)檫@些都是可以結(jié)構(gòu)化處理的語句結(jié)構(gòu)。不過，要涉及文學(xué)創(chuàng)作就是另一回事，如果從創(chuàng)作者的角度理解人工智能創(chuàng)作文本的不同階段，最初的階段是用統(tǒng)計(jì)學(xué)對(duì)語言要素進(jìn)行排列組合，可以創(chuàng)作出簡(jiǎn)單的詩歌；后來進(jìn)階到人工智能在網(wǎng)絡(luò)文本數(shù)據(jù)集里無監(jiān)督地學(xué)習(xí)各種符合人類語法的規(guī)則和客觀知識(shí)、去模擬人類的寫作風(fēng)格；可能更進(jìn)一步的是AI可以從一個(gè)意象、一段話，去生發(fā)出來一個(gè)邏輯自洽、人物關(guān)系清晰、具有典型敘事結(jié)構(gòu)的完整故事。

所以，至少目前機(jī)器（AI）寫作所提供的只是一種技術(shù)路徑和文字組合的片段實(shí)驗(yàn)，并沒有實(shí)現(xiàn)真正意義上的機(jī)器制造的文學(xué)。同樣的，王元也持這種觀點(diǎn)，關(guān)于《他殺》，7月13日，我和王元在微信上有一個(gè)交流。

何平

王元

何平：?jiǎn)栆粋€(gè)問題，森北和玄理、“我”和婧、光子和“我”，這三個(gè)“小夢(mèng)”完成的場(chǎng)景是如何選擇的？還是先有其他部分，然后讓“小夢(mèng)”完成這一段未完成的部分呢？再有，如果選擇中間某一個(gè)點(diǎn)，讓“小夢(mèng)”自由地寫下去，最后邏輯能自洽嗎？（我給王元發(fā)了豆瓣小組討論一篇“彩云小夢(mèng)”完成的小故事，還有一篇關(guān)于“彩云小夢(mèng)”寫作的討論）豆瓣小組的這些故事也是“彩云小夢(mèng)”完成的嗎？

王元：首先是要在那個(gè)“彩云小夢(mèng)”的在線頁面內(nèi)進(jìn)行寫作。我先寫一段，然后隨機(jī)點(diǎn)擊生成，就會(huì)續(xù)寫出幾個(gè)自然段，可以挑選一個(gè)滿意的，都不滿意，可以重新生成。沒有特別讓“彩云小夢(mèng)”去生成哪些內(nèi)容。因?yàn)檫@個(gè)在線續(xù)寫軟件不夠智能，我在文章中也對(duì)生成的文本做了吐槽。

《他殺》里楷體字部分都是生成的，但是經(jīng)過了修改，不然語義有點(diǎn)太不通順，我已經(jīng)盡量保留了行文的原貌，以做區(qū)別。

豆瓣上那些我不太清楚，也沒有做參考，我只是使用了在線生成功能來完成一次人機(jī)交互寫作，對(duì)這個(gè)軟件沒有做太多了解。這個(gè)遠(yuǎn)不如“創(chuàng)新工場(chǎng)”編寫的程序好用，使用感并不好，更適合用來寫網(wǎng)文水字?jǐn)?shù)，很難產(chǎn)生真正的互動(dòng)。

我覺得很重要的兩點(diǎn)吧：一是，“彩云小夢(mèng)”不能像“創(chuàng)新工場(chǎng)”的寫作軟件可以錄入作者的文本，讓生成的風(fēng)格貼近作者的敘事語言。二是，生成的本文很多時(shí)候與已有故事情節(jié)特別割裂，所以體驗(yàn)感不是很好。

我覺得人機(jī)交互寫作是一個(gè)非常有趣的嘗試，但要說人工智能取代作者還任重道遠(yuǎn)。人工智能更適合生成新聞通稿和報(bào)告，這些文本的措辭比較雷同，而且，可以完全避免敏感詞。

何平：《他殺》用的是“創(chuàng)新工場(chǎng)”嗎？

王元：《大成若缺》是“創(chuàng)新工場(chǎng)”寫的，《他殺》是“彩云小夢(mèng)”寫的。當(dāng)時(shí)“創(chuàng)新工場(chǎng)”的軟件服務(wù)費(fèi)到期不能用了，我就從網(wǎng)上找免費(fèi)的續(xù)寫軟件。

何平：所以我覺得《他殺》里的“彩云小夢(mèng)”所寫的恰恰證明了“彩云小夢(mèng)”的程式化。

王元：對(duì)，玩一玩還行，正經(jīng)要靠這個(gè)寫作不太夠用?；蛘哒f沒有太多驚喜的發(fā)散。楸帆的《大有》的機(jī)器部分，我覺得比《他殺》要復(fù)雜一些。

何平：所以，這種寫作基本上還是嘗試?！端麣ⅰ非∏∽C明目前寫作軟件不可能完成文學(xué)性內(nèi)容。

王元：相比文學(xué)性，我覺得創(chuàng)造性更適合一點(diǎn)。文學(xué)性的界定相對(duì)模糊。創(chuàng)造性就好說了，就是說給我們一個(gè)主題，或者已有的內(nèi)容，機(jī)器能制造出什么？

何平：網(wǎng)文的類型化也許可以適應(yīng)這種寫作軟件。機(jī)器能制造“文學(xué)”嗎？這正是我們要討論的話題。

王元：交互寫作是一個(gè)人機(jī)合作和博弈的過程，得有碰撞才行。兩次寫作感受下來，碰撞都不夠，“彩云小夢(mèng)”比“創(chuàng)新工場(chǎng)”更差一些。對(duì)，一個(gè)是網(wǎng)文，一個(gè)是通稿。就是類型化比較明顯和簡(jiǎn)單的文體。這些相對(duì)來說，不用那么多創(chuàng)造性。

至此，我們可以看到當(dāng)下機(jī)器（AI）寫作的大致邊界。介入其中的實(shí)踐者是清醒的，聒噪的往往是旁觀者。對(duì)我個(gè)人而言，也是一次技術(shù)啟蒙。想象這個(gè)專題之初，受前沿學(xué)者和大眾傳媒的蠱惑，我對(duì)機(jī)器寫作（AI）抱有厚望，希望最終的文本不是“小冰”的詩，而是完整的敘事單元，但最終實(shí)踐者陳楸帆和王元所展示的實(shí)踐成果，恰恰證明，到目前為止，基于算法和語料的機(jī)器寫作（AI）并不能獨(dú)立完成“文學(xué)”文本，哪怕是小說中的局部片段也不能完美地嵌入陳楸帆和王元的敘事中。而這種不完美，甚至是失敗，對(duì)比夸大“小冰”詩歌的完美和成功，正是這個(gè)專題的意義所在?！靶”痹姼璧奈膶W(xué)性則是詩歌文體本身曖昧模糊為闡釋者帶來了想象的空間。換句話說，“小冰”詩歌的文學(xué)性并不是“小冰”“寫”出來的，而是闡釋者“說”出來的。如果真要算文學(xué)成就，這個(gè)成就只能記在闡釋者的名下。但這不意味著世界范圍內(nèi)與機(jī)器寫作相關(guān)的“賽博格”的廣泛討論和憂慮沒有意義，相反，初級(jí)的機(jī)器寫作已經(jīng)引發(fā)了我們?nèi)绱硕嗟慕箲]和恐懼，如果科幻文學(xué)所描繪的賽博空間有一天真正兌現(xiàn)，人類準(zhǔn)備好了嗎？

何平：機(jī)器制造文學(xué)？ ——關(guān)于當(dāng)下AI寫作的技術(shù)問題

何平：機(jī)器制造文學(xué)？ ——關(guān)于當(dāng)下AI寫作的技術(shù)問題