用戶登錄投稿

中國作家協(xié)會(huì)主管

“撫育”機(jī)器人的文學(xué)與語言學(xué)
來源:文匯報(bào) | 編譯/黎文  2024年02月25日10:41

計(jì)算機(jī)是怎么學(xué)會(huì)寫作的呢?最近,前微軟工程師、如今在哥倫比亞大學(xué)教授比較文學(xué)的丹尼斯·伊·特南(Dennis Yi Tenen)撰寫了一部“前史”——《機(jī)器人文學(xué)理論》。他想告訴人們,人工智能并不神秘,更不可怕,文學(xué)和計(jì)算機(jī)科學(xué)共享一段過去。如他自己的跨界身份所示:寫作的人和工程師,一直都是同道。

17世紀(jì),德國博學(xué)家基歇爾設(shè)計(jì)過一種數(shù)學(xué)機(jī)器——一個(gè)盒子狀的設(shè)備,內(nèi)有九隔室,每個(gè)隔室里裝著24根以彩色三角形尖端飾尾的小棒:通過操縱木棒,可以進(jìn)行簡(jiǎn)單的算術(shù)、幾何和天文計(jì)算,還可用來寫加密信息、設(shè)計(jì)防御工事。如果設(shè)計(jì)得再精巧一點(diǎn),可以“作曲、寫詩……甚至做高等數(shù)學(xué)”。但同時(shí)代的詩人奎里努斯·庫爾曼認(rèn)為,這部獻(xiàn)給王公的機(jī)器只會(huì)讓人鸚鵡學(xué)舌,無助于出產(chǎn)真知。

文字生成方面的人工智能先驅(qū),還包括通俗小說家威廉·庫克。他的《情節(jié)手冊(cè)》(1928)一書,道出世上的故事不過僅僅1462種情節(jié),最基本的只有7種。他用AB代號(hào)來表示人物,讓這本書看起來簡(jiǎn)直像一部代數(shù)教程。有些情節(jié)實(shí)在是太古怪了。如情節(jié)227:“B無法與A結(jié)婚,因?yàn)樗母赣HF-B在一項(xiàng)科學(xué)實(shí)驗(yàn)中使用B作為實(shí)驗(yàn)對(duì)象,在她的血液中注入毒劑?!钡x奇并不影響這部書的一紙風(fēng)行,據(jù)說希區(qū)柯克也讀過。小說和電影都有公式化的情節(jié)構(gòu)思,這部書能讓人強(qiáng)烈直觀地感受到情節(jié)是如何運(yùn)作,刺激觀者的神經(jīng)。在文學(xué)理論中,類似的拆分組合后來還有一系列更高深的操作——“俄國形式主義”。

回到科學(xué)世界。20世紀(jì)初,俄羅斯數(shù)學(xué)家安德雷·馬爾可夫?qū)ζ障=痖L詩《尤金·奧涅金》中字母序列的概率分析構(gòu)成了生成式人工智能的基本組成部分。到了六十年代,語言學(xué)家喬姆斯基曾試圖教原始計(jì)算機(jī)學(xué)會(huì)英語語法,但沒有成功。然而短短數(shù)十年,計(jì)算機(jī)學(xué)習(xí)模型突飛猛進(jìn)。工業(yè)時(shí)代,自動(dòng)化替代的是鞋匠和裁縫的勞作,今天這個(gè)命運(yùn)已然落到了作家、醫(yī)生、律師、程序員等等“腦力勞動(dòng)者”的頭上。不過,特南認(rèn)為,這些工種固然被顛覆,但也把這些勞動(dòng)者們從重復(fù)的事實(shí)中“解放”出來,可以“用更具創(chuàng)造性的任務(wù)挑戰(zhàn)自己”——無論如何,不能放棄對(duì)創(chuàng)作過程的掌控。

“我們說機(jī)器思考、說話、解釋、理解、寫作、感覺等等,都只是類比?!碧啬险f,所有這些描述人類行為的詞,用到機(jī)器身上的時(shí)候都應(yīng)該打個(gè)引號(hào)。也因此,他的書多圍繞語言問題展開。是語言讓我們能夠相互交流和理解,但它也會(huì)造成誤解和欺騙。還有一個(gè)問題,是“程序生成的文本可以合乎語法,但可能并不總是合乎邏輯”。拿喬姆斯基著名的例子來說:“無色的綠色思想瘋狂地沉睡?!比魏卧诂F(xiàn)實(shí)世界生活過的人都知道,這個(gè)語法上完美無缺的句子是無稽之談。特南一直強(qiáng)調(diào)“生活經(jīng)驗(yàn)”的重要性,只有生活經(jīng)驗(yàn)才能描述我們的境況,而它也只存在于人類尺度,是人類創(chuàng)造性的源泉,也是抵御所有技術(shù)風(fēng)浪的壓艙石。

另外重要的就是邏輯。如計(jì)算機(jī)科學(xué)家斯蒂芬·沃爾弗拉姆在《這就是ChatGPT》中所說,雖然GPT會(huì)生成諸如“好奇的電子為了魚吃藍(lán)色的理論”這樣毫無意義的句子,但是隨著數(shù)十億個(gè)有意義的句子對(duì)GPT的訓(xùn)練,它會(huì)發(fā)展出邏輯——他開玩笑說也就是亞里士多德“機(jī)器學(xué)習(xí)式”地研究大量修辭學(xué)例子發(fā)現(xiàn)的三段論邏輯——從而產(chǎn)生包含“正確推理”的文本。在這里,大規(guī)模也是一大要素。擁有1750億個(gè)神經(jīng)網(wǎng)絡(luò),可能已經(jīng)接近人腦的思維方式了。今天的科學(xué)家也不知道為什么這樣可行,就像我們至今也沒法徹底明白人腦如何運(yùn)作一樣?!暗俏覐?qiáng)烈懷疑有一個(gè)更簡(jiǎn)單、更有力的故事?!蔽譅柛ダ氛f,“像數(shù)學(xué)物理一樣簡(jiǎn)單”。他認(rèn)為Chat-GPT的成功很可能暗示了一個(gè)重要的“科學(xué)”事實(shí):“有意義的人類語言實(shí)際上比我們所知道的更加結(jié)構(gòu)化、更加簡(jiǎn)單,最終可能以相當(dāng)簡(jiǎn)單的規(guī)則來描述如何組織這樣的語言”。