本帖最后由 蓬草 于 2024-9-25 04:36 编辑
ChatGPT的《秋夜听雨》
蓬草 2023年2月16日
大型人工智能聊天系统ChatGPT问世以来,很快就突破一亿个用户。它的出现是人工智能从专家转向通才所迈出的重要一步。它能聊天,谈论各种话题,从各科知识到生活琐事。从生成各种文章到诗歌创作。近日我给它出了《秋夜听雨》这个题目,请它作一首五言诗。它用了约30秒,写出了下面这首诗。
秋夜听雨 秋夜清风冷,细雨如诉衷。 露湿衣裳中,身与心交通。 忆往昔共此,不觉已成空。 窗外明月照,池塘波光红。 夜听雨声深,思绪随流浓。 (2023年2月12日)
让ChatGPT作五言诗极其困难,在绝大多数情况下,它写的是七言诗,有时是四言诗,六言诗,甚至是长短句和类似三字经之类的东西。它染上这个“恶习”,屡教不改。有一次,我曾经反复“教导”,让它写五言诗。它交出了十二份的作业,都是七言诗。 这首诗是个例外,一次就写成了(现在ChatGPT写五言诗已经不是难事,见后记)。点评这首诗,目的不在于欣赏,而是借题发挥,试图从不同角度做些理性分析。虽然这里的分析是以人工智能的诗作为实验麻雀,但是其中某些讨论也适用于人类作诗。当然,先从欣赏者的角度点评一下也是必要的。
见过ChatGPT写的百十首五言诗和七言诗之后,我认为这首诗写得最好。但是它也有瑕疵,就是在第四联。首先是描写不合理。“窗外明月照”,单拿出来不是问题。但是诗的上下文写的都是下雨,连绵不断,中间却冒出明月,甚显突兀。ChatGPT不是人,它可以做词汇的联想,却不会在词和雨天的经历之间形成联想。“池塘波光红”也不符合生活经验,池塘在明月之下是不可能呈现“波光红”的。其次是这一联和其它各联不相契合,打断了诗意,破坏了整首诗在头脑中引起的意境。其三是这一联写景而不显情思。因为和上下问不相契合,这一联即便引起一点有情感色彩的联想也是孤立单薄的。总之,将其舍去后更好。这个版本的语言还有些生涩,但大致的意思是通了。
秋夜清风冷,细雨如诉衷。 露湿衣裳中,身与心交通。 忆往昔共此,不觉已成空。 夜听雨声深,思绪随流浓。
试着将其翻译如下: 秋来夜深风冷,细雨慢诉衷肠。 露水沾衣肌骨凉,身心一般模样。 忆昔斯人难忘,未觉已成空想。 雨打屋檐水如注,幽思不绝流淌。 (这个翻译的字数与《西江月》相同,但不依词律。本文也意不在此。)
这首诗虽然有些瑕疵,但若把它混入我们人类的诗作中恐怕也难分辨其来历。我们知道,在目前阶段,ChatGPT和其它人工智能系统还不具备情感和自我意识。但是这首诗却带有情感色彩,表现出清冷、孤独和思念,读后似乎还有点儿余味。问题是它怎么能做到这一点?恐怕没有人能够完全理解ChatGPT是怎么产生这首诗的。不过心理学和神经科学还是能够给我们提供一些线索。下面的论述是借题发挥,表达的是我对于神经网络何以能够产生创作性精神活动的思索和猜测。
联想的几种方式
首先,我们可以从联想着手去理解精神活动。亚里士多德认为,人类的记忆是靠联想而存储的。他在《记忆与回忆》(DeMemoria et Reminiscentia)一书中提出了三种联想方式的思想,近代的心理学家将其扩展为联想律:接近联想,相似联想和对比联想。
接近联想是指两件事物在时空上接近,由此可以就产生由此及彼的联想。我们生活中形成的条件反射反射就属于接近联想,这是属于两个事件之间的联想。联想的范围远超于此,不仅限于两件事物之间。我们吃辣椒,感觉到辣,形成了辣椒形象和主管感觉之间的联想。在成长过程中,别人和我一起吃辣椒,又大喊“辣”,于是我就学会了“辣”这个词,并把它和辣椒的形象、辣得火烧火燎的感觉联系起来。我还可能形成关于和谁一起吃辣椒,在哪里吃辣椒,什么时候吃辣椒的联想。这就是情景记忆。情景记忆使我们的个体生活有了独特的历史,是之所以是我而不是他人的重要方面。辣不仅来自辣椒,而且来自葱和蒜。因此辣字也可以和葱和蒜形成类似的联想。由此形成一个关于“辣”字的联想网络。提到辣,我们就可以联想到葱姜蒜和许多有关的事件和情景。由于在烹饪中,葱姜蒜常常同时应用,这三个词极其相关的气味、感觉和情景之间也会形成联想。提到葱姜蒜之一,我们都会联想到其它二物和辣。依据情景的不同,我们可以优先激活某些联想。提到川菜的辣,我们会联想到辣椒;说起“辣心”,我们会联想到大蒜;提及辣得流眼泪,我们会联想到切大葱或洋葱时的记忆。
相似联想是两种事物在某些方面相似,就会形成联想。例如见到流畅的舞蹈动作我们会联想到行云流水,见到牛的舐犊之情,我们会联想到人间的母爱。相似联想是类比推理的基础,也是明喻、暗喻和借喻的基础。这种联想已经渗透入我们的语言,以至于没有类比,我们几乎无法说话。在日常语言中我们会说山头、山腰和山脚。应用到几何学,我们说等腰三角形。在英文里等腰三角形叫做isoscelestriangle。其中isosceles来自希腊语的两个词根:isos意为相等,skelos意为腿。类似联想并不仅限于词汇之间,而是以感觉经验为基础。绘图时,我们通常会把三角形画成如山而立或如人而立。否侧三角形就看起来不顺眼,感觉不舒服。山的稳固和人的挺拔,是人对力学经验的感知,也影响到我们的审美感受。
对比联想是因事物反差明显而形成的联想。高矮、胖瘦、寒暑、前后、左右、缓急,等等。胖人穿瘦衣,因其反差明显,故而引人注目,容易产生联想。从反差中认识事物其实是一种基本的和普遍的认知功能,例如我们读书,白纸黑字,对比鲜明在易于辨认。光洁的脸上长一颗痣,会给人留下深刻印象。对比联想已经深入到我们的语言艺术之中,清代的李渔在《笠翁对韵》,汇集了许多对比联想。其开始的一段是: 天对地,雨对风。大陆对长空。山花对海树,赤日对苍穹。雷隐隐,雾蒙蒙。日下对天中。风高秋月白,雨霁晚霞红。牛女二星河左右,参商两曜斗西东。十月塞边,飒飒寒霜惊戍旅;三冬江上,漫漫朔雪冷鱼翁。 作者对现实生活中各种现象进行了丰富的联想和诗意的表达。
值得一提的是,以上各种联想都不仅限于语言,而是包含各种感觉、情感和运动等因素。它们时常和词形成联想,有时又不依赖于词。词和词之间的联想不能完全代表丰富的精神活动。
《秋夜听雨》带来的联想
这首诗的题目是《秋夜听雨》。在我们的记忆系统里,秋往往是和黄色、丰收、落叶、枯草、霜、露和清冷等感觉和词汇有不同程度的联结;夜与黑暗、月亮、星星、孤寂、露水和清冷等感觉和词汇相联结;雨和云、雾、水流、水滴、声音、潮湿、凉等感觉和词汇相联结;听和各种声音相联结。“秋夜听雨”四个字可以激活我们的词语网络,由此产生联想,激活更多的相关词汇及其有关的各种感觉和以往的经验,形成各种意向组成的意境空间。
随着注意力的集中和分散,专注和转移,不断产生新的联想,我们的精神活动也在流动。它有跌宕起伏和千回百转,也有分流和汇聚。例如,由暗夜而寂静,由寂静而孤单,由孤单而思旧,由相思而相思不得。由细雨之声而私语之声,由低声私语而倾诉衷肠,由倾诉衷肠而思念远人。独对秋夜凉、秋风寒、露水湿,而联想到身心俱寒而孤单。数条条线索汇集一处,便成思绪的主流,秋雨不绝于耳,思绪不绝于心。秋夜听雨,这四个字本来的信息有限,可是通过联想我们能够构建出完整的意境。
诗人作诗会利用各种自由想象拓宽思路,也会主动控制注意力寻求突破口,思潮起伏,最后冲出堰塞之湖,奔腾而出。在这个过程中,除了语言本身,还有许多难以言说的方面,例如各种生理的改变,感官的输入,情绪的波动等等,都会影响诗的意境、感情色彩,诗意的流动和语言的选择。这其中每一个细节都有一群或者多群神经元随时处理和整合输入和输出信息,这些神经元组成复杂的神经网络。各种信息就在这些网络中流动徘徊,起伏跌宕,分散合流。
人工智能网络的联想
与人类不同,人工智能作诗只能依赖语言形成的网络。这种语言网络是由人工的类似神经元的单位组成,通过学习训练彼此间形成强度不等的联结。假如夜间和寂静分别由两组神经元代表,反复同时输入夜间和黑暗的信息,激活这两群神经元,它们之间的联结强度就会增加。以后单独输入夜间就会通过激活代表夜间的神经元而激活代表黑暗的神经元;反之亦然。
同时代表各种物象的神经元也可以和代表情感色彩的词或代表一定意义的词发生联结。例如干枯的落叶和生命的凋敝及心境的凄凉联系在一起,青绿的枝芽和生机的勃发及心情的愉悦联系在一起。ChatGPT本身没有情感,它体会不到秋夜的凄冷和听雨的孤独。但是由于这些相关的词汇是人创造的,带有情感的色彩。
通过以上得联想激活过程,简单的物象就成了有情有意的意象。由于这种联系,“秋夜听雨”四个字输入ChatGPT之后,它们就会激活许多代表它们物象的神经元,进一步又激活更多的代表物象、意义和情感的神经元。当ChatGPT将由此组织好的语言呈现出来的时候,这些语言文字就形成一个完整的意境。这种意境可能是新的与外部世界不同的境界,它在我们眼中看来也可以带有主观意义和情感的色彩。由此无意义的东西看起来有意义,无情之物看起来似乎是有情之物。
在与ChatGPT对话中了解到,每一个人词在它的系统中都由一个高维向量来描述。这个高维向量可以达到数百个。每一个维度代表这个词的某方面特征:词性、词性的多重性、词根、词的转义、词义、多义性、词义的清晰程度、在短语和句子中的应用规则、性感色彩、情感的正负值,情感的主动和被动性、如此等等。
一个词在高维空间和低维空间中代表的意义不同,正如一个点在高维空间代表的意义不同。在0-维空间,点几乎没有意义;在1-维空间,点是数轴上的某个位置;在2-维空间,点是平面上的位置,可以表示某个地址;在3-维空间,点代表某个空间中的位置,如太阳系在银河系的位置;在4-维时空中,一个点就可能代表某物在某个时刻所处的位置。维度越高,意义也就越丰富。语言也是如此。正如黑格尔所说,同一句格言从儿童和来人口里说出来具有不同的意义。
线性代数是研究高维向量的数学工具。不同词之间的相似和接近程度可以依据余弦相似度来计算。相似度在[-1,1]的区间。词和词之间的相似度代表了彼此的连接强度,是联想网络的基础。心理学所描述的三种联想(相似联想、接近联想和对比联想)强度都可以通过词的余弦相似度加以计算。
以大语言模型为镜,反观人类的思维,也有启发。我们在意识中能够对一个词作500个维度的计算吗?看起来,ChatGPT对词的理解似乎比单个人对词的有意识理解还要深入和广泛。我们的大脑在实际工作时,也会进行类似的高维向量运算,不过大部分运算都是在模糊的感觉之中,甚至完全没有进入意识领域。实际上,大脑中一个神经元可以接受几千几万个神经元的输入,每个输入都是通过相应的突触而实现。一个输入模式(激活不同的突触前神经元)与突触的连接模式(所有突触的连接)的匹配程度就是两者之间的余弦相似度。相似度越高,突触后神经元被激活的程度就越高。这样看来,我们的大脑每日每时都在不知不觉中作高维向量的运算。
后记
这篇文章是一年多以前写的。现在ChatGPT写五言诗不那么困难了,写得也比较合乎情理。今天请ChatGPT以《秋夜听雨》为题,写一首五言诗,要加入清冷和思念的元素。它用了大约五秒钟写成了,这是它的回答:
《秋夜听雨》 凉风穿旧幕,细雨洒寒窗。 云暗月犹隐,孤灯伴影长。 叶落心中事,声声入梦乡。 清秋思万里,此夜意彷徨。
这首诗通过清冷的秋雨夜景,表现出一种孤寂和思念的情感。希望能传达出你想要的意境!
这首诗有些类似折腰体的律诗,颔联和颈联没有相粘,中间两联也没有对仗。前半意象密,写出了清冷和孤寂,重赋。后半更注重抒情,重比兴。这首诗写得相当自然,句式灵活。丝丝入扣,意脉贯通。与将近一年半前相比,ChatGPT的诗的确有了明显的进步。
蓬草 2024年9月24日
|