詩(shī)人作品中提到“酒”
一半是在追思,三成是開(kāi)心
團(tuán)隊(duì)不僅分析了《全宋詞》文本表面的信息,還深入挖掘宋詞所表達(dá)的意象含義,整合成意象情緒圖。
意象情緒圖選取了30個(gè)像“月”“酒”等常見(jiàn)的字詞,以蘇軾、李清照等24位高產(chǎn)詞人作為代表。通過(guò)大數(shù)據(jù)分析,得出這些意象詞匯所表示的情緒,并將情緒分為五種——“喜怒哀樂(lè)思”,然后用餅狀圖表現(xiàn)出各種字詞所表示的不同情緒的比例。
比如詩(shī)人在寫“酒”時(shí),近半數(shù)想要表現(xiàn)的意象是懷念和思考。陸游寫“紅酥手,黃滕酒”,或者晏殊寫“一曲新詞酒一杯,去年天氣舊亭臺(tái)”,都是在追憶故人以及對(duì)人生的思考。還有近三成,是類似朱敦儒筆下“日日深杯酒滿,朝朝小圃花開(kāi)”的開(kāi)懷一笑。
那么,大數(shù)據(jù)技術(shù)是如何從宋詞的字里行間體察到詞人當(dāng)時(shí)的情緒呢?
首先,團(tuán)隊(duì)需要將基本只表示某種特定情緒的典型意象整理出來(lái)。張瑋說(shuō),為了更精確,團(tuán)隊(duì)還專門請(qǐng)來(lái)浙大文學(xué)院博士胡秋研進(jìn)行了核對(duì)。
負(fù)責(zé)數(shù)據(jù)分析和前端開(kāi)發(fā)的潘如晟告訴記者,他們會(huì)用大數(shù)據(jù)分析上下文,根據(jù)典型意象去計(jì)算該字詞屬于某一情緒的概率,得出詩(shī)人最有可能想要表達(dá)的情感。
簡(jiǎn)單來(lái)說(shuō),比如詩(shī)人張?jiān)诘摹额}興龍寺老柏院》中寫到:“南鄰北舍牡丹開(kāi),年少尋芳日幾回。惟有君家老柏樹(shù),春風(fēng)來(lái)似不曾來(lái)。”其中,“松柏”表達(dá)的就是一種“追思”的情緒。再聯(lián)系上下文,可以得出“牡丹”和“春風(fēng)”想要傳達(dá)的也是“思”。
通過(guò)可視化的數(shù)據(jù)呈現(xiàn)
讓唐詩(shī)宋詞真正通俗易懂
當(dāng)問(wèn)及這項(xiàng)研究的難點(diǎn)所在,張瑋首先提到的是圖表的選擇。為了找到最合適的數(shù)據(jù)呈現(xiàn)方式,許多圖表都是幾易其稿。
合適的圖表,既要美觀,又要能涵蓋所需要呈現(xiàn)的信息,同時(shí)還要表現(xiàn)得直觀,還要與讀者進(jìn)行比較順暢的互動(dòng),這著實(shí)讓團(tuán)隊(duì)費(fèi)了不少工夫。據(jù)張瑋介紹,團(tuán)隊(duì)曾嘗試用“小山峰”視圖去表現(xiàn)詞的抑揚(yáng)頓挫,但考慮到圖像重疊影響觀感,又不利于擺放意象圖像,最后只能作罷。
“人是視覺(jué)性的,可視化形式的科普手段,可以把晦澀的古詩(shī)詞變得通俗易懂,讓科普擺脫說(shuō)教或者沉悶的刻板印象,從而起到推廣傳統(tǒng)文化的作用。”浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院副院長(zhǎng)陳為說(shuō)。
這項(xiàng)研究定位是科普,因此選擇分析的對(duì)象也以唐詩(shī)宋詞最基本的內(nèi)容為主。張瑋說(shuō):“這個(gè)產(chǎn)品的制作并不是為了得出某一結(jié)論,而是給人們提供一種探索唐詩(shī)宋詞的有趣工具。”因此,更多有意思的結(jié)論還有待于讀者們?nèi)グl(fā)現(xiàn)。
