黄网站色欧美视频,今夜无人入睡免费播放电视剧,日韩成人毛片在线,粉嫩av中文字幕,国产黄色大片在线观看,哥布林的洞窟,黄色小网站入口

中文字符集竟這樣不完備——傳統(tǒng)文化如何在數(shù)字化時(shí)代傳播

m.dddjmc.com 2019-06-15 18:14 來(lái)源：文匯報(bào) 用手持設(shè)備訪問(wèn)

　　只有解決好目前中文字符集存在的種種問(wèn)題，我們的歷史文獻(xiàn)才能在數(shù)字媒體上不打折扣地講述真正的中國(guó)故事。而字符集問(wèn)題的解決，對(duì)于當(dāng)前相關(guān)專業(yè)領(lǐng)域來(lái)說(shuō)，并非極其繁難之事。

　　中國(guó)傳統(tǒng)文化的基本載體是歷史文獻(xiàn)，只有通過(guò)這些第一手文獻(xiàn)的閱讀，人們才能接觸真實(shí)的傳統(tǒng)文化。然而，受限于中文字符集建設(shè)的發(fā)展水平，我們的歷史文獻(xiàn)在當(dāng)下主流信息傳播平臺(tái)上存在話語(yǔ)障礙，主要表現(xiàn)為三方面的問(wèn)題。

　　“一字多碼”，使得傳統(tǒng)文化的數(shù)字傳播與利用受損

　　電腦字符集中的每個(gè)字符，都應(yīng)該只有一個(gè)唯一編碼，才能被進(jìn)行有效的數(shù)字處理。但是，現(xiàn)在的電腦通用字符集中有不少文字單位與碼位不唯一對(duì)應(yīng)的情況。這一問(wèn)題，主要是由于在中日韓聯(lián)合進(jìn)行字符集編碼過(guò)程中、各家都希望自己的習(xí)用字形盡可能充分進(jìn)入字符集而造成的。這些字，多為歷史文獻(xiàn)中的常用字，且往往是不容易區(qū)分彼此的構(gòu)形微別字，如“戶”、“戶”與“戸”，“宮”與“宮”。這種構(gòu)形微別字同構(gòu)形差異明顯的異體字、繁簡(jiǎn)字不同，后二者如“鋪（內(nèi)碼8216）”與“舗（內(nèi)碼8217）”，“匯（5F59）”與“彚（5F5A）”，由于構(gòu)形上存在明顯差異，在輸入時(shí)很容易被區(qū)分開(kāi)來(lái)；而構(gòu)形微別字在輸入過(guò)程中，因?yàn)橛羞@種一字多碼的輸入源，很容易導(dǎo)致同字卻使用不同內(nèi)碼字的情況。由此，人們?cè)诰W(wǎng)絡(luò)或相關(guān)數(shù)據(jù)庫(kù)查找文獻(xiàn)時(shí)，就會(huì)出現(xiàn)以下情況：該找到的找不到，該搜齊的搜不齊，而查找搜索者卻誤以為這就是真實(shí)檢索結(jié)果，傳統(tǒng)文化寶藏的利用無(wú)形中被打了折扣。如“文淵閣四庫(kù)全書”（“Complete Library in Four Branchesof Literature”），是一個(gè)非常注重區(qū)別異體字、反映文獻(xiàn)原貌的電子古籍檢索系統(tǒng)，但也不免因同字多碼問(wèn)題而導(dǎo)致全文檢索的失誤。如“彝（5F5D）”，另有三個(gè)不同編碼而同字者：彛（5F5B）、彜（5F5C）、彞（5F5E）。如果全文檢索“彝（5F5D）”，匹配的結(jié)果是32041個(gè)，但是用另外三個(gè)字形彛（5F5B）、彜（5F5C）、彞（5F5E）去全文檢索，匹配項(xiàng)卻只有22054，也就是說(shuō)，文獻(xiàn)檢索范圍內(nèi)另有9987個(gè)“彝”的文例失檢。再如在“國(guó)學(xué)大師”網(wǎng)上檢索“戶”，得到93349個(gè)檢索結(jié)果，而輸入“戸”，則只有24046個(gè)檢索結(jié)果。

　　而尤當(dāng)引起注意的是，即使在目前最通用的GBK字符集中，類似的同字多碼者也很多，除了上舉一字四碼者外，一字三碼的情況如：

　　娛（5A1B）娯（5A2F）娛（5A31）

　　揺（63FA）搖（6416）搖（6447）

　　吳（5433）吳（5434）呉（5449）

　　奨（5968）奬（596C）獎(jiǎng)（734E）

　　戶（6236）戶（6237）戸（6238）

　　挿（633F）插（63D2）揷（63F7）

　　一字二碼的數(shù)量更加可觀：

　　捏（634F）揑（63D1）；

　　尙（5C19）尚（5C1A）；

　　尓（5C13）爾（5C14）；

　　尪（5C2A）尫（5C2B）；

　　捜（635C）搜（641C）；

　　尶（5C36）尷（5C37）；

　　寜（5BDC）寧（5BE7）；

　　?。?E2F）帶（5E36）；

　　掲（63B2）揭（63ED）；

　　宮（5BAB）宮（5BAE）；

　　孳（5B73）孶（5B76）；

　　悳（60B3）惪（60EA）；

　　悞（609E）悮（60AE）；

　　愼（613C）慎（614E）；

　　悅（6085）悅（60A6）；

　　恵（6075）惠（60E0）；

　　徴（5FB4）徵（5FB5）；

　　徳（5FB3）德（5FB7）……

　　僅以上并不完整的整理，所得多碼字共計(jì)432個(gè)，這已經(jīng)占了字符集的相當(dāng)比例?？上攵ㄟ^(guò)這樣一個(gè)字符集進(jìn)行傳統(tǒng)文獻(xiàn)的數(shù)字傳播和閱讀，不注意一字多碼問(wèn)題的把控，是很難充分利用文獻(xiàn)且保證文獻(xiàn)不被誤讀漏檢的。

上一頁(yè)

下一頁(yè)

閱讀全文

標(biāo)簽： 中文字符集字符集漢字信息處理數(shù)字化

責(zé)任編輯：王貴溪

數(shù)字賦能，活化古籍善本

據(jù)媒體報(bào)道，自2019年起，我國(guó)將在10年內(nèi)累計(jì)投入3億元專項(xiàng)資金，開(kāi)展迄今為止布達(dá)拉宮最大規(guī)模的古籍文獻(xiàn)保護(hù)與利用專項(xiàng)工作。其中，數(shù)字化保護(hù)為其中一項(xiàng)重要工作。　　古籍，是中華文明的重要載體，蘊(yùn)藏著千百年的經(jīng)驗(yàn)智慧，傳揚(yáng)著古圣先賢修身、齊家、治國(guó)、平天下的價(jià)值皈依。2008年至今，國(guó)務(wù)院陸續(xù)公布了五批“國(guó)家珍貴古籍名錄”。這些年的“古文熱”“經(jīng)史...

醫(yī)師稱陳水扁簽書寫漢字有療效 “宅神”2字嗆爆

陳水扁日前辦新書簽書會(huì)，40分鐘簽180本，1分鐘簽7本，手沒(méi)有抖，醫(yī)師陳順勝說(shuō)，簽書是療程之一，寫漢字須使力，全心投入就不會(huì)手抖。對(duì)此，“宅神”朱學(xué)恒表示，奇跡，原來(lái)都是有療效的啊!要不要一起來(lái)聯(lián)機(jī)打個(gè)王者榮耀（電玩游戲）好了。網(wǎng)友說(shuō)，“貪污算錢也不會(huì)抖?” 據(jù)臺(tái)灣《...

智能秒批讓審批像網(wǎng)購(gòu)一樣方便 “數(shù)字化”助力漳州政務(wù)提升效率

臺(tái)海網(wǎng)5月9日訊 (海峽導(dǎo)報(bào)記者林曉琪實(shí)習(xí)生洪婷婷文/圖)上網(wǎng)辦老年人優(yōu)待證，比網(wǎng)購(gòu)還快；下載個(gè)漳州通APP，不僅可以隨時(shí)隨地查住房公積金、醫(yī)療保險(xiǎn)，還能申請(qǐng)辦理住房公積金提取審批、商品房預(yù)售許可等各項(xiàng)業(yè)務(wù)…… 　　5月8日，第二屆數(shù)字中國(guó)建設(shè)峰會(huì)在福州閉幕，漳州市參...

數(shù)字化保護(hù)讓文化遺產(chǎn)“重生”

超10億個(gè)數(shù)據(jù)點(diǎn)的留存，最大程度還原巴黎圣母院面貌—— 　　數(shù)字化保護(hù)讓文化遺產(chǎn)“重生”(網(wǎng)上中國(guó)) 　　本報(bào)記者孫亞慧　　陜西歷史博物館有一座由玻璃幕墻包圍的透明展室，文物修復(fù)科的修復(fù)師在這里有條不紊地操作著各式儀器設(shè)備，對(duì)文物進(jìn)行拍攝測(cè)量。　　新華社記者李一...

泉州：數(shù)字化技術(shù)+百米唐卡長(zhǎng)卷再現(xiàn)“海絲”勝景

新華網(wǎng)福州4月29日電（王雄）4月28日，泉州“海絲”唐卡百米長(zhǎng)卷創(chuàng)作工程正式啟動(dòng)。該作品將以世界非物質(zhì)文化遺產(chǎn)唐卡藝術(shù)的繪畫形式，再現(xiàn)古代泉州“市井十洲人”的繁榮景象與社會(huì)風(fēng)貌，并通過(guò)3D技術(shù)，讓畫中情景和人物“動(dòng)”起來(lái)。　　據(jù)介紹，“海絲”唐卡百米長(zhǎng)卷創(chuàng)作脈絡(luò)以泉州母親河晉江為線，自西北九日山向東南泉州灣發(fā)展，并延伸至臺(tái)灣及東南亞地區(qū)；以沿線...