蘇州圖書館古籍?dāng)?shù)字化:藏用并舉 活化新生
通過數(shù)字化降低古籍閱讀門檻,可以讓更多讀者親近古籍,感受中華優(yōu)秀傳統(tǒng)文化的魅力。目前,古籍?dāng)?shù)字化過程中還存在諸多問題,如缺乏整體規(guī)劃、古籍整理成果資源有限、缺乏全國統(tǒng)一的強(qiáng)制性數(shù)字化標(biāo)準(zhǔn)等。面對這些問題,該如何解決?
為保護(hù)和利用古籍,國家圖書館(國家古籍保護(hù)中心)先后上線了“全國古籍普查登記基本數(shù)據(jù)庫”“中華古籍資源庫”。2022年,中華書局推出“3D超寫實(shí)數(shù)字人蘇東坡”,江蘇常州市圖書館上線了“家譜古籍?dāng)?shù)據(jù)庫”,山西太原市圖書館上線了“太原市圖書館古籍?dāng)?shù)據(jù)庫”。2023年,上海圖書館、云南省圖書館以及江蘇省的常熟、昆山、鎮(zhèn)江等地圖書館,都積極對本館的古籍實(shí)現(xiàn)數(shù)字化。
古籍?dāng)?shù)字化的難點(diǎn)在哪里?在江蘇蘇州圖書館古籍保護(hù)中心主任、研究館員孫中旺看來,首先是選擇哪些古籍做數(shù)字化處理。據(jù)悉,蘇州圖書館主要聚焦珍貴善本和蘇州地方文獻(xiàn)。
目前國內(nèi)古籍?dāng)?shù)字化的通用做法是:通過非接觸似專業(yè)古籍掃描設(shè)備采集古籍?dāng)?shù)據(jù),形成圖像文件,著錄相應(yīng)的元數(shù)據(jù),建立古籍?dāng)?shù)字化數(shù)據(jù)庫。但圖像格式存在著占用空間大、不能全文檢索等問題。而且,數(shù)字化的古籍格式無法呈現(xiàn)古籍排版的原始風(fēng)格,異體字、通假字等也導(dǎo)致時常在瀏覽器中無法檢索和查看。
蘇州圖書館聯(lián)合江蘇嘉圖網(wǎng)絡(luò)科技股份有限公司(簡稱“嘉圖”)開發(fā)了古籍全文數(shù)字化平臺,力求原汁原味展現(xiàn)古籍的版式、風(fēng)格、內(nèi)容等。嘉圖董事長徐偉國說:“這幾年光學(xué)字符識別標(biāo)準(zhǔn)刻本準(zhǔn)確率達(dá)到99%,嘉圖采用光學(xué)字符識別技術(shù)替代人工錄入,解決錄入過程中識字、異體字處理、錯誤高、效率低等問題。遇到錯別字,系統(tǒng)會標(biāo)注出來,還能提供‘這個字可能是某字’的推薦?!?/p>
光學(xué)字符識別減少了校對工序,但只對楷體、宋體等刻本比較管用。對稿抄本及草、篆、隸等體寫刻本,眼下的技術(shù)還無法完全準(zhǔn)確識別。例如,《(乾?。﹨强h志》中有個序是手寫的,很難識別,只能通過查閱其他古籍及地方志,找出相應(yīng)文字進(jìn)行研究比對后才完成確認(rèn)?!凹螆D的做法是,提供與古籍原文對照的圖片,如果某些字顯示不出來,讀者可以對著原圖研究。對草、篆、隸等體及刊刻或書寫模糊的古籍,由嘉圖專家團(tuán)隊完成錄入。同時,采用自動化校對技術(shù)來解決人工校對過程中效率低、異體字難辨認(rèn)等問題。通過自動化校對實(shí)現(xiàn)簡繁轉(zhuǎn)換、圖文定位、異體字的備選,標(biāo)紅錯字。”徐偉國說。目前,嘉圖古籍?dāng)?shù)字化平臺已助力蘇州圖書館完成120多萬頁古籍和民國文獻(xiàn)的數(shù)字化。
古籍?dāng)?shù)字化工作近年來全面“開花”,但由于尚未出臺全國統(tǒng)一的標(biāo)準(zhǔn),各個地方在古籍?dāng)?shù)字化時采用了不同的規(guī)范標(biāo)準(zhǔn),導(dǎo)致數(shù)據(jù)的完整性、正確性以及技術(shù)上的兼容性各不相同,難以實(shí)現(xiàn)整合和利用。一位業(yè)內(nèi)人士表示:“建議國家完善古籍?dāng)?shù)字化標(biāo)準(zhǔn),并不斷進(jìn)行調(diào)整。各地應(yīng)建立自己的標(biāo)準(zhǔn),在國家標(biāo)準(zhǔn)的基礎(chǔ)上更具體、更深入。同時,研究和引入國際標(biāo)準(zhǔn)?!睂O中旺也提出:“標(biāo)準(zhǔn)要有前瞻性、兼容性,比如,蘇州圖書館在字庫、軟件、數(shù)字化發(fā)布平臺等方面已深耕20多年,數(shù)字化平臺已成規(guī)模,不能為了上一個新系統(tǒng),又從頭開始做。”
古籍內(nèi)容免費(fèi)獲取后如何保護(hù)數(shù)字版權(quán),是制約古籍?dāng)?shù)據(jù)開放的因素之一,需要業(yè)界建立標(biāo)準(zhǔn)完成數(shù)據(jù)確權(quán)。同時,國內(nèi)雖然有不少圖書館或其他單位在做古籍?dāng)?shù)字化產(chǎn)品,但質(zhì)量參差不齊?!坝械臄?shù)字化產(chǎn)品差錯率太高,不能讓這樣的劣質(zhì)產(chǎn)品覆蓋優(yōu)質(zhì)產(chǎn)品。比如,《永樂大典》等重要文獻(xiàn),可以由政府牽頭立項(xiàng),出一個各方認(rèn)可的權(quán)威數(shù)字化產(chǎn)品,在確保質(zhì)量的同時避免重復(fù)建設(shè)。”孫中旺說。
古籍在形式上可以更加貼近生活,做一些有趣的嘗試。徐偉國說:“古籍?dāng)?shù)字化可以做出地方特色。比如,可以從蘇州圖書館的文獻(xiàn)中提取出諸如蘇州婚喪嫁娶習(xí)俗的演變過程,蘇州古城在元明清時代是啥樣,蘇州人民路在古代發(fā)生了什么事……每年做一兩個專題,以數(shù)字化形式在圖書館展示,讓圖書館成為一扇了解城市文化的窗口,吸引讀者前來體驗(yàn)?!?/p>
“古籍活化,可以以聲光電的形式重新演繹。蘇州圖書館擬從江南文化著手,通過現(xiàn)代技術(shù),考證還原《清嘉錄》中記錄的古人風(fēng)雅生活。采用先進(jìn)技術(shù)、跨時空工具和場景,使古籍‘活’起來。”孫中旺說。(本報記者 劉妮麗)
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。