我國(guó)科研人員發(fā)布古籍大語言模型
記者日前從南京農(nóng)業(yè)大學(xué)了解到,該校信息管理學(xué)院王東波教授團(tuán)隊(duì)與中華書局古聯(lián)公司研發(fā)的古籍大語言模型近日上線。
“我們請(qǐng)它以‘金陵’為主題,生成一首詩?!蓖鯑|波演示模型的智能作詩功能,輸入指令后,模型不久就給出了反饋。除了智能作詩、斷句翻譯,該模型還能實(shí)現(xiàn)詞法分析、實(shí)體識(shí)別、關(guān)系提取、文本摘要等功能。
“普通讀者想閱讀古籍文獻(xiàn)并不容易,要克服繁體、豎版、沒有句讀等困難?!蓖鯑|波說,團(tuán)隊(duì)自2013年起為《四庫全書》等古籍添加人工標(biāo)注,積累了規(guī)模超過20億字的精加工語料數(shù)據(jù),這為該古籍大語言模型提供了語料數(shù)據(jù)基礎(chǔ)。
據(jù)了解,該古籍大語言模型是國(guó)家社科基金重大項(xiàng)目“中國(guó)古代典籍跨語言知識(shí)庫構(gòu)建及應(yīng)用研究”的重要成果。下一步,南京農(nóng)業(yè)大學(xué)與中華書局古聯(lián)公司計(jì)劃將模型的應(yīng)用場(chǎng)景推廣到古籍整理、數(shù)字文娛等領(lǐng)域。
“期待模型能進(jìn)一步推動(dòng)古籍智能化研究與跨學(xué)科人才培養(yǎng)有機(jī)結(jié)合,讓公眾既能接觸到前沿的人工智能技術(shù),又能積累傳統(tǒng)文化知識(shí)?!蓖鯑|波表示。(記者秦華江、陳席元)
版權(quán)聲明:凡注明“來源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 香港將辦最大規(guī)模煙花匯演迎新年:橫跨中環(huán)至銅鑼灣,全長(zhǎng)1300米
- 圖知道|代表南京大屠殺幸存者的燈會(huì)熄滅,但記憶不滅
- 2024年中國(guó)經(jīng)濟(jì),如何定調(diào)?
- 北京文旅局緊急通知:密切監(jiān)控、及時(shí)清除大跨度建筑物、臨時(shí)搭建物頂部積雪,防止垮塌
- 新提法釋放啥信號(hào)?專家解讀中央經(jīng)濟(jì)工作會(huì)議
- 戲劇“擴(kuò)圈”,讓更多優(yōu)質(zhì)作品走近消費(fèi)者
- 上海第30屆電影評(píng)論學(xué)會(huì)獎(jiǎng)揭曉 《愛情神話》等榮膺“年度十佳”
- 國(guó)家大劇院話劇《簡(jiǎn)·愛》舉行媒體探班
- 1937年12月13日 我們不能忘不敢忘
- 十年禁漁看長(zhǎng)江|涉漁執(zhí)法顯成效