國內(nèi)大模型實(shí)現(xiàn)“長文本”突破
本報(bào)訊(記者 孫奇茹)通用人工智能領(lǐng)域初創(chuàng)公司月之暗面(Moonshot AI)近日宣布在長文本領(lǐng)域?qū)崿F(xiàn)突破,推出了首個(gè)支持輸入20萬漢字的大模型Moonshot以及搭載該模型的智能助手產(chǎn)品Kimi Chat。
從技術(shù)上看,參數(shù)量決定了大模型能夠支持多復(fù)雜的“計(jì)算”,而能夠接收多少文本輸入(即長文本技術(shù))則決定了大模型有多大的“內(nèi)存”,兩者共同決定模型的應(yīng)用效果。月之暗面相關(guān)負(fù)責(zé)人介紹,支持更長的上下文意味著大模型擁有更大的“內(nèi)存”,從而使得大模型的應(yīng)用更加深入和廣泛:比如通過多篇財(cái)報(bào)進(jìn)行市場分析、處理超長的法務(wù)合同、快速梳理多篇文章或多個(gè)網(wǎng)頁的關(guān)鍵信息、基于長篇小說設(shè)定進(jìn)行角色扮演等等,都可以在超長文本技術(shù)的加持下,成為人們工作和生活的一部分。
相比當(dāng)前市面上以英文為基礎(chǔ)訓(xùn)練的大模型服務(wù),月之暗面推出的Kimi Chat具備較強(qiáng)的多語言能力。例如,其在中文上具備顯著優(yōu)勢,實(shí)際使用效果能夠支持約20萬漢字的上下文,8倍于Open AI公司ChatGPT約2.5萬字的上下文支持容量。此前,一些大模型僅支持?jǐn)?shù)萬字的文本量限制使得律師、分析師、咨詢師等需要分析、處理較長文本的工作從業(yè)人員使用相關(guān)AI應(yīng)用時(shí)頗為苦惱。根據(jù)媒體公布的內(nèi)測體驗(yàn)視頻,當(dāng)上傳一篇長篇小說的電子文檔后,月之暗面研發(fā)的Moonshot能夠清晰地梳理一部小說的主要情節(jié)及小說中各個(gè)主要人物和人物的命運(yùn),也可以根據(jù)用戶上傳的財(cái)報(bào)進(jìn)行關(guān)鍵數(shù)據(jù)和公司發(fā)展情況的分析等。目前,月之暗面的智能助手產(chǎn)品Kimi Chat已開放內(nèi)測。
今年,中國頂尖AI科研人員之一楊植麟成立月之暗面。楊植麟此前從清華大學(xué)畢業(yè)后前往美國卡內(nèi)基梅隆大學(xué)攻讀博士,師從蘋果AI研究負(fù)責(zé)人和谷歌首席科學(xué)家。在過去五年內(nèi)的自然語言處理領(lǐng)域,楊植麟的學(xué)術(shù)論文在華人學(xué)者引用排名中位居前10,在40歲以下華人學(xué)者中排名第一。(北京日?qǐng)?bào))
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。