中國(guó)西藏網(wǎng) > 即時(shí)新聞 > 時(shí)政

機(jī)器化學(xué)家誕生記:中國(guó)團(tuán)隊(duì)歷時(shí)8年打造“最強(qiáng)化學(xué)大腦”

發(fā)布時(shí)間:2022-10-17 10:23:00來(lái)源: 中國(guó)青年報(bào)

  零距離

  中國(guó)團(tuán)隊(duì)歷時(shí)8年打造“最強(qiáng)化學(xué)大腦”

  機(jī)器化學(xué)家誕生記

  在中國(guó)科學(xué)技術(shù)大學(xué)的機(jī)器化學(xué)家實(shí)驗(yàn)室,可以看見(jiàn)頗具科技感的一幕——一個(gè)體型“敦實(shí)”但動(dòng)作靈活的機(jī)器人,在操作臺(tái)之間穿梭,伸出機(jī)械手臂配制試劑。實(shí)驗(yàn)室另一邊,年輕科研人員正輸入指令,對(duì)機(jī)器人進(jìn)行“隔空”控制。大部分情況下,這臺(tái)機(jī)器人會(huì)自主思考實(shí)驗(yàn)的步驟和方案,像個(gè)不知疲憊的“小化學(xué)家”。

  這是中國(guó)科學(xué)技術(shù)大學(xué)化學(xué)物理系教授江俊團(tuán)隊(duì)的“作品”,該團(tuán)隊(duì)開(kāi)發(fā)了全球首個(gè)集閱讀文獻(xiàn)、自主設(shè)計(jì)實(shí)驗(yàn)、覆蓋材料開(kāi)發(fā)全流程的機(jī)器化學(xué)家平臺(tái),從數(shù)以億計(jì)的可能組合中找到最優(yōu)解來(lái)加快材料研發(fā)?!皩?shí)驗(yàn)數(shù)據(jù)經(jīng)處理后,輸入到平臺(tái)獨(dú)有的計(jì)算大腦中,產(chǎn)生理實(shí)交融的人工智能模型,幫助科研人員優(yōu)化實(shí)驗(yàn)方案?!苯≌f(shuō)。

  江俊團(tuán)隊(duì)有近30位成員,其中多數(shù)是90后、95后。10月上旬,團(tuán)隊(duì)又添科研進(jìn)展——通過(guò)開(kāi)發(fā)和集成移動(dòng)機(jī)器人、化學(xué)工作站、智能操作系統(tǒng)、科學(xué)數(shù)據(jù)庫(kù),他們研制出數(shù)據(jù)智能驅(qū)動(dòng)的全流程機(jī)器化學(xué)家。

  該研究成果論文已在最新一期《國(guó)家科學(xué)評(píng)論》學(xué)術(shù)期刊發(fā)表。國(guó)際審稿人評(píng)價(jià)說(shuō),該成果的“機(jī)器人系統(tǒng)、工作站和智能化學(xué)大腦都是最先進(jìn)的”“將對(duì)化學(xué)科學(xué)產(chǎn)生巨大影響”。業(yè)內(nèi)專家認(rèn)為,機(jī)器化學(xué)家的研究工作脫離了傳統(tǒng)試錯(cuò)研究范式的限制,展現(xiàn)出“最強(qiáng)化學(xué)大腦”指導(dǎo)的智能新范式的巨大優(yōu)勢(shì),引領(lǐng)化學(xué)研究朝著知識(shí)理解數(shù)字化、操作指令化、創(chuàng)制模板化的未來(lái)趨勢(shì)前進(jìn)。

  那么,一個(gè)“聰明”到會(huì)做化學(xué)實(shí)驗(yàn)的機(jī)器人是如何誕生的,其背后凝聚了年輕人怎樣的努力和心血?中青報(bào)·中青網(wǎng)記者進(jìn)行了采訪。

  “打造中國(guó)人自己的材料數(shù)據(jù)庫(kù)”

  隨著化學(xué)研究的對(duì)象日益復(fù)雜化、高維化,傳統(tǒng)研究范式成本高、周期跨度長(zhǎng)的問(wèn)題日益突出。近年來(lái),科技界逐漸意識(shí)到數(shù)據(jù)對(duì)于學(xué)術(shù)研究和產(chǎn)業(yè)創(chuàng)新發(fā)展的重要意義,而大數(shù)據(jù)科學(xué)與人工智能技術(shù)結(jié)合的手段,也在先進(jìn)材料研發(fā)中嶄露頭角。

  團(tuán)隊(duì)核心成員肖恒宇是1995年生人,他本科就讀于中國(guó)科學(xué)技術(shù)大學(xué)少年班學(xué)院,出于興趣自學(xué)了人工智能。一次,他編寫(xiě)的一個(gè)智能程序出現(xiàn)問(wèn)題,于是向時(shí)任班主任的江俊請(qǐng)教。江俊一針見(jiàn)血地指出,“算法沒(méi)有問(wèn)題,但算法依賴的實(shí)驗(yàn)數(shù)據(jù)過(guò)于片面”。

  江俊發(fā)現(xiàn),一段時(shí)間以來(lái),我國(guó)科研團(tuán)隊(duì)會(huì)將科研數(shù)據(jù)寫(xiě)進(jìn)英文論文,在國(guó)外期刊上發(fā)表,但等到要引用數(shù)據(jù)時(shí),還得額外花錢去買。

  “做中國(guó)人自己的材料數(shù)據(jù)庫(kù)”,成了江俊的夢(mèng)想。在他的影響下,肖恒宇等人一起踏上實(shí)現(xiàn)這個(gè)夢(mèng)想的道路。

  肖恒宇的同學(xué)霍姚遠(yuǎn)、馮超,學(xué)的是數(shù)學(xué)和化學(xué),喜歡研究數(shù)據(jù)。2014年開(kāi)始,三人收集數(shù)據(jù)、挖掘文獻(xiàn)、尋找架構(gòu),江俊提供原理指導(dǎo)和研究資源。2016年,他們搭建了第一代材料數(shù)據(jù)檢索平臺(tái),但使用反饋不太理想,有老師抱怨“數(shù)據(jù)不準(zhǔn)確”。

  肖恒宇等人意識(shí)到,數(shù)據(jù)不僅要多,還要優(yōu)質(zhì)。他們的數(shù)據(jù)庫(kù)缺了最重要的一環(huán)——知識(shí)圖譜,這導(dǎo)致數(shù)據(jù)質(zhì)量良莠不齊,無(wú)法進(jìn)行高效檢索。

  建立知識(shí)圖譜并非易事,同學(xué)們要用專業(yè)知識(shí)區(qū)分?jǐn)?shù)據(jù)的關(guān)聯(lián)性,為圖像打上識(shí)別標(biāo)簽,讓電腦知道每個(gè)數(shù)據(jù)背后的物理意義。

  團(tuán)隊(duì)成員、博士生張百成記得,最初全靠幾位同學(xué)自己“打標(biāo)簽”,沒(méi)日沒(méi)夜地標(biāo)注了幾個(gè)星期,大家讀文獻(xiàn)讀得頭昏腦漲,卻只完成了任務(wù)量的1%,幾近絕望。

  為此,江俊找到中國(guó)科大校團(tuán)委,開(kāi)展有獎(jiǎng)讀文獻(xiàn)比賽,聯(lián)合更多有專業(yè)背景的大學(xué)生參與。由此,他們產(chǎn)生了第一批高質(zhì)量的標(biāo)記數(shù)據(jù)。

  “眾人拾柴火焰高,大數(shù)據(jù)時(shí)代,要融合眾智、整合資源?!睆埌俪烧f(shuō),利用這批數(shù)據(jù)訓(xùn)練智能算法,他們實(shí)現(xiàn)了第一代化學(xué)命名實(shí)體識(shí)別程序,后續(xù)的標(biāo)注任務(wù),可以先讓計(jì)算機(jī)自動(dòng)識(shí)別,再進(jìn)行人工檢驗(yàn),極大提升了效率。

  最終,他們打磨出我國(guó)第一代材料科學(xué)知識(shí)圖譜。2021年,團(tuán)隊(duì)用圖譜賦予機(jī)器人“小來(lái)”科學(xué)思維,團(tuán)隊(duì)的自然語(yǔ)言處理技術(shù)也隨之“鳥(niǎo)槍換炮”,機(jī)器自動(dòng)閱讀和識(shí)別的準(zhǔn)確度提高到90%。

  “將數(shù)據(jù)變?yōu)閷?shí)際生產(chǎn)力”

  2016年,肖恒宇參加互聯(lián)網(wǎng)+創(chuàng)新創(chuàng)業(yè)大賽,獲安徽省冠軍、全國(guó)銀獎(jiǎng)。投資機(jī)構(gòu)為他和團(tuán)隊(duì)提供第一筆創(chuàng)業(yè)資金。成立公司后,團(tuán)隊(duì)3次迭代知識(shí)圖譜,建立了含9000萬(wàn)個(gè)化合物、1100萬(wàn)條化學(xué)反應(yīng)路徑的大規(guī)模材料數(shù)據(jù)庫(kù)。團(tuán)隊(duì)還借此幫助一些科研單位解決技術(shù)難題。

  譬如,某航天企業(yè)發(fā)現(xiàn)組合發(fā)動(dòng)機(jī)中的金屬配件材料需要改進(jìn),嘗試多種方案都未能實(shí)現(xiàn)。肖恒宇等人用數(shù)據(jù)平臺(tái)模擬出燃燒流場(chǎng)、大渦流場(chǎng),并找到記憶金屬設(shè)計(jì)配方,這為該企業(yè)節(jié)省成本4300多萬(wàn)元。

  肖恒宇團(tuán)隊(duì)還迎來(lái)了意外之喜——他們?cè)跒樵撈髽I(yè)解決問(wèn)題的過(guò)程中,收集了10萬(wàn)種合金演化結(jié)構(gòu)數(shù)據(jù)和金屬原子間相互作用能數(shù)據(jù),這些反過(guò)來(lái)豐富和完善了他們已有的數(shù)據(jù)庫(kù)平臺(tái)體系。

  “以往做研究時(shí),有人習(xí)慣將數(shù)值往自己想要的方向去調(diào)整,但是研究需要數(shù)據(jù)多樣性,要記錄偏見(jiàn)、有誤差的數(shù)據(jù)?!苯?jiān)信,數(shù)據(jù)是科研和產(chǎn)業(yè)的共同語(yǔ)言,數(shù)據(jù)庫(kù)平臺(tái)就是連接科研與產(chǎn)業(yè)的橋梁,要產(chǎn)生更多高標(biāo)準(zhǔn)的數(shù)據(jù)反哺科研,將數(shù)據(jù)變?yōu)閷?shí)際生產(chǎn)力。

  目前,該團(tuán)隊(duì)又建立了材料基因創(chuàng)新研究平臺(tái),建成亞洲最大的材料數(shù)據(jù)庫(kù)平臺(tái)——機(jī)數(shù)大材庫(kù)。

  江俊介紹,機(jī)器化學(xué)家平臺(tái)具有更強(qiáng)的化學(xué)智能和廣泛的新材料開(kāi)發(fā)能力,涵蓋光催化與電催化材料、發(fā)光分子、光學(xué)薄膜材料等領(lǐng)域,適用范圍將隨平臺(tái)升級(jí)和拓展繼續(xù)擴(kuò)大。

  “從不擺爛,從不應(yīng)付交差”

  每周開(kāi)組會(huì)時(shí),江俊只需要提出希望機(jī)器人解決的問(wèn)題,學(xué)生們就會(huì)自己討論實(shí)施方案。設(shè)備沒(méi)有底層驅(qū)動(dòng)程序,學(xué)生們就會(huì)攻關(guān)智能化升級(jí)。再后來(lái)開(kāi)會(huì)時(shí),江俊只能坐在一旁聽(tīng)著,甚至插不上話。

  讓他欣慰的是,幾位有交叉學(xué)科背景的年輕在讀博士,已經(jīng)成長(zhǎng)為團(tuán)隊(duì)“頂梁柱”:肖恒宇設(shè)計(jì)軟件框架;張百成編寫(xiě)程序,讓機(jī)器人讀論文、提出科學(xué)假設(shè)、形成實(shí)驗(yàn)報(bào)告和方案;趙路遠(yuǎn)主攻電化學(xué)測(cè)試,負(fù)責(zé)烘干儀器、光譜儀等硬件的驅(qū)動(dòng)程序開(kāi)發(fā)。

  25歲的趙路遠(yuǎn)學(xué)電子科學(xué)技術(shù)出身。在她看來(lái),克服科研難題主要靠毅力。她和師弟曹嘉祺一起編寫(xiě)某驅(qū)動(dòng)程序時(shí),由于信息掌握不充足,無(wú)法準(zhǔn)確理解調(diào)用接口,“我們反復(fù)聯(lián)系儀器廠商和代理商,沒(méi)有回應(yīng)。我們決定自力更生?!?/p>

  3周時(shí)間,兩人就像兩個(gè)機(jī)器人,除了吃飯睡覺(jué)外,重復(fù)做了3000次發(fā)送信號(hào)、等待反饋、記錄響應(yīng)等嘗試,一點(diǎn)一點(diǎn)逆向試出了底層控制邏輯,成功實(shí)現(xiàn)了對(duì)機(jī)器人的遠(yuǎn)程控制。

  “此時(shí),儀器代理商主動(dòng)找到我們,想要購(gòu)買我們的驅(qū)動(dòng)程序,我們覺(jué)得特別自豪。”趙路遠(yuǎn)說(shuō)。

  2021年,團(tuán)隊(duì)信心滿滿地開(kāi)始機(jī)器人的首次試運(yùn)行,不料,化學(xué)設(shè)備單獨(dú)運(yùn)行正常,但參與系統(tǒng)聯(lián)調(diào)時(shí)卻無(wú)法使用。大家排查到半夜仍然沒(méi)有頭緒。

  這時(shí),肖恒宇突然意識(shí)到化學(xué)設(shè)備和機(jī)械臂均使用了紅外探測(cè)設(shè)備,可能會(huì)互相干擾。于是,他將機(jī)械臂換一個(gè)朝向,輕松解決了問(wèn)題。

  “往后的開(kāi)發(fā)調(diào)試中,不同領(lǐng)域的儀器設(shè)備,不同系統(tǒng)的代碼協(xié)議間,都出現(xiàn)了類似的‘磨合’難題,而我們通過(guò)交叉學(xué)科思維,將它們逐一擊破?!毙ず阌钫f(shuō)。

  “一個(gè)方案受挫,大家不會(huì)擺爛,不會(huì)應(yīng)付交差,而是反復(fù)測(cè)試,看看究竟哪個(gè)環(huán)節(jié)出了問(wèn)題?!毙ず阌钫f(shuō),科研伙伴身上有著相似特質(zhì)——對(duì)流程和技術(shù)的執(zhí)著。完成任務(wù)時(shí),團(tuán)隊(duì)成員總會(huì)想的比自己更多一點(diǎn),不僅拿出方案,還會(huì)想好替代方案和若干發(fā)散選項(xiàng)。

  在他看來(lái),從開(kāi)發(fā)測(cè)試,到改進(jìn)迭代,再到升級(jí),一個(gè)實(shí)驗(yàn)分支由一人全部負(fù)責(zé),每個(gè)人都成長(zhǎng)為“全能人才”。肖恒宇說(shuō),全身心投入科研時(shí),所有知識(shí)都有用武之地。他一直自學(xué)3D動(dòng)畫(huà)。課題組拍攝科普片時(shí),他還包辦了分鏡頭和腳本撰寫(xiě)。

  肖恒宇曾在寧夏回族自治區(qū)海原縣一中支教。他利用閑置的傳感器等儀器,搭建了兩個(gè)小型實(shí)驗(yàn)室,帶學(xué)生學(xué)化學(xué)、物理、信息,激發(fā)孩子們的科學(xué)興趣。他一直有個(gè)夢(mèng)想,希望帶動(dòng)更多年輕人合作研發(fā)更高水平、更具科研智慧的實(shí)驗(yàn)平臺(tái),讓中國(guó)的智能化學(xué)閃耀世界。

  中青報(bào)·中青網(wǎng)記者 王海涵 王磊 (來(lái)源:中國(guó)青年報(bào))

(責(zé)編:李雨潼)

版權(quán)聲明:凡注明“來(lái)源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來(lái)源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。

吴桥县| 芮城县| 德兴市| 文化| 寿阳县| 盖州市| 电白县| 巴林左旗| 阳城县| 加查县| 陵水| 左权县| 遂昌县| 乐东| 凤翔县| 巴楚县| 宜兴市| 咸阳市| 巴彦淖尔市| 河津市| 扬中市| 宁海县| 涟水县| 密山市| 沽源县| 桃园县| 若尔盖县| 贵州省| 呼和浩特市| 藁城市| 太仓市| 樟树市| 德格县| 海口市| 两当县| 扎赉特旗| 富裕县| 固原市| 河津市| 缙云县|