“冷板凳”式科研過時了嗎
“化學(xué)研究的初級階段好比交通方式中的‘步行’,隨著技術(shù)手段升級,研究程度加深、效率變高,等于用上了自行車、摩托車、汽車。當(dāng)引入人工智能,好比坐上火箭。最終必然‘量變引起質(zhì)變’,帶我們?nèi)ヒ郧叭ゲ涣说牡胤??!痹谥袊茖W(xué)技術(shù)大學(xué),精準智能化學(xué)重點實驗室主任李震宇用這樣一個比喻形容化學(xué)研究的變革。
“去以前去不了的地方”是李震宇和所在實驗室團隊孜孜不倦的科研追求。今年1月,中國科學(xué)院精準智能化學(xué)重點實驗室正式獲批建設(shè),由近100位年輕人組成,除化學(xué)與材料科學(xué)專業(yè)的師生外,還包括計算機、人工智能、大數(shù)據(jù)等方向的研究人員,聚焦如何改變化學(xué)研究范式這一關(guān)鍵科學(xué)問題,形成集群和協(xié)同攻關(guān)優(yōu)勢。
縱觀歷史,化學(xué)研究由煉丹、煉金演變而來,人類衣食住行離不開化學(xué)物質(zhì)。同時,作為基礎(chǔ)科學(xué)的化學(xué),也是多學(xué)科交叉的聚集點和出發(fā)點,化學(xué)研究在能源、環(huán)境、材料、生物醫(yī)藥等應(yīng)用領(lǐng)域扮演日益重要的角色。
歷經(jīng)數(shù)百年科研攀登,如今,精準智能化學(xué)成為化學(xué)家的夢想,更是實現(xiàn)化學(xué)學(xué)科跨越式發(fā)展的契機。而以人工智能為代表的新技術(shù)會不會重新定義化學(xué)的未來,改變化學(xué)研究的面貌?新興技術(shù)的雙刃劍會對研究范式帶來哪些沖擊和影響,師生們又有哪些對策和新招?這些問題一直縈繞在科研工作者心中。
化學(xué)版GPT來了,激起科研范式變革浪花
在精準智能化學(xué)重點實驗室中的機器化學(xué)家實驗室,青年科研人員只需在控制大屏輸入指令,兩個動作靈活的機器人“小來”和“小?!本涂梢栽趲讉€操作臺間穿梭,伸出機械手臂進行試劑配制。
中國科大化學(xué)與材料科學(xué)學(xué)院教授江俊團隊開發(fā)了全球首個集閱讀文獻、設(shè)計實驗、自主優(yōu)化于一體,覆蓋化學(xué)品開發(fā)全流程的機器化學(xué)家平臺,從數(shù)百萬的可能組合中找到全局最優(yōu)解加快材料研發(fā)。業(yè)內(nèi)專家認為,該成果引領(lǐng)化學(xué)研究朝著知識理解數(shù)字化、操作指令化、創(chuàng)制智能化的趨勢前進,將對化學(xué)科學(xué)產(chǎn)生巨大影響。
江俊團隊有近30位成員,大多是90后、95后,大家懷抱“做中國人自己的材料數(shù)據(jù)庫”的科研夢想。在關(guān)鍵節(jié)點——建立數(shù)據(jù)庫知識圖譜時,團隊曾吃了很多苦頭:數(shù)據(jù)質(zhì)量良莠不齊,無法進行高效檢索,不得不投入大量人力物力為數(shù)據(jù)打上識別標簽。
無奈和碰壁倒逼江俊提升研究效率,2014年,建立會思考的“化學(xué)大腦”的念頭在江俊心中萌發(fā)。他找來人工智能、電子科技、數(shù)學(xué)、化學(xué)等專業(yè)方向人才,組成交叉學(xué)科背景的團隊,將大數(shù)據(jù)和人工智能技術(shù)注入平臺的計算大腦,建立理實交融的智能模型。歷經(jīng)8年探索,打造初代機器化學(xué)家“小來”。
值得一提的是,在高熵催化劑等實驗中,“小來”可以從55萬種可能的金屬配比中找出全局最優(yōu)解,將傳統(tǒng)“試錯法”實驗所需的1400年科研周期縮短為5周。
論文閱讀、機器人做實驗、數(shù)據(jù)分析、優(yōu)化篩選……當(dāng)前,江俊團隊科研全流程都有人工智能的貢獻印記,今年年初,在多任務(wù)處理性能上實現(xiàn)升級的第二代機器化學(xué)家小福“誕生”。
如今,團隊又自主研發(fā)了一款閱讀了50萬篇文獻的化學(xué)領(lǐng)域聊天機器人程序Chem-GPT,它能夠針對使用者提出的問題,給出從文獻中學(xué)習(xí)到的可靠答案,從而驅(qū)動機器化學(xué)家做實驗,助力化學(xué)品和新材料研發(fā)。
江俊分析,人工智能給化學(xué)研究帶來如下改變:基于大語言模型,從文獻、專利、教科書等數(shù)據(jù)源中挖掘化學(xué)數(shù)據(jù),建立化學(xué)知識圖譜,用于支持化學(xué)研究決策和創(chuàng)新;建立物質(zhì)的結(jié)構(gòu)、組分、制備工藝等因素與性質(zhì)間的關(guān)系模型,用于指導(dǎo)新型的分子、材料、催化劑、藥物等的設(shè)計與優(yōu)化;結(jié)合人工智能技術(shù)幫助化學(xué)家自動設(shè)計實驗方案、優(yōu)化實驗過程,并進行自動測量表征。
他談道,對人工智能機器人平臺而言,首要挑戰(zhàn)是“如何賦予機器人物質(zhì)級別的感知能力和對化學(xué)過程的預(yù)判能力”。這兩個能力是讓人工智能能夠真正理解復(fù)雜物質(zhì)世界、捕捉化學(xué)系統(tǒng)的本質(zhì)特征規(guī)律的關(guān)鍵。在他的科研藍圖里,未來研發(fā)出模仿學(xué)習(xí)人類科學(xué)家創(chuàng)造力、具備“看”“聞”“聽”“觸”環(huán)境感知的“智慧科學(xué)家”,進而實現(xiàn)數(shù)據(jù)與智能驅(qū)動的化學(xué)研究新范式。
李震宇總結(jié)道,傳統(tǒng)的研究范式深度依賴于“試錯法”,效率低。公眾對化學(xué)的認識停留在不環(huán)保、不經(jīng)濟、不安全等刻板印象,迫切需要提升化學(xué)研究的精準程度與效率,讓公眾對化學(xué)面貌有新的認識。而人工智能等先進技術(shù),無疑有助于探索建立化學(xué)研究的精準化、智能化雙驅(qū)動模式。
人工智能浪潮下,科研還需要坐“冷板凳”嗎
當(dāng)先進技術(shù)不斷迭代應(yīng)用,讓人不禁思考,我們是否還需要“冷板凳”式的科研,反復(fù)試錯的意義又在哪里?
近日,中國科學(xué)技術(shù)大學(xué)姚宏斌課題組、李震宇課題組與浙江工業(yè)大學(xué)陶新永課題組合作,基于雙碳背景下電化學(xué)儲能發(fā)展的新范式,設(shè)計開發(fā)出鑭系金屬鹵化物基固態(tài)電解質(zhì)新家族LixMyLnzCl3,在無任何電極修飾的情況下實現(xiàn)了室溫可運行的全固態(tài)鋰金屬電池,成果于今年4月5日發(fā)表在《自然》(Nature)雜志上。
這一被業(yè)內(nèi)專家稱贊為電化學(xué)儲能領(lǐng)域固態(tài)電解質(zhì)材料新突破的背后,一群年輕人就飽嘗“冷板凳”之苦。從湘潭大學(xué)材料科學(xué)與工程專業(yè)推免至中國科大讀研的羅錦達是其中之一,進組3年,他從零基礎(chǔ)“小白”成長為科研主力。
2021年2月,還在讀大四的羅錦達抱著學(xué)習(xí)的心態(tài)來到中國科大做畢業(yè)設(shè)計,剛好趕上上述課題的萌芽狀態(tài)。大四畢業(yè)后,沒有畢業(yè)旅行和假期,他幾乎每天都在實驗室中度過。每位前輩都耐心解答這位準研一新生提出的每個問題,正是在這種尊重科研的氛圍下,“跨界”應(yīng)用化學(xué)方向的羅錦達,往研究中心地帶快速成長靠攏。
由于對計算機編程感興趣,羅錦達每天一有空就前往圖書館讀論文、書籍。研究中,他和小伙伴每天晚上在實驗室待到很晚,每人分別分析和復(fù)盤研究進展。此前,組內(nèi)一位學(xué)長嘗試用第一性原理計算來研究材料擴散性質(zhì),但由于沒有考慮到材料尺寸效應(yīng)以及界面的應(yīng)力作用,結(jié)果和預(yù)期相反。
“因為實驗原材料、環(huán)境天氣等客觀因素和操作不當(dāng)、經(jīng)驗不足等主觀原因,研究過程中遇到挫折是家常便飯,尤其是理論計算,有時花費大量時間精力,最后發(fā)現(xiàn)結(jié)果不盡人意。但不能因為一條路走不通,就否定大的科研方向,要不斷總結(jié)原因?!绷_錦達說。
那位學(xué)長畢業(yè)離組后,羅錦達接過關(guān)鍵的理論計算模擬任務(wù),并調(diào)整思路,從零開始學(xué)習(xí)分子動力學(xué)知識。他嘗試運用密度泛函理論、分子動力學(xué)模擬和鍵價位能等方法,來研究實驗對象獨特的結(jié)構(gòu)和離子傳導(dǎo)機制,從原子尺度更好地理解鋰離子的擴散行為,對后續(xù)實驗合成有很大的指導(dǎo)作用。
處理計算模擬數(shù)據(jù)時,羅錦達又化身“程序員”,自學(xué)編程語言python,他覺得,每天都專注解決一個新問題,這種生活開心且充實。
最終,團隊根據(jù)計算機模擬結(jié)果,設(shè)計出常溫條件下可以穩(wěn)定存在的鑭系金屬氯化物,合成出相應(yīng)的固態(tài)電解質(zhì)。他們把研究數(shù)據(jù)錄入合肥先進計算中心進行模擬分析,最終實現(xiàn)鋰離子在空間里的快速傳導(dǎo)。
“先進的技術(shù)可以幫助科研人員快速分析和處理知識、提取有用信息、找出規(guī)律和趨勢?!痹谝瓯罂磥恚辛讼冗M的計算方法,未來計劃引入人工智能機器學(xué)習(xí),可以優(yōu)化出更好的電解質(zhì)體系,探索新的高性能固態(tài)電解質(zhì)材料,實現(xiàn)更穩(wěn)定的界面并適配到實際的電池中。
但他同時指出,科研的本質(zhì)創(chuàng)新和發(fā)現(xiàn),以及對問題深入思考和探索,這些過程往往需要反復(fù)試錯和不斷嘗試。即使在數(shù)據(jù)處理方面已經(jīng)有了成熟的技術(shù)工具,年輕人在做科研的數(shù)據(jù)積累階段仍然需要坐“冷板凳”,這是幫助年輕人更好理解問題的必經(jīng)之路。
李震宇持有相同看法。他觀察到,人工智能擅長高通量的精準實驗、大規(guī)模數(shù)據(jù)處理等能力,但并不具備人類的創(chuàng)造性和判斷力等思維能力,無法創(chuàng)造出超越現(xiàn)有新穎化學(xué)思想的方法。因此,“冷板凳”有助于培養(yǎng)對化學(xué)有深刻理解和洞察力的人才。
據(jù)江俊課題組核心成員肖恒宇博士分析,年輕人在科研數(shù)據(jù)積累時,可以利用人工智能技術(shù)來加速數(shù)據(jù)生成、收集、整理,但在研究尚未深入的領(lǐng)域,缺乏經(jīng)驗的學(xué)生需要反復(fù)試錯。
人和AI如何“打配合”,科研效果才能最優(yōu)
采訪過程中,很多師生提到了化學(xué)研究中“數(shù)據(jù)”的重要性——數(shù)據(jù)和技術(shù)相伴相生,人與技術(shù)的“合作關(guān)系”也離不開數(shù)據(jù)的支撐。
江俊團隊的機器化學(xué)家自誕生之初就與海量文獻數(shù)據(jù)打交道?!皵?shù)據(jù)時代給我們帶來新機遇,同時也帶來不少難題。本質(zhì)上說,智能來自對數(shù)據(jù)的學(xué)習(xí),數(shù)據(jù)少,有用的知識就少,一些小數(shù)據(jù)對于化學(xué)研究來說珍貴稀疏,因此,做實驗‘很貴’?!苯≌f。
“現(xiàn)階段大部分數(shù)據(jù)都是從文獻中收集來的,而文獻中的數(shù)據(jù)經(jīng)常是被‘美化’過的理想數(shù)據(jù)。此外,標注數(shù)據(jù)需要大量人力物力,隨著數(shù)據(jù)需求上升,這部分成本會越來越高?!苯≌n題組博士生喬欽禹說。
還有部分師生談及,由于現(xiàn)存研究數(shù)據(jù)來源多且雜,當(dāng)高質(zhì)量和低質(zhì)量數(shù)據(jù)混在一起,人工智能很容易學(xué)到“錯誤的數(shù)據(jù)”,開頭就錯了,后面自然會影響效率甚至準確性。
算力算法的缺失也是現(xiàn)階段痛點之一。
由于GPU算力不足,使得江俊團隊的ChemGPT“跑不快”,訓(xùn)練迭代起來很慢?!叭斯ぶ悄艽笠?guī)模應(yīng)用勢不可擋,現(xiàn)有人工智能算力不足是亟待解決的問題?!苯≌n題組的博士生馮毅也注意到類似問題。
“精準化學(xué)非常依賴實驗數(shù)據(jù)的準確性?!崩钫鹩罡嬖V記者,改變現(xiàn)有痛點的可行路徑是通過精準計算和精準制備,得到大量精準數(shù)據(jù),從數(shù)據(jù)出發(fā)來得到高的化學(xué)智能。有了智能技術(shù)以后,再回過頭來對化學(xué)反應(yīng)、分子性質(zhì)、材料性質(zhì)進行做精準調(diào)控,形成完整的研究閉環(huán)。
喬欽禹也曾對二者的“分工”做過設(shè)想:低端、可重復(fù)的循環(huán)實驗操作,交給人工智能、自動化等技術(shù)來完成,以完成數(shù)據(jù)積累;而分析、創(chuàng)新、糾錯等操作交給人來做,例如總結(jié)規(guī)律,發(fā)明創(chuàng)造等。
李震宇提出,最佳合作模式應(yīng)由人類提出科學(xué)問題和假設(shè),人工智能設(shè)計實驗、采集數(shù)據(jù)、構(gòu)建模型并驗證人的假說。同時,人類可以根據(jù)人工智能化學(xué)實驗機器人提供的數(shù)據(jù)和反饋,調(diào)整和改進自己的化學(xué)思路和方法,共同完成更高水平的化學(xué)研究。
姚宏斌也期待,“希望整個范式更加精準化、智能化,通過人工智能自主學(xué)習(xí)和優(yōu)化,可以針對復(fù)雜環(huán)境體系得到全局最優(yōu)解,最終有望跳出原有的試錯法框架?!?/p>
技術(shù)加持下,人類科學(xué)研究的邊界在哪里
近年來,隨著人工智能算法、大數(shù)據(jù)技術(shù)等“火爆”名詞的出現(xiàn),有關(guān)“人類能否拓展科學(xué)研究邊界”的話題再度回歸。
“物理學(xué)領(lǐng)域,人類能夠探究到宇宙的起源和演化,但仍然無法解釋暗物質(zhì)和暗能量的本質(zhì);生命科學(xué)領(lǐng)域,我們已經(jīng)能夠破解基因密碼,但無法完全理解生命的起源和演化;社會科學(xué)領(lǐng)域,我們能夠通過大數(shù)據(jù)分析來研究人類行為和社會現(xiàn)象,但無法完全預(yù)測人類行為的復(fù)雜性和多樣性……”姚宏斌說,先進技術(shù)為人類探究更深層次的科學(xué)問題提供更多可能性和機會。然而,科學(xué)探究的邊界并不由技術(shù)的發(fā)展所決定,它同時被人類對自然界的認知和理解所限制著。
在他看來,當(dāng)科學(xué)技術(shù)不斷發(fā)展,人類可以更深入地探究自然界的奧秘,但科研工作者也需要不斷拓展自身認知和理解,才能更好地理解和解釋自然界的復(fù)雜和多樣。
馮毅告訴記者,當(dāng)發(fā)達的技術(shù)解放了科學(xué)家的雙手,讓他們有更多的時間去思考,激發(fā)更多創(chuàng)新性成果,大家對于科學(xué)的認知也就越深入,就會發(fā)現(xiàn)越來越多的問題和無法解釋的現(xiàn)象可以繼續(xù)探索。
喬欽禹也認為人類的科學(xué)探究沒有邊界。他說:“先進技術(shù)的出現(xiàn),就是讓我們不斷地拓展邊界。相應(yīng)的,有關(guān)部門應(yīng)該給予坐‘冷板凳’的年輕人更多物質(zhì)上和精神上的支持。對知識的渴求,永遠是人類前進的動力之一?!?/p>
江俊的觀點是懷抱更開放的胸懷和心態(tài)去提升自我。他說:“現(xiàn)階段的科研知識樹已經(jīng)無比龐大,沒有人能看到全局,我們應(yīng)該找到自己喜歡的葉面。在任何一個專業(yè),在自身專業(yè)領(lǐng)域把知識脈絡(luò)看清楚,精準、扎實掌握知識精髓。”
幾年來,他學(xué)習(xí)了很多新知識,甚至試著向本科生學(xué)習(xí)弄清一些新問題,開組會時,他甚至插不上嘴,只提供方向上的指導(dǎo)。
肖恒宇覺得,如果科學(xué)探究的邊界一詞是指科學(xué)的前沿,那么科學(xué)研究本身就是在不斷拓展科學(xué)的邊界、加強人類對自然的認知過程;如果科學(xué)探究的邊界一詞是指人類科學(xué)不能超越的限制,該限制或許就代表人類目前所能觀測到的自然現(xiàn)象的集合,當(dāng)人類所創(chuàng)造的理論、預(yù)測的自然現(xiàn)象超越了這個集合之后,就無法證實或證偽理論,使得理論失去現(xiàn)實意義。
“當(dāng)討論話題回到原點,其實人工智能是典型的問題驅(qū)動學(xué)科,相關(guān)研究尚處于初級階段。化學(xué)研究的體系是獨特且復(fù)雜的,看似簡單的化學(xué)反應(yīng),影響因素涉及分子結(jié)構(gòu)、材料性質(zhì)等。”李震宇呼吁,應(yīng)該研發(fā)專門服務(wù)于精準化學(xué)研究的人工智能新算法,發(fā)展先進的理論計算與實驗表征方法,細化到溫度、壓強、分子式等各種參數(shù),必將大幅提升化學(xué)研究效率。
他進一步解釋道:“科學(xué)研究本身就是在不斷拓展邊界、加強人類對自然的認知過程。精密的儀器、高性能的計算方法、人工智能等先進技術(shù)能夠幫助人們更快、更好地進行科研探索,在可預(yù)見的將來加速擴大科學(xué)研究的邊界。”
中青報·中青網(wǎng)記者 王海涵 來源:中國青年報
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。