中國西藏網(wǎng) > 即時(shí)新聞 > 國內(nèi)

一天內(nèi)篩選超一億種化合物 AI語言模型“提速”藥物發(fā)現(xiàn)

發(fā)布時(shí)間:2023-06-13 11:09:00來源: 科技日?qǐng)?bào)

  一天內(nèi)篩選超一億種化合物——

  AI語言模型“提速”藥物發(fā)現(xiàn)

  科技日?qǐng)?bào)北京6月12日電 (記者張夢(mèng)然)美國麻省理工學(xué)院和塔夫茨大學(xué)研究人員設(shè)計(jì)出一種基于大型語言模型(如ChatGPT)的人工智能算法,這種稱為ConPLex的新模型可將目標(biāo)蛋白與潛在的藥物分子相匹配,而無需執(zhí)行計(jì)算分子結(jié)構(gòu)的密集型步驟。相關(guān)論文發(fā)表在最新一期《美國國家科學(xué)院院刊》上。

  使用這種方法,研究人員可在一天內(nèi)篩選超過1億種化合物,比任何現(xiàn)有模型都要多得多。這項(xiàng)成果解決了對(duì)當(dāng)前藥物篩選的需求,其可擴(kuò)展性還能夠評(píng)估脫靶效應(yīng)、藥物再利用以及確定突變對(duì)藥物結(jié)合的影響。

  近年來,科學(xué)家在根據(jù)氨基酸序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)方面取得了巨大進(jìn)步。然而,要預(yù)測(cè)大型潛在藥物庫如何與致癌蛋白相互作用,依然具有挑戰(zhàn)性,因?yàn)橛?jì)算蛋白質(zhì)三維結(jié)構(gòu)需要大量時(shí)間和計(jì)算能力。

  麻省理工學(xué)院團(tuán)隊(duì)以他們2019年首次開發(fā)的蛋白質(zhì)模型為基礎(chǔ),此次將模型應(yīng)用于確定蛋白質(zhì)序列將與特定藥物分子的相互作用。他們用已知的蛋白質(zhì)—藥物相互作用對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使其能學(xué)習(xí)將蛋白質(zhì)特定特征與藥物結(jié)合能力聯(lián)系起來,而無需計(jì)算任何分子的三維結(jié)構(gòu)。

  通過篩選包含約4700種候選藥物分子的庫,團(tuán)隊(duì)測(cè)試了他們的模型,并確定了這些藥物與51種蛋白激酶結(jié)合的能力。

  從熱門結(jié)果中,研究人員選擇了19組“藥物—蛋白質(zhì)對(duì)”進(jìn)行實(shí)驗(yàn)測(cè)試,最終12對(duì)具有很強(qiáng)的結(jié)合親和力,而幾乎所有其他可能的藥物—蛋白質(zhì)對(duì)都沒有親和力。

  研究人員表示,藥物研發(fā)成本之所以如此高昂,部分原因是它的失敗率很高。如果能事先預(yù)測(cè)這種結(jié)合不可能奏效,就能減少失敗率,從而大大降低新藥開發(fā)的成本。

  【總編輯圈點(diǎn)】

  在我們普通人還在用語言模型聊天和寫作時(shí),科研人員已經(jīng)看到了它在藥物篩選方面的變革性潛力。藥物研發(fā)耗時(shí)漫長(zhǎng)且相當(dāng)昂貴,要做大量的“無用功”。人工智能已經(jīng)被引入這一枯燥漫長(zhǎng)的過程,幫助縮短分子配對(duì)的時(shí)間。文中介紹的新模型ConPLex可以分析大量文本,并找到最可能出現(xiàn)在一起的組合。這種基于語言模型研究的思路,超越了目前最先進(jìn)的算法,可在一天內(nèi)篩選超過1億種化合物。論文已經(jīng)對(duì)篩選結(jié)果進(jìn)行了實(shí)驗(yàn)檢測(cè),結(jié)果也令人欣喜。

(責(zé)編:陳濛濛)

版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。

阿鲁科尔沁旗| 景东| 肃宁县| 响水县| 龙江县| 三门县| 芦山县| 阜宁县| 团风县| 宁明县| 卢龙县| 油尖旺区| 泾阳县| 霍林郭勒市| 临颍县| 射阳县| 汨罗市| 南安市| 沙雅县| 巴彦淖尔市| 鄂尔多斯市| 夏河县| 灯塔市| 鱼台县| 八宿县| 亚东县| 台山市| 明光市| 饶阳县| 中阳县| 宣威市| 馆陶县| 隆尧县| 吕梁市| 余江县| 临湘市| 新昌县| 吉木乃县| 鹿邑县| 壶关县|