科技日報(bào)記者 張夢然
在今年諾貝爾化學(xué)獎表彰計(jì)算蛋白質(zhì)設(shè)計(jì)領(lǐng)域的重大進(jìn)展后,美國能源部阿貢國家實(shí)驗(yàn)室團(tuán)隊(duì)宣布開發(fā)出一種名為MProt-DPO的創(chuàng)新計(jì)算框架,該框架利用人工智能(AI)和世界頂尖的超級計(jì)算機(jī),推動蛋白質(zhì)設(shè)計(jì)取得新突破。這一成就標(biāo)志著向AI自主科學(xué)發(fā)現(xiàn)邁出了重要一步。
MProt-DPO框架的關(guān)鍵在于其能將傳統(tǒng)的蛋白質(zhì)序列數(shù)據(jù)與實(shí)驗(yàn)結(jié)果、分子模擬及基于文本的敘述相結(jié)合。這一特性有望大幅加速蛋白質(zhì)發(fā)現(xiàn),特別是在疫苗開發(fā)和環(huán)保酶設(shè)計(jì)等領(lǐng)域。
蛋白質(zhì)設(shè)計(jì)的核心挑戰(zhàn)之一是從氨基酸序列預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)及其功能。由于蛋白質(zhì)的氨基酸組成極其復(fù)雜,即使是微小變化也會導(dǎo)致成千上萬種不同的可能性。因此,傳統(tǒng)實(shí)驗(yàn)方法難以高效完成。鑒于此,團(tuán)隊(duì)結(jié)合了大型語言模型(LLM)和超級計(jì)算機(jī)的強(qiáng)大算力。
團(tuán)隊(duì)利用了包括阿貢國家實(shí)驗(yàn)室的“極光”在內(nèi)的多個頂級超級計(jì)算機(jī)。這些超算不僅支持模型訓(xùn)練和微調(diào),還能夠執(zhí)行大規(guī)模的分子模擬,驗(yàn)證所設(shè)計(jì)蛋白質(zhì)的穩(wěn)定性和催化活性。MProt-DPO框架已經(jīng)在多個平臺上實(shí)現(xiàn)了超過1 exaflop(百億億次浮點(diǎn)運(yùn)算)的持續(xù)計(jì)算,其中在“極光”上的峰值算力達(dá)到了5.57 exaflop。
MProt-DPO框架的算法使得AI模型可以從結(jié)果中學(xué)習(xí),不斷改進(jìn)設(shè)計(jì)。這種方法類似于人類專家根據(jù)實(shí)驗(yàn)結(jié)果調(diào)整研究方向的過程,但速度更快,處理的數(shù)據(jù)量更大。
團(tuán)隊(duì)已在兩項(xiàng)蛋白質(zhì)設(shè)計(jì)任務(wù)上測試了MProt-DPO框架,分別是優(yōu)化酵母蛋白HIS7的突變性能和提高蘋果酸脫氫酶的催化效率。結(jié)果顯示,AI設(shè)計(jì)的蛋白質(zhì)表現(xiàn)良好,達(dá)到了預(yù)期效果。
團(tuán)隊(duì)稱,新框架不僅能夠從海量“候選者”中篩出有潛力的蛋白質(zhì),還能探索自然界中尚未存在的蛋白質(zhì)。這促進(jìn)了生物技術(shù)和醫(yī)藥領(lǐng)域的創(chuàng)新與發(fā)展,對于應(yīng)對全球健康和環(huán)境問題具有重要意義。