21個物種的“阿爾法折疊2”結(jié)構(gòu)模型中特征結(jié)構(gòu)元素的空間。圖片來源:《自然·結(jié)構(gòu)與分子生物學》
科技日報實習記者 張佳欣
據(jù)最近發(fā)表在《自然·結(jié)構(gòu)與分子生物學》上的論文,包括西班牙何塞·卡雷拉斯白血病研究所癌癥免疫遺傳學小組負責人愛德華·波爾塔博士在內(nèi)的一個團隊,比較了現(xiàn)有可用的新結(jié)構(gòu)得出結(jié)論:“阿爾法折疊2”為任何給定物種貢獻了額外25%的高質(zhì)量蛋白質(zhì)結(jié)構(gòu)。
“阿爾法折疊2”是深度思維公司開發(fā)的一種神經(jīng)網(wǎng)絡,專門用于根據(jù)蛋白質(zhì)的氨基酸序列精確解析蛋白質(zhì)的3D結(jié)構(gòu)。
“阿爾法折疊2”數(shù)據(jù)庫已經(jīng)發(fā)布了21種模式生物的典型蛋白質(zhì)亞型的預測,幾乎涵蓋了365198個蛋白質(zhì)中的每一個殘基。這大約是蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(PDB)中實驗結(jié)構(gòu)數(shù)量的兩倍,獨特蛋白質(zhì)數(shù)量的六倍。
許多蛋白質(zhì)在癌癥等疾病中發(fā)揮的關(guān)鍵作用已為人所知,但科學家缺乏對它們在分子水平上的功能的深入了解。這些結(jié)構(gòu)信息將幫助科學家更好地了解這些蛋白質(zhì),了解它們可能在細胞內(nèi)與哪些其他分子相互作用,并設計能夠在它們改變時干擾其功能的新藥。
“阿爾法折疊2”的功能也有局限性。團隊發(fā)現(xiàn),該算法在試圖重建蛋白質(zhì)復合體時存在問題。大多數(shù)蛋白質(zhì)與其他蛋白質(zhì)一起完成生物功能,因此極其需要預測不同蛋白質(zhì)是如何粘在一起的。另一個局限性是它無法顯示突變蛋白質(zhì)的結(jié)構(gòu),突變通常會導致蛋白質(zhì)功能異常,是癌癥等許多疾病的原因。
盡管如此,團隊認識到“阿爾法折疊2”將在未來幾年極大地影響基礎和生物醫(yī)學研究。這不僅歸功于它的直接貢獻,即數(shù)千個新的可靠的3D蛋白質(zhì)模型,而且還因為它開啟了一個基于人工智能的計算工具的新時代,能夠產(chǎn)生沒有人能預料的結(jié)果。
事實上,這個時代已經(jīng)開始了。最近,“臉書”母公司Meta的一個團隊使用了其自然語言預測器的修改版本來“自動補全”蛋白質(zhì)。這款名為ESMFold的人工智能工具似乎沒有谷歌的同類工具那么準確,但速度要快60倍,并可以克服一些已知的“阿爾法折疊2”的局限性,例如處理突變的序列。
正如論文作者所言,“‘阿爾法折疊2’和即將到來的工具的應用將對生命科學產(chǎn)生革命性的影響”。