總編輯圈點|新語言模型學會讀取“另類文本”,通過解碼mRNA可設計更好疫苗

2024-04-08 18:28:00 來源: 科技日報 點擊數:

科技日報記者?張夢然

最新發(fā)表在《自然·機器智能》上的一篇論文中,美國普林斯頓大學研究人員詳細介紹了一種語言模型,該模型可追蹤部分基因組序列并優(yōu)化這些序列,利用其語義表示能力來設計更有效的信使RNA(mRNA)疫苗。


新語言模型概述。
圖片來源:《自然·機器智能》

新模型的代碼包含所有生命功能的指令。基因組中每個序列都遵循復雜的語法和句法,這些結構產生了意義。正如改變幾個單詞可從根本上改變句子含義,生物序列的微小變化也可使序列編碼產生巨大差異。

科學家將遺傳信息的流動總結為“生物學中心法則”:信息從DNA轉移到RNA再到蛋白質,蛋白質創(chuàng)造活細胞的結構和功能。mRNA在最后一步(稱為翻譯)將信息轉化為蛋白質。mRNA只有一部分包含蛋白質代碼,其余部分不進行翻譯,但控制翻譯過程的重要方面。

控制蛋白質生產效率是mRNA疫苗發(fā)揮作用的關鍵機制。在對少數物種進行模型訓練后,研究人員生成了數百個新的優(yōu)化序列,并通過實驗驗證了這些結果。最佳序列的性能優(yōu)于疫苗開發(fā)的多個領先基準,其中蛋白質生產的整體效率提高了33%。

研究團隊使用經過訓練的模型創(chuàng)建了包含211個新序列的庫,每個都針對所需功能進行了優(yōu)化,提高了翻譯效率。這些蛋白質,如新冠疫苗靶向的刺突蛋白,可驅動針對傳染病的免疫反應。

新模型是第一個專注于mRNA非翻譯區(qū)域的語言模型。研究人員表示,即使是少量提高蛋白質生產效率,也會對新興療法產生重大推動作用。經過對來自少數物種的mRNA的訓練,它能解碼核苷酸序列并揭示有關基因調控的新知識。而基因調控是生命最基本的功能之一,是找到疾病和紊亂根源的關鍵。

總編輯圈點:

我們喜歡問語言模型一大堆奇奇怪怪問題,把它當成生活和工作的助手。然而,語言模型還能在制造疫苗中大顯身手。因為,在生物世界,同樣有信息流動,同樣有語言和語法。mRNA被稱為信使RNA,指導蛋白質合成。不過,它只有一部分包含蛋白質代碼,還有一部分則不翻譯。語言模型就瞄準了這些未翻譯的部分,經過訓練,提高了蛋白質生產的效率,有助于研發(fā)更好的mRNA疫苗。機器智能與生物智能結合,創(chuàng)造出了更有意思的產品。

責任編輯:常麗君

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級,繼續(xù)瀏覽

繼續(xù)瀏覽