- +1
諾獎級AI再進化!AlphaFold開始揭秘生命的“組裝車間”
你還記得2024年諾貝爾化學(xué)獎頒給了誰嗎?其中之一,是一項“跨界”的技術(shù)——一個叫AlphaFold的預(yù)測蛋白質(zhì)結(jié)構(gòu)的人工智能。當時很多人驚呼:AI竟然搶了化學(xué)家的飯碗?但事實上,這場革命才剛剛開始。
最近,這位“諾獎選手”AlphaFold又進化了:它不再僅僅盯著單個蛋白質(zhì),而是開始成千上萬地預(yù)測它們是如何“成雙成對”工作的。

2024諾貝爾化學(xué)獎(圖片來源:Science)
AlphaFold 幫我們認清生命的“零件”
在理解AlphaFold最近的突破之前,我們先來回顧一下它過去的成就。
在生命科學(xué)界,蛋白質(zhì)被稱為“生命的積木”。你身體里的每一個動作——從呼吸、消化到免疫系統(tǒng)對抗病毒,全靠蛋白質(zhì)在支撐。
蛋白質(zhì)由一長串氨基酸組成,但它們并不是簡單的“繩子”,而是會扭曲、折疊成極其復(fù)雜的立體形狀。蛋白質(zhì)的結(jié)構(gòu)決定了它的功能,如果蛋白質(zhì)的折疊產(chǎn)生錯誤,人就會生病,比如阿爾茲海默癥。

蛋白質(zhì)結(jié)構(gòu)的四個層次(圖片來源:BYJU’S)
所以,只有知道了一個蛋白質(zhì)的精確形狀,科學(xué)家才能理解它是如何工作的,或者如何研制藥物來干預(yù)它的行為。過去50年,科學(xué)家為了看清一個蛋白的形狀,往往要耗費數(shù)年時間和數(shù)百萬人民幣。
直到 AlphaFold 橫空出世,這個局面才徹底被改變。
2024年諾貝爾化學(xué)獎得主德米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John Jumper)開發(fā)的這個AI,它采用了一種名為“Transformer”的神經(jīng)網(wǎng)絡(luò)架構(gòu),這也是ChatGPT等大語言模型背后的核心技術(shù)。AlphaFold學(xué)習(xí)了人類已知的所有蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù),學(xué)會了像“翻譯語言”一樣去“預(yù)測結(jié)構(gòu)”。

AlphaFold創(chuàng)始人Demis Hassabis和John Jumper(圖片來源:chessbase)
它預(yù)測的精度已能夠達到原子級水平,與耗時耗錢的實驗結(jié)果幾乎一致。但以前需要人工用數(shù)月完成的工作,現(xiàn)在只需幾小時。目前,AlphaFold已經(jīng)預(yù)測了約 2億個蛋白質(zhì)的結(jié)構(gòu),幾乎涵蓋了科學(xué)界已知的所有蛋白質(zhì)。這相當于為人類建立了一個“生命零件倉庫”,從此找零件只需要“一鍵搜索”。
零件夠了,但“組裝說明書”呢?
然而,想要解決更復(fù)雜的生命科學(xué)問題,光有零件倉庫是不夠的。
在真實的細胞工廠里,蛋白質(zhì)很少“單打獨斗”。它們更像是齒輪、連桿或剪刀的刀片。
如果你只拿到了剪刀的一個刀片,你根本沒法裁剪東西;如果你只看到了半個齒輪,你也不知道機器是怎么轉(zhuǎn)動的。
很多關(guān)鍵的蛋白質(zhì),必須由兩個或多個分子“合體”后才能工作。比如臭名昭著的HIV-1蛋白酶(艾滋病病毒攻擊人體的關(guān)鍵武器),它必須由兩個完全一樣的蛋白分子像“照鏡子”一樣扣在一起,形成一個有功能的酶,才能破壞免疫系統(tǒng)。

HIV-1蛋白酶(圖片來源:維基百科)
此前,AlphaFold的數(shù)據(jù)庫里大多是這些蛋白的“單身照片”。而現(xiàn)在,升級版的AlphaFold開始提供它們的“雙人合照”。
最新突破:170萬個“雙胞胎”合體
近日,由Google DeepMind、英偉達(NVIDIA)和歐洲分子生物學(xué)實驗室(EMBL-EBI)等機構(gòu)組成的“科研夢之隊”宣布:AlphaFold數(shù)據(jù)庫完成了重磅升級。
這次更新最核心的內(nèi)容是加入了170萬個“同源二聚體”。
什么是“同源二聚體”?簡單理解,就是兩個一模一樣的蛋白質(zhì)分子“成雙成對”結(jié)合在一起的形態(tài)。

含轉(zhuǎn)錄延伸因子 Eaf N 端結(jié)構(gòu)域蛋白的同源二聚體(圖片來源:AlphaFold)
這聽起來簡單,預(yù)測起來卻極其困難。預(yù)測兩個分子如何咬合,計算量呈指數(shù)級增長。這不僅需要AI有極其聰明的算法,還需要英偉達提供的強大的算力支持。
科學(xué)家們先是從人類、細菌、酵母等20種最重要的物種入手,預(yù)測了3000萬種可能的組合,最后精挑細選出170萬個高準確度的結(jié)構(gòu)放入數(shù)據(jù)庫。
為什么這次升級能讓新藥研發(fā)“加速”?
這次升級不僅僅是增加了數(shù)據(jù),更是為新藥開發(fā)打開了新大門。
以前,藥企想要針對某個病毒蛋白研發(fā)藥物,就像是給鎖配鑰匙。如果AI只給了你半個鎖的形狀,你配出的鑰匙大概率是打不開門的。
現(xiàn)在,有了AlphaFold提供的“組裝好”的復(fù)合體結(jié)構(gòu),科學(xué)家可以直接看準兩個蛋白結(jié)合的“縫隙”,設(shè)計藥物把它們“拆散”,讓病毒無法組裝成完整的機器。

AI讓新藥的研發(fā)加速(圖片來源:SELMAN DESIGN)
更令人興奮的是,這只是個開始。不久后,數(shù)據(jù)庫還將加入“異源二聚體”——即兩個不同零件之間的配對。那將是更大規(guī)模的“生命社交網(wǎng)絡(luò)圖譜”。
雖然AlphaFold已經(jīng)拿了諾獎,且在不斷進化,但科學(xué)家們依然保持著一份冷靜。
AI的預(yù)測雖然“神速”,但偶爾也會產(chǎn)生幻覺。這些預(yù)測出的模型更像是給科學(xué)家的“導(dǎo)航地圖”,指引我們要去哪里探索,但最后的真相,依然需要科學(xué)家在實驗室里通過真實的生物實驗來驗證。
從“認清零件”到“看懂組裝”,AI正在幫我們一頁頁翻譯那本深奧的《生命說明書》。也許在不遠的將來,人類對抗疾病的方式,將因為這些“成雙成對”的蛋白質(zhì)模型而改變。
撰稿\張一凡
參考資料:
[1]. 《自然》雜志Nature → AlphaFold database hits ‘next level’: the AI system now includes protein pairing
[2]. 麻省理工科技評論 → What’s next for AlphaFold: A conversation with a Google DeepMind Nobel laureate
[3]. AlphaFold
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




