近日,中國科學院微生物研究所吳邊和崔穎璐團隊在《創新》(The Innovation)上發表了題為Structure-based self-supervised learning enables ultrafast protein stability prediction upon mutation的研究論文。該研究開發出基于結構自監督學習的深度學習框架Pythia。Pythia可以快速預測蛋白質突變的穩定性變化(ΔΔG)。這一研究揭示了蛋白質三維結構蘊含的進化語義信息與熱力學穩定性之間的深層關聯,并通過開源代碼(GitHub鏈接)與Web服務器技術服務體系為蛋白質工程領域提供便捷的研究工具。
蛋白質突變效應預測是解碼分子進化機制、優化蛋白質工程改造的關鍵物理量。但是,傳統預測方法面臨挑戰。一是基于物理力場的計算方法計算復雜度高,難以滿足大規模篩選需求;二是依賴于實驗數據的監督學習方法易受訓練集偏差的影響,使泛化能力受限。
該團隊提出了基于三維結構自監督學習的深度學習框架Pythia。Pythia融合了圖神經網絡與注意力機制,可直接在蛋白質結構中學習氨基酸之間的相互作用。這一“零監督”預訓練策略突破了傳統方法對標記數據的依賴性,捕獲了蛋白質折疊過程中隱藏的物理化學約束規律。
相比于傳統的力場函數方法,Pythia單點突變ΔΔG預測速度提升5個數量級,單核計算速度達到約50,000個突變/分鐘。在標準測試集S2648上,Pythia的Spearman相關系數為0.616,Pearson相關系數為0.598,性能優于現有模型。這一框架為大規模掃描蛋白質序列空間提供了高效工具。在濕實驗驗證中,Pythia在不依賴專家篩選的情況下,成功率比基于能量函數的方法提高了一倍,證明其在實際應用中的可靠性。
Pythia有望進一步拓展至蛋白質-蛋白質相互作用預測、多突變協同效應分析等復雜場景,將助力推動計算驅動蛋白質設計范式的轉型升級。
研究工作得到國家重點研發計劃、國家自然科學基金、中國科學院戰略性先導科技專項和青年創新促進會會員項目的支持。
論文鏈接
Pythia模型框架
本文鏈接:科研人員開發出基于結構自監督學習的深度學習框架http://www.lensthegame.com/show-12-748-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 首次在體外重構減數分裂DNA雙鏈斷裂形成
下一篇: 有機自旋電子器件磁響應信號調控研究獲進展