twitter 巨臀布景twitter 巨臀
基于骨架结构的卵白质序列谋略是全新卵白质谋略的要津问题之一。比年来,跟着深度学习按序和本领的发展,全新卵白质序列谋略取得了进犯进展。其中代表性的使命包括ProteinMPNN,ABACUS-R,ProDesign-LE等,齐在序列谋略中取得了进犯进展,并进行了相应的实践考据。然而,这些代表性的按序在模子历练和截止输出中均莫得顺利沟通卵白质侧链的原子细节信息。一方面,卵白质侧链构象对卵白质扩充功能具有进犯作用。另一方面,大齐的序列设推测法依赖结构瞻望来评估谋略序列的可靠性,而单序列结构瞻望依旧是一个特殊大的挑战。近期,北京大学来鲁华/张长胜团队发展了全原子卵白质序列谋略的深度学习算法GeoSeqBuilder,这一恶果近期发表于Angewandte Chemie1,著述初稿2024年3月以预印本容貌发表2。GeoSeqBuilder在生成序列的同期,也给出了高精度的侧链构象,不错更顺利给出原子之间的互相作用,不需要进行单序列结构瞻望。GeoSeqBuilder在自然卵白质结构、全新谋略结构和酶的序列谋略的实践测试中赢得了高顺利率,领略的晶体结构与谋略结构模子在原子范例细节上高度吻合。
模子框架及截止
GeoSeqBuilder主要包含三部分:(1)多范例图卷积汇集用于学习中心残基周围5阶邻居的环境信息;(2)三角汇集用于暗示学习残基水平的二体和三体互相作用;(3)迭代模块基于以上汇集从肇始序列动身更新序列,多步迭代后得到握住序列。GeoSeqBuilder最终输出谋略序列对应的卵白质全原子模子。具体见图1.
图1GeoSeqBuilder框架图
GeoSeqBuilder在CATH4.3数据集上进行历练和考据,序列规复率达到了52%,与ProteinMPNN等按序的发达雷同。此外,GeoSeqBuilder谋略出来的诸君点的残基类型时时和野生型具有一样的物理化学性质。GeoSeqBuilde生成的各式残基的品貌与自然卵白雷同。GeoSeqBuider对侧链构象瞻望的截止也远优于基于传统能量函数的按序FASPR和Scwrl4(见图2)。
图2.GeoSeqBuilder的序列和侧链构象瞻望截止
该使命最初遴荐了两个典型的卵白质折叠骨架对GeoSeqBuilder生成的序列进行实践考据,包括自然硫氧还原卵白(1FB0)和通过幻念念模子东谈主工谋略的螺旋束骨架(0705)。作家诀别为其谋略了9条和6条序列,这些序列均不错在大肠杆菌中以可溶容貌抒发。对硫氧还原卵白再行谋略的序列具有很高的热雄伟性,热变性温度较野生型卵白素质了40摄氏度,X-射线晶体学结构领略标明谋略的全原子模子与所解出的晶体结构高度吻合,而况谋略卵白质领有新的疏水堆积中枢,具体见图3。
图3GeoSeqBuider顺利为靶标1FB0和0705谋略了序列,谋略模子与晶体结构高度一致
以上截止标明GeoSeqBuilder学习到了卵白质折叠结构和序列的关系,不错在保合手卵白质折叠结构正确性的同期谋略出新的疏水中枢。一般以为疏水中枢在卵白序列的当然进化流程中是比拟保守的,疏水中枢再行谋略后的卵白是否还会保合手原有的功能是一个很真谛真谛的问题。作家遴荐细胞铁物化中的要津卵白谷胱甘肽过氧化物酶(gpx4, PDB代码2obi)动作商榷对象,固定gpx4的溶剂披露残基位点,只谋略gpx4的疏水中枢区域,并遴荐5条序列进行实践考据,其中4条序列的卵白不错测出gpx4的酶响应活性,3条活性高于野生型卵白。作家随后解出了这4个有酶活性的谋略卵白的高分辨晶体结构,均与推测谋略的结构模子在原子水平上高度一致(图4)。
图4利用GeoSeqBuilder为靶标gpx4谋略了5种新的疏水中枢堆积形态,其中3条序列对应卵白的酶活性有显耀素质。
纪念
该使命发展了一种基于卵白质骨架结构和全原子模子的序列谋略按序GeoSeqBuilder。该按序所谋略的卵白质可溶性好、抒发量和热雄伟性高,不错折叠成预谋略的卵白质结构。值得注目的是,GeoSeqBuilder不仅提供了与实践结构一致的侧链构象,新谋略的序列还提供了种种化的疏水中枢堆积形态,从而扩大了序列景不雅。GeoSeqBuilder不仅在卵白质序列从新谋略中具有进犯真谛,而且为卵白质工程和卵白质序列结构关系商榷提供了新的视角。GeoSeqBuilder现在已开源(https://github.com/PKUliujl/GeoSeqBuilder),为卵白质干系的科学商榷和坐蓐修复提供了牛逼的用具。
该使命的第一作家为北大-清华人命科学长入中心2020级商榷生刘佳乐,通信作家为北京大学化学与分子工程学院/前沿交叉学科商榷院定量生物学中心/北大-清华人命科学长入中心/北京大学成齐前沿交叉生物本领商榷院来鲁华诠释和北京大学化学与分子工程学院张长胜副商榷员。北大-清华人命科学长入中心商榷生郭政、北大化学学院博士后由瀚天对该使命的完成作念出了进犯孝顺。干系使命得到了国度重心研发辩论(2022YFA303700)和国度当然科学基金委员会技俩(21977007, 22237002, T2321001)的资助。
参考文件
[1] Jiale Liu, Zheng Guo, Hantian You, Changsheng Zhang*, and Luhua Lai*. All-Atom Protein Sequence Design Based on Geometric Deep Learning.Angew. Chem. Int. Ed. 2024, e202411461.
[2] Jiale Liu, Zheng Guo, Changsheng Zhang*, and Luhua Lai*. All-atom protein sequence design based on geometric deep learning. bioRxiv (2024): 2024-03.
论文伙同
888米奇第四色在线avhttps://onlinelibrary.wiley.com/doi/10.1002/anie.202411461