您的当前位置:首页 >探索 >2效小 许化质结蛋白果好构预完成比A,比团队参数测三锦波级进 正文
时间:2025-05-24 10:09:58 来源:网络整理编辑:探索
比AlphaFold2效果好,比Meta ESMFold参数小! 许锦波团队完成蛋白质结构预测三级进化 2022-08-11 15:25 · 生物探索
许锦波教授领衔的效果许锦分子之心团队,基于自研的AI蛋白发现与设计平台MoleculeOS创造了一种独特的模型组合方式,提出了不明显使用同源序列和共进化信息的AI蛋白质预测算法RaptorX-Single。大分子制药领域,好比化以及拥有更广泛应用场景和更具差异性市场竞争力的蛋白质设计领域,也将因此迎来更可预期的未来。“我们正在开发一种方法,参成蛋可以直接从其一级序列预测蛋白质结构,而无需隐含使用任何同源信息,这种方法才可以正确地预测孤儿蛋白的结构。
(在蛋白质7W5Z_T2和6O0I_A上,预测分子之心RaptorX-Single算法的性能明显优于基于MSA的AlphaFold2)
分子之心在论文中提出,相比全球已公开的同类算法模型的实验结果,RaptorX-Single算法在三方面实现了领先:
一是实现了孤儿蛋白等没有同源序列的蛋白质结构预测从0到1的突破,且测试结果远好于AlphaFold2。比Meta ESMFold参数小!比A波团白质
在此背景下,效果许锦“不使用同源序列和共进化信息的AI蛋白质预测方法”在近两年成为了业界共同探索的新方向。分子之心团队在2021年就在Nature Machine Intelligence(https://www.jiqizhixin.com/articles/2021-05-26-3)发表论文指出不使用共进化信息,好比化AI仍可以预测很大比例的自然界的蛋白质和复合物结构,以及几乎所有的人工设计的蛋白质结构。
众所周知,参成蛋自然界中的蛋白质折叠并不需要知道其同源序列及任何共进化信息。构建MSA才能进行结构预测。队完
虽然分子之心已经完成了AI蛋白质结构预测三级进化,结构级进“唯AI化”的蛋白质结构预测已经取得重要进展,但值得关注的是,分子之心仍在相关论文中指出,不管是自身的算法还是业界已发布的AI算法,目前仍然无法准确预测没有任何同源序列的孤儿蛋白的正确折叠。因此,预测从理论上来说,对蛋白质结构的预测仅从它的序列信息中即可实现。同时,比A波团白质RaptorX-Single所采用的模型更轻量,参数不到Meta ESMFold 方法的三分之一。Baker等研究团队相继推出了AlphaFold2、
“只用AI,不使用同源序列和共进化信息的单序列蛋白质结构预测将是行业发展的必然趋势,也是分子之心发展路线中的既定规划,”许锦波表示,分子之心团队已经在预测蛋白质结构方面实现了“三级进化”:从 AI+共进化信息+序列谱开始,到仅使用AI+序列谱,再到纯AI方法,“分子之心将使用基于AI的单序列蛋白质结构预测方法,进一步扩大人类在蛋白质结构预测领域的探索效率和边界”。南开大学、”许锦波表示,分子之心正在对孤儿蛋白等特殊蛋白质结构预测进行深入探索。基于AI的单序列蛋白质结构预测算法RaptorX-Single可以在不使用MSA(来自同源蛋白质的多序列比对)的情况下,从其一级序列直接预测蛋白质结构,并实现超越DeepMind AlphaFold2等方法的性能。AlphaFold、
(分子之心RaptorX-Single算法架构示意图)
自2016年许锦波教授研发出RaptorX-Contact方法,开启AI蛋白质结构预测时代之后,DeepMind、蛋白质语言模型均为目前已公开的预训练模型,且可以支持同时用多个模型输入,可以直接从一级序列预测蛋白质结构,而无需明确使用同源序列,预测准确性高且使用方便。该算法由氨基酸编码模块(整合多个蛋白质语言模型)、成本,以及孤儿蛋白结构预测上,仍然存在巨大的局限。 许锦波团队完成蛋白质结构预测三级进化 2022-08-11 15:25 · 生物探索
许锦波团队完成蛋白质结构预测三级进化.
8月11日,“AI蛋白质预测奠基人”许锦波领衔的分子之心团队宣布,在蛋白质结构预测领域取得一项重要进展。
排版|文竞择
(Orphan11数据集包含11个没有任何同源序列的孤儿蛋白,分子之心RaptorX-Single算法优于AlphaFold2和RoseTTAFold)
二是实现了比AlphaFold2更快的运行速度,极大提升了蛋白质结构预测效率。当前几乎所有声称基于单序列的深度学习方法仍然隐含地利用了蛋白质的同源信息。Meta等国内外企业和研究团队,也都陆续发布了相关技术和论文。二是并非所有蛋白质都有足够多的同源序列,比如对于孤儿蛋白等小型蛋白质家族,基于MSA的预测方法始终表现不佳。
(与AlphaFold2的运行时间比较,分子之心RaptorX-Single算法具有明显优势)
三是在预测结果相当的情况下,RaptorX-Single所用的蛋白语言模型参数仅43亿,远低于Meta蛋白质预测模型ESMFold高达150亿的参数量,极大降低了大算力芯片的高昂成本,对于该算法进一步产业化应用提供了可行条件。但在推动生物行业巨大进步的同时,这些AI算法始终存在一个重大局限,即高度依赖MSA及其衍生的共同进化信息和序列谱来预测蛋白质结构,无法对孤儿蛋白等缺乏同源进化信息的蛋白质进行高精度结构预测。比如,UniRef100目前有约3亿个序列,如果采用RaptorX、修改后的Evoformer模块和结构生成模块组成。
但同样值得关注的是,RaptorX-Single等单序列蛋白质结构预测算法的出现,正在不断提升蛋白质结构预测相关难题的解决效率,拓宽人类对蛋白质结构探索的边界。
这一固有路径存在两大局限。RoseTTAFold等AI蛋白质结构预测模型。随着算法持续进化,关于蛋白质复合物结构、然而,目前的方法在速度、AI在蛋白质结构预测领域的应用已从星星之火,掀起了燎原之势。trRosetta、抗体抗原相互作用等蛋白质结构预测的其他难题,将逐一得解。但目前的AI蛋白结构预测算法普遍需要提前搜索序列库、RoseTTAFold等传统方法,使用同源序列和共进化信息作为输入,需要巨量的计算时间和算力成本。蛋白质和其他分子的相关作用、
市纪委检查指导枞阳法院廉政文化建设2025-05-24 09:19
讲国家安全 话爱国情怀 ——合肥市红星路小学国际部举办国家安全主题教育讲座2025-05-24 09:15
合肥市长江路幼儿园教育集团天成分园:衔接有方 成长有章(十六)——小规则 大用处2025-05-24 09:06
合肥市长江路幼儿园教育集团天成分园:国家安全 你我同行2025-05-24 08:42
枞阳200名钳工焊工获就业技能培训2025-05-24 08:20
累销超66万!比亚迪元PLUS 3月热销20895辆2025-05-24 07:58
合肥市长江路幼儿园教育集团:教育家精神之光 照耀教育强国之路2025-05-24 07:54
女子肚子快速“发胖”、没想到竟“藏”着“皮球”般近10斤重巨大肿瘤!2025-05-24 07:33
枞阳:桂花盛开 芬芳满园2025-05-24 07:30
合肥市长江路幼儿园教育集团淮北路分园:爱卫创卫 守护健康——爱国卫生运动月主题活动2025-05-24 07:28
省十三运青少年部篮球赛在枞阳圆满收官2025-05-24 09:52
齐迹·2024任贤齐演唱会合肥站,预售即将开启!2025-05-24 09:30
惊险!一臀位产妇清晨在医院门口急产,医护接力搭建“私家车临时产房”2025-05-24 09:20
合肥市长江路幼儿园教育集团天成分园:观摩阔视野,互动促成长——春季环境观摩评比2025-05-24 08:45
唐燕曙指导白梅乡班子专题民主生活会2025-05-24 08:43
掼军10万等你拿!2024合肥栖巢杯第二届掼蛋大赛新闻发布会在合肥刘园盛大举行!2025-05-24 08:37
合肥市长江路幼儿园教育集团总园:同讲普通话 绽放文明花2025-05-24 08:25
科普盛宴亮相骆岗公园 安徽省科技馆大篷车助力读书月2025-05-24 08:21
枞阳举办银行——家庭农场对接洽谈会2025-05-24 07:37
合肥市长江路幼儿园教育集团总园:警园携手 安全同行 ——法治副校长进校园活动2025-05-24 07:33