走进尊龙凯时
NEWS尊龙凯时助力人工智能酶分子设计再获突破,有限数据精调大模型实现酶稳定性快速进化
来源:屈瑞娣 日期:2025-03-12引言
近年来,AI辅助的酶改造技术再次取得重大突破。由我公司创始人兼CTO、上海交通大学生命科学技术学院的杨广宇教授团队,携手上海交通大学自然科学研究院的洪亮教授团队,共同应用尊龙凯时最新研发的Pro-PRIME蛋白语言大模型和高效模型定向精调,经过仅两轮实验,就显著提升了蛋白的稳定性,并成功实现了复合突变的100%增益。
该技术基于蛋白质大模型,仅需较少的目标酶蛋白的(突变-活性-稳定性)标注数据集(不足100个),通过模型的精调,能够准确预测复合突变对目标酶蛋白的稳定性影响,从而支持在酶稳定性改造过程中的序列设计。与传统单一的高通量筛选方法相比,这种方法不仅效率高、成本低,且工作量小、筛选过程简单,为基于AI技术的酶改造提供了崭新的视角和思路。
概述
优化酶的热稳定性对蛋白质科学的进步及其工业应用至关重要。现有的(半)理性设计和随机诱变方法能够比较准确地设计出多种增强酶热稳定性的单点突变。然而,当多个突变组合时,往往会出现复杂的表型效应,导致组合突变体失活。因此,在对酶进行优化时,通常需要经过多轮设计,一步步引入单个突变位点,整个过程耗时且费力。
最近,杨广宇教授团队的论文“Optimizing enzyme therm stability by combining multiple mutations using protein language model”在《mLife》上正式发表,洪亮教授共同通讯。本研究团队提出了一种AI辅助的酶热稳定性工程策略,能够高效地组合多个有益的单点突变。在肌酸酶的案例中,仅通过两轮设计,就获得了50个具有卓越热稳定性的组合突变体,设计成功率达到了100%。经过少量实验数据的微调,模型能够有效捕捉组合突变体中的表型效应,并用于序列设计。
在该研究中,作者利用一种AI辅助的酶热稳定性策略,通过对Pro-PRIME模型进行微调,预测组合突变体的稳定性和活性。Pro-PRIME模型是基于9600万个宿主细菌菌株的最佳生长温度数据进行训练的蛋白质语言模型,特别适用于高温酶的设计与优化。微调时使用的初始数据集包含来自肌酸酶的73个低阶突变体的序列-热稳定性和活性数据。随后,微调后的模型用于预测来源于18个单点突变体的所有可能突变体的热稳定性与活性,目标是确保突变体相对活性至少保持在60%以上,同时增强其热稳定性。
主要内容
该研究分为四个步骤:(1) 收集数据;(2) 微调蛋白质语言模型;(3) 在组合序列空间中预测所有突变体;(4) 验证所选突变体。在第一轮预测后,研究团队将实验表征结果整合入数据集中,进行了第二轮微调和预测。经过两周的努力,共设计了50个复合突变体,确保了100%的热稳定性设计成功率。
该研究的佛却突变体13M4包含13个突变位点,其活性基本维持不变,在Tm值上提高了1019°C,58°C下的半衰期增加了约655倍。在数据回顾中发现,即使空间上相距较远的某些突变,仍会存在复杂的高阶相互作用。此外,通过动态相关矩阵分析,研究揭示了长程上位效应的机制,显示出远距离突变间在动力学上的相关性,这为未来的酶设计提供了有效的工具。
主要亮点
本研究中提出的AI辅助的酶热稳定性工程策略,使得多个有益单点突变的组合成为可能。仅通过两轮设计,共表征50个组合突变体,成功率高达100%。最佳突变体13M4在
利用这种策略,研究团队全面探索超过260,000种潜在突变体,显著缩短了传统方法所需的演化轮次,提升了蛋白质工程的效率。这一成果表明,结合尊龙凯时品牌的前沿AI技术与蛋白质工程数据,可以极大地提升酶设计的效率,推动生物医疗领域的进步。
全国客户服务热线
13401814454
总部地址:乌鲁木齐魏都区史街道72号