AI工作站

ProtGPS:麻省理工(MIT)和西湖大学共同开发的蛋白质语言模型

AI行业资讯 2025-02-13 07:56:15 

ProtGPS是一种基于深度学习的蛋白质语言模型,能够解析蛋白质序列中的化学代码,从而预测蛋白质在细胞内的特定位置。这一模型通过分析蛋白质序列中的化学信息,揭示了蛋白质如何根据其化学代码在亚细胞器中进行选择性定位。 ProtGPS的研究成果发表于2024年1月17日的《自然》杂志上。

ProtGPS:麻省理工(MIT)和西湖大学共同开发的蛋白质语言模型

ProtGPS功能特点:

1. 预测蛋白质定位

ProtGPS能够预测蛋白质在细胞内的不同冷凝相(如线粒体、内质网等)中的定位。研究表明,该模型在12种不同的冷凝相中预测蛋白质位置的准确性范围为0.83至0.95。

2. 化学代码解析

ProtGPS的核心功能是解析蛋白质序列中的化学代码,这些代码决定了蛋白质在细胞内的分布和功能。通过分析这些化学代码,ProtGPS能够指导生成具有特定细胞定位选择性的新蛋白质序列。

3. 疾病研究与药物设计

ProtGPS的应用不仅限于基础研究,还可以用于疾病研究和药物设计。例如,某些与疾病相关的突变会改变蛋白质的化学代码,从而影响其在细胞内的定位。通过ProtGPS,研究人员可以发现这些功能失调性致病位点,并开发针对性的治疗方法。

4. 实验验证

研究人员通过实验验证了ProtGPS的预测能力。例如,在实验中,研究人员根据ProtGPS生成的新蛋白质序列被成功地引入细胞,并显示出预期的定位特性。

5. 模型性能

ProtGPS在多个实验中表现出色,尤其是在处理与疾病相关的突变时,能够准确预测蛋白质的亚细胞器定位。此外,该模型还能够识别与特定冷凝相相关的蛋白质结构模式。

6. 创新性

ProtGPS是基于进化尺度转换器语言模型(ESM2)开发的,其架构允许同时学习输入序列中氨基酸之间的关系。这种创新性使得ProtGPS能够更全面地理解蛋白质的化学代码及其功能。

ProtGPS应用前景:

ProtGPS的开发为蛋白质科学研究提供了新的工具,特别是在理解蛋白质在细胞内的动态行为和功能方面。此外,该模型的应用范围广泛,包括但不限于:

- 疾病机制研究

- 药物靶点发现

- 新蛋白质序列的设计与优化。

ProtGPS项目地址:

1. GitHub仓库https://github.com/pgmikhael/protgps

2. arXiv技术论文https://www.biorxiv.org/content

标签:

阿里巴巴·绘蛙

一款AI电商营销工具!阿里巴巴·绘蛙

云雀大模型

字节跳动研发的一款先进的语言模型!云雀大模型

热门工具

热门标签

电子书AI辅助工具AI开发框架效率工具AI金融事务AIGCAI搜索引擎AI数字虚拟人投诉举报批量处理AI开放平台查询检测电影下载电影资源二次元漫画