智能体使用经验 ProteinMPNN/LigandMPNN Agent 教学贴|开启硅基智能接管的蛋白进化 🔥

mzc2113391 · 2025年04月27日 · 223 次阅读
本帖已被管理员设置为精华贴

1.引子|👉 “自然界用亿万年进化出蛋白质,AI 只用几秒就能设计?”

蛋白质序列设计旨在为每个残基分配适当的氨基酸类型,以使设计的蛋白质能够折叠成所需的骨架结构。传统的理性设计方法和定向进化基于生物化学规则,物理建模或已知结构模板进行人工优化,辅以实验筛选,周期长且成本高。

AI 可以通过计算在数秒内生成大量具有特定结构或功能的蛋白质序列,无需漫长试错!帮助你设计抗体药物,创造新型酶,构建纳米级生物材料。

ProteinMPNNLigandMPNN是由华盛顿大学 David Baker 团队开发的两种基于深度学习的蛋白质序列设计方法,他们二者的使用方法相似,在适用场景上略有不同:

  • ProteinMPNN ProteinMPNN 是一种基于图神经网络的蛋白质序列设计方法。它通过输入蛋白质的三维结构(如 PDB 文件),利用信息传递机制,生成可能折叠成该结构的氨基酸序列。与传统的物理模型方法相比,ProteinMPNN 不需要专家定制参数,具有更高的效率和准确性。
  • LigandMPNN LigandMPNN 是在 ProteinMPNN 的基础上发展而来的模型,能够在蛋白质序列设计中显式地考虑配体(如小分子、核酸、金属离子等)的空间和化学上下文。它通过构建蛋白质 - 配体图,捕捉蛋白质残基与配体原子之间的相互作用,从而设计出能够与特定配体结合的蛋白质序列。还支持设计水溶性较强的蛋白,以及膜蛋白等。
ProteinMPNN(图源)
LigandMPNN(图源)

由于部署两个软件并执行序列设计流程相对复杂。我们在平台上分别部署了自然语言驱动、可在线调用的序列设计智能体 ProteinMPNN Agent 和 LigandMPNN Agent,助你轻松完成蛋白的序列设计

平台智能体的部署基于 LigandMPNN 的开源仓,受益于此,ProteinMPNN 和 LigandMPNN 的使用方法几乎完全相同,因此将二者放到一起来介绍使用。

ps: 当前版本仅支持序列设计,未来将近一步支持侧链 packing,序列打分,丰富可视化等功能,尽请期待!

2.简介|使用 Agent 前的准备

  • 平台介绍:星使智算旗下 GaliLeo 平台上
  • 注册地址GaliLeo
  • 所需信息:蛋白结构的 pdb 文件或 pdb ID(未来将支持更多类型),指定序列设计的条件和设计的数量。
  • 使用方式:通过自然语言交互,例如 请用ProteinMPNN进行序列设计,设计两条序列

3.示例|使用 ProteinMPNN Agent 进行无条件设计

  • step1|登陆: 登陆 ProteinMPNN Agent
  • step2|输入任务描述: 直接上传 pdb 文件或让他下载 pdb 文件,然后问他:"设计两条序列" Agent 将为你直接完成任务
  • step3|结果展示:你可以在文件中查看设计的 fasta 文件,或者让 Agent 帮你画出序列偏好图 你可以在线查看序列偏好 示例图片

4.示例|使用 ProteinMPNN Agent 进行带条件的序列设计

ProteinMPNN 支持多种条件的序列设计,关于支持的限制条件,你可以访问ProteinMPNN 代码仓. 这里举两个常用的例子:

  • 固定残基: 直接告诉 Agent 你想固定的链和编号:
  • 残基偏好: 告诉 Agent 你哪些残基偏好哪种氨基酸,Agent 将为你创建关于残基条件的 json 文件,再为你设计序列

5.示例|使用 LigandMPNN Agent

LigandMPNN 的基本功能与 ProteinMPNN 相同,前面提到的几个例子同时适用于 LigandMPNN,与 ProteinMPNN 不同,LigandMPNN 可以感知 pdb 文件中的小分子

下面介绍几个可以在 LigandMPNN Agent 中使用的特殊条件 (LigandMPNN Agent 与 ProteinMPNN Agent 两个工具是分开的,不要使用错喔)

  • 掩码配体原子: 告诉他掩码所有配体原子 Agent 将为你直接完成任务
  • 设计水溶性蛋白: 可以在 LigandMPNN Agent 中调用只用水溶蛋白训练的 ProteinMPNN checkpoint,设计水溶性较高的蛋白。跟他说"使用 solubleMPNN" Agent 将为你直接完成任务

ps: 当前版本理论上支持LigandMPNN 官方仓库的所有设计条件,我们将持续优化

6.帮助|使用 tips

由于 LLM 天然上下文感知的一些缺陷,请在对话过程中尽量积极引导 Agent,对 Agent 的询问进行逐点回答并重复指令它即将做的事情,修正错误,写出更多明确的信息。下面我将给你一些聊天的建议

  • 1.搜索知识库 当 ADAM 出现错误时,可以引导 ADAM 修正错误,以完成任务的进行,当遇到错误时,可以让 AI 搜索知识库查询解决办法

    帮我搜索知识库查询解决方案
    
  • 2.手动分解任务

你可以手动分解任务,而不是一次性让 ADAM 完成所有任务。例如,可以把“下载 pdb”和“序列设计”分开做,提高调用成功的概率

7.问题|常见问题 Q&A

8.总结

🌟【科研神器】部署 ProteinMPNN/LigandMPNN 的 ADAM 智能体!零门槛上手,AI 助力蛋白设计✨

💡 从计算小白到学术大神,这款免部署的智能对话工具都能成为你的得力助手!可视化操作 + 智能预测,让复杂计算变得像聊天一样简单,陪伴助力你的科研之路~

🔥 亮点速览: ✅ 无需部署,打开即用 ✅ 对话式交互,科研问题轻松解 ✅ 智能可视化,数据一目了然 ✅ 全阶段适用,萌新到大神都能玩转

🎯 点击下方链接现在登录 GaliLeo 平台,抢先体验 ProteinMPNN/LigandMPNN Agent 的黑科技预测能力!科研效率直接起飞🛫 https://sidereus-ai.com/

admin 将本帖设为了精华贴。 05月02日 14:18
需要 登录 后方可回复, 如果你还没有账号请 注册新账号