智能体使用经验 RFdiffusion Agent 教学贴 | 让蛋白结构设计“脱口而出” 💬

mzc2113391 · 2025年04月26日 · 191 次阅读
本帖已被管理员设置为精华贴

1.引子|什么是蛋白结构设计

蛋白质是生命体系中最重要的功能分子之一,承担了从催化化学反应到支撑细胞结构等各种关键任务。蛋白结构设计(Protein Structure Design)指的是根据预期功能或目标,设计新的蛋白质三维结构,从而创造具有特定性质或活性的蛋白质。

RFdiffusion 是由华盛顿大学 David Baker 团队开发的一种基于扩散模型的蛋白质结构生成方法。​它将 RoseTTAFold 的结构预测能力与扩散生成模型相结合,能够从头设计出具有特定功能的蛋白质结构,它能够帮你完成下列任务:

从头设计蛋白质单体:​生成具有特定拓扑结构的新蛋白质。

蛋白质结合剂设计:​设计能够特异性结合目标分子的蛋白质。

对称性寡聚体设计:​构建具有特定对称性的蛋白质复合物。

酶活性位点支架设计:​为酶的活性位点设计稳定的结构支架。

RFdiffusion(图源:RFdiffusion)

由于部署 RFdiffusion 并执行结构设计流程相对复杂。我们在平台上部署了一个自然语言驱动、可在线调用的结构设计智能体——RFdiffusion Agent,助你轻松完成蛋白的结构设计

ps: 1.0.0 版本支持从头设计蛋白质单体,蛋白质结合剂设计和酶活性位点支架设计,未来将上线更多功能

2.简介|使用 RFdiffusion Agent 前的准备

  • 平台介绍:RFdiffusion Agent 是星使智算旗下 GaliLeo 平台上的一款蛋白结构设计智能体。
  • 注册地址GaliLeo
  • 所需信息:蛋白结构的 pdb 文件或 pdb ID(未来将支持更多类型),指定设计的条件,设计的长度和设计的数量。
  • 使用方式:通过自然语言交互,例如 请帮我无条件设计10个蛋白

3.示例|使用 RFdiffusion Agent 进行无条件设计

  • step1|输入任务描述: 直接问他:"帮我无条件设计 2 个蛋白,长度为 50-100"(长度可以是可变范围,RFdiffusion 将为你随机生成) Agent 将为你直接完成任务
  • step2|结果展示:你可以在文件中预览或下载设计的结构

完整对话链接

4.示例|使用 RFdiffusion Agent 进行配体设计

该任务是使用 RFdiffusion​设计能够特异性结合目标蛋白的蛋白质。

  • step1|询问可行链: 此时的结构设计需要配体作为条件,你需要找到蛋白质中可行的结构域 (链 ID 和连续的氨基酸 ID 范围,不含断裂),并把它提供给 Agent 如果你对蛋白结构很熟悉,你可以将蛋白结构在本地用可视化软件如pymol打开,查看它有的链和可行的范围,在这里,我们的结构是一个只有 A 链的蛋白胰岛素受体,氨基酸编号从 1-150 号连续。我们设计的配体条件就是"A 链的 1-150 号氨基酸"

我们建议你对自己想设计的蛋白提前有所了解,当然,如果你完全是小白,你也可以把结构上传到 Agent 平台,并询问 Agent:"帮我看一下设计的可行链"

AI 将为你提供可行的链和连续的编号范围,你可以参考它给出的可行链来提供条件设计配体

  • step2|输入任务描述: 接下来,你可以告诉 Agent 的条件并进行结构设计了。在这个任务中,如果你有需求,你可以指定“热点残基”,它指的是在蛋白质 - 蛋白质相互作用或蛋白质 - 配体结合中,对结合自由能贡献显著的关键氨基酸残基。你还需要指定设计的长度和设计的数量

Agent 将为你直接完成任务,你可以在文件中预览或下载设计的结构

完整对话链接

5.示例|使用 RFdiffusion Agent 进行功能位点支架

该任务是使用 RFdiffusion​为酶的活性位点或其他功能位点设计稳定的结构支架。

  • step1|询问可行链: 此时的结构设计需要以功能位点为条件,你也需要找到蛋白质中可行的结构域 (链 ID 和连续的氨基酸 ID 范围,不含断裂),请参考上面的示例询问可行链
  • step2|输入任务描述: 接下来,你可以告诉 Agent 你的功能位点条件并进行结构设计了。在这个任务中,你通过指定功能位点两端支架的长度来指定设计长度,然后指定设计数量。 Agent 将为你直接完成任务,你可以在文件中预览或下载设计的结构

完整对话链接

6.帮助|使用 tips

由于 LLM 天然上下文感知的一些缺陷,请在对话过程中尽量积极引导 AI 做事,对 ADAM 的询问进行逐点回答并重复它即将做的事情,修正错误,写出更多明确的信息。下面我将给你一些聊天的建议

  • 1.对 AI 的内容进行逐点恢复

仔细阅读 AI 询问的内容并进行逐点回复,加强行为指示,例如当 Agent 回答

但目前我还不清楚你想要设计的配体长度、设计的蛋白数量以及是否指定了热点残基,同时默认保存的前缀为binder_outputs/binder_design,你是否需要修改这个保存前缀呢?请提供这些信息,以便我能准确地为你运行RFdiffusion进行蛋白配体设计。

你可以回答:

不需要修改前缀,设计长度为30,设计2个蛋白。

这样进行逐点回复让 Agent 明确你的信息

  • 2.搜索知识库

当 ADAM 出现错误时,可以引导 ADAM 修正错误,以完成任务的进行,当遇到错误时,可以让 AI 搜索知识库查询解决办法

帮我搜索知识库查询解决方案

  • 3.手动分解任务

你可以手动分解任务,而不是一次性让 ADAM 完成所有任务。例如,可以把“下载 pdb”和“结构设计”分开做,提高调用成功的概率

7.问题|常见问题 Q&A

8.总结

🌟【科研神器】部署 RFdiffusion 的智能体 ADAM!零门槛上手,AI 助力蛋白设计✨

💡 从计算小白到学术大神,这款免部署的智能对话工具都能成为你的得力助手!可视化操作 + 智能预测,让复杂计算变得像聊天一样简单,陪伴助力你的科研之路~

🔥 亮点速览: ✅ 无需部署,打开即用 ✅ 对话式交互,科研问题轻松解 ✅ 智能可视化,数据一目了然 ✅ 全阶段适用,萌新到大神都能玩转

🎯 点击下方链接现在登录 GaliLeo 平台,抢先体验 RFdiffusion Agent 的黑科技预测能力!科研效率直接起飞🛫 https://sidereus-ai.com/

admin 将本帖设为了精华贴。 04月26日 15:03
需要 登录 后方可回复, 如果你还没有账号请 注册新账号