智能体使用经验 Protenix Agent 教学贴|10 分钟搞定蛋白核酸小分子结构预测🚀

mzc2113391 · 2025年04月25日 · 最后由 Lin_Xiaohan 回复于 2025年04月25日 · 287 次阅读
本帖已被管理员设置为精华贴

1.引子|为什么要用 AI 预测分子结构

  • 解析生命:传统的结构解析方法如 X 射线晶体学、核磁共振谱以及冷冻电镜,往往耗时昂贵,且在解析某些复杂或动态体系时面临重大挑战
  • 药物研发:AI 可在数小时内预测潜在药物靶点的 3D 结构,结合分子对接模拟,快速评估药物 - 靶标结合能力,减少湿实验试错成本,缩短药物发现周期
  • 功能研究:AI 预测可揭示突变对蛋白质折叠的影响(如癌症相关突变),模拟蛋白质构象变化与功能关系,指导功能机制研究

AI 生物大分子结构预测方法(如AlphaFold,RoseTTAFold-All-Atom)部署门槛高、算力消耗大、流程复杂。我们是一个能够完全免部署、自然语言驱动、可在线调用的智能体,集成了当前生物分子结构预测 SOTA 模型——字节跳动 AML AI4Science 团队开发的 Protenix(Chen et al. (2025). bioRxiv),助你轻松完成蛋白和小分子结构预测的相关任务!

Protenix 效果图 (图源:Protenix)

2.简介|使用 Protenix Agent 前的准备

  • 平台介绍:Protenix Agent 是星使智算旗下 GaliLeo 平台上的一款蛋白结构智能体。
  • 注册地址GaliLeo
  • 所需信息:蛋白的序列 (语言描述或 fasta 文件) 或结构文件 pdb,cif 等 (现在支持让 Agent 下载 pdb,未来将支持更多样的输入如 uniprot ID), 小分子的 mol2,sdf 文件,Chemical Component Dictionary (CCD) code, SMILES 等
  • 使用方式:通过自然语言交互,例如 我上传了一个fasta文件, 帮我预测所有蛋白的结构

3.实操|实操演示

  • step1|登陆:打开 GaliLeo 平台,进入 Protenix Agent 界面
  • step2|输入任务描述
  • step3|AI 执行工作流:Agent 会自动识别输入,调用 Protenix 进行预测结构任务,期间它可能询问你的需求,请针对 AI 的需求进行逐点回复。在某些情况,AI 可能会遇到错误,他会尽可能自动修复,请尽可能引导他完成任务。

  • step4|结果展示:你可以在文件中查看或下载预测的结构,完成后续的分析,例如 TMscore 计算等。

4.帮助|更多案例和帮助

蛋白单体及复合物的结构预测

对于该任务,你可以在聊天框中将你的需求告诉 ADAM,它将自动帮你完成标准格式的输入并预测结构。例如:

帮我预测一下蛋白GAMGSSTSG的结构
帮我预测一下蛋白复合物的结构,序列分别是GAMGSSTSG,GAMGSSTAG,GAMGAAAGMG

批量蛋白结构预测

如果你有批量的蛋白想预测结构,你可以将其整理为如下格式 fasta 文件,如果是复合物,请在链间用:隔开

example.fasta:

>Protein_A_monomer
GAMGSSTSG
>protein_B_multimer
GAMGSSTSGGAMGSSTAG:GAMGAAAGMGGAMGAAAGMG

你需要在聊天框上传这个 example.fasta,然后与 ADAM 对话:

我上传了一个fasta文件,帮我预测所有蛋白的结构

蛋白,小分子,核酸复合物的结构预测

对于更复杂的复合物体系,聊天框中支持多样化的对话和上传方式以完成你的需求:

直接对话:

通过对话的方式告诉 ADAM 需求,你可以在聊天框告诉 ADAM 蛋白序列,核酸序列以及小分子的 SMILES 或者 CCD code (Chemical Component Dictionary (CCD) code ),你可以在CCDcode 下载链接CCDcode 帮助文档中了解 CCD code,以及修饰 (也需要用 CCD code) 以及共价键等需求,完成结构预测,例如:

帮我预测下面的复合物结构:

蛋白序列:GAMGSSTSG
小分子smiles: C[C@]12CCc3c(ccc4cc(O)ccc34)[C@@H]1CCC2=O
帮我预测下面的复合物结构:
蛋白序列:GAMGSSTSG
小分子CCD code: ATP

你也可以更加灵活的 balabala 输入大白话

帮我预测蛋白序列GAMGSSTSG和和小分子C[C@]12CCc3c(ccc4cc(O)ccc34)[C@@H]1CCC2=O的复合物结构,蛋白序列的1号残基有HY3修饰(注意,这里的修饰必须是CCD code),蛋白序列的2号残基和小分子C1原子有共价键

如果你不确定修饰或者小分子的 CCD code,你可以问 ADAM,但搜索到的信息不一定是准确的,所以更推荐你使用 smiles 或者提前调研 CCD code,通过聊天框告诉 ADAM

请帮我调用知识库搜索乙醇的ccd code
上传文件:

你可以上传带有蛋白,小分子和核酸的复合物 pdb 或者 cif 文件或者让 ADAM 下载 pdb 文件

我上传了一个pdb文件,帮我重新预测其结构
请下载PDB 1BC8,重新预测它的结构,并计算TMscore

你也可以单独上传部分文件,例如你可以单独上传一个 mol2 文件,然后对话说明额外信息:

我上传了一个小分子的mol2文件,帮我预测一下它和蛋白序列GAMGSSTSG的复合物结构

注意,当前版本虽然支持灵活的上传和对话来实现需求,但可能不稳定,如出现错误请及时反馈。

PS/tips

由于 LLM 天然上下文感知的一些缺陷,请在对话过程中尽量积极引导 AI 做事,对 ADAM 的询问进行逐点回答并重复它即将做的事情,修正错误,写出更多明确的信息。下面我将给你一些聊天的建议

  • 1.加强指示

重复 AI 要进行的动作来加强行为指示,例如当 AI 回复:

目前已经完成格式转换和msa搜索步骤,接下来我进行结构预测。

你可以回答:

好的,请继续预测结构

这样比简单回答继续调用工具成功的概率高。

  • 2.引导 AI 修复错误

当 ADAM 出现错误时,可以引导 ADAM 修正错误,以完成任务的进行,如 ADAM 返回

在进行msa搜索时出现了错误,报错信息显示 ./protenix_task.json 文件不存在。我将重新保存汇总的json文件到指定路径,然后再次进行msa搜索。

你可以回答:

重新保存再搜索吧

这样可以引导 ADAM 修正错误,以完成任务的进行

  • 3.手动分解任务

你可以手动分解任务,而不是一次性让 ADAM 完成所有任务。例如,可以把“下载 pdb”和“预测结构”分开做,提高调用成功的概率

5.问题|常见问题 Q&A

6.总结

🌟【科研神器】部署 Protenix 的 ADAM 智能体!零门槛上手,AI 助力分子结构预测✨

💡 从计算小白到学术大神,这款免部署的智能对话工具都能成为你的得力助手!可视化操作 + 智能预测,让复杂计算变得像聊天一样简单,陪伴助力你的科研之路~

🔥 亮点速览: ✅ 无需部署,打开即用 ✅ 对话式交互,科研问题轻松解 ✅ 智能可视化,数据一目了然 ✅ 全阶段适用,萌新到大神都能玩转

🎯 点击下方链接现在登录 GaliLeo 平台,抢先体验 Protenix Agent 的黑科技预测能力!科研效率直接起飞🛫 https://sidereus-ai.com/

admin 将本帖设为了精华贴。 04月25日 10:14
需要 登录 后方可回复, 如果你还没有账号请 注册新账号