智能体使用经验 SPONGE Agent 教学贴 | 用自然语言指挥分子运动 🐎

RoommateOfBoss · 2025年04月28日 · 最后由 biye 回复于 2025年12月05日 · 235 次阅读
本帖已被管理员设置为精华贴

1. 简介:分子动力学模拟在生物体系中的应用

  • 分子动力学模拟原理
    • 通过数值积分牛顿运动方程,追踪生物大分子(蛋白质、核酸、小分子等)原子随时间演化的过程。
  • 应用场景
    • 揭示蛋白质折叠与构象转换机制
    • 分析生物分子之间的相互作用
    • 研究生物体系的动态演化
    • ...

那么,具体实现分子动力学模拟需要什么步骤呢?

2. 分子动力学模拟的步骤

  1. 系统建模

    首先我们需要对要模拟的体系进行模型构建,主要的步骤如下:

    • 1.1 获取实验结构的 PDB 文件(可以从 PDB 网站获得,也可以使用 Protenix,AlphaFold 等工具进行预测),如有小分子要模拟,则需要小分子的 mol2 文件(推荐使用 mol2 文件,PDB 中小分子的键连信息不一定正确)
    • 1.2 对 PDB 文件进行预处理,包括加氢,修复缺失区域,去除无关配体,对特定残基进行处理等
    • 1.3 如果有小分子,则需要对小分子 mol2 进行预处理。包括加氢,计算电荷
    • 1.4 确定溶剂环境,例如 0.15M 的 NaCl 溶液(生理盐水)等
  2. 力场选择
    接下来我们要给建模的体系分配力场参数,常见的力场如下

    • 力场:AMBER 系列力场、CHARMM 系列力场等
    • 溶剂:显式水(TIP3P、SPC/E、TIP4P)或隐式模型(GBSA、PB)等
  3. 能量最小化
    接下来我们需要为体系进行能量最小化,以消除初始结构高能碰撞与应力

  4. 预平衡模拟
    最小化结束后,我们需要对体系进行预平衡模拟,其核心目的是让初始构建的生物分子体系在目标热力学条件下充分松弛、稳定,以保证后续模拟结果的可靠性和物理真实性。

  5. 生产模拟
    在完成预平衡后,进入生产(Production)模拟阶段,其核心目标是“真实地”采样分子体系在给定热力学条件下的动态行为与统计性质,为后续分析提供可靠数据支持。

  6. 数据分析

    • 构象变化:RMSD、RMSF、聚类分析
    • 相互作用:氢键、盐桥、接触面
    • 自由能计算:MM/PB(GB)SA、PMF 曲线
    • ...

是不是被上面繁琐的步骤吓到了呢?虽然步骤繁多、参数复杂,但借助 SPONGE Agent,您只需通过自然语言对话,即可从模型构建一路“问答”到数据分析,轻松完成整个分子动力学模拟流程。下一节,我们将实操演示,让您亲身体验 AI 驱动的分子模拟奇妙旅程!

3. 实战演示

  • Step 0 : 对话选择

选择 SPONGE 开始对话

  • Step 1 上传文件 & 文件预处理(可选)

你可以上传文件,让 ADAM 帮忙准备分子动力学输入文件,ADAM 会解析上传的文件并进行预处理。这里我们选择上传 PDB 网站中下载的 4B1Y.pdb 和 LAB,ATP 两个小分子的 mol2。

  • Step 1 文件下载 & 文件预处理(可选)

你也可以告诉 ADAM 你想要模拟的 PDB ID,比如 4B1Y,这时 ADAM 会下载该 PDB 并对文件进行分析

ADAM 会解析出里面的小分子的名字,残基号等,你可以选择你想要保留的小分子,比如我们可以选择保留 ATP 和 LAB 进行模拟,此时我们输入序号 0 1 即可。

❗ 注意,现在我们暂不支持选择离子,因此这里我们不能输入 2(MG 离子),选择离子可能会导致后续的建模出错;并且出现多次的小分子也不支持选择(例如序号 5-7 的三个 PEG),因为这可能会与 PDB 提供的下载接口发生冲突,如果您想要模拟这种出现多次的小分子,建议您手动从 PDB 网站上进行下载。

在下载完小分子 mol2 后,ADAM 会自动对 PDB 文件进行处理,并告知下一步计划对小分子加氢,我们让他继续即可。

  • Step 2 准备模拟输入文件

加氢步骤结束后,ADAM 会告知目前支持的力场参数信息,并告知你下一步计划是准备分子动力学输入文件,我们让他继续即可。

这一步等待可能比较耗时,因为需要对小分子计算电荷,如果它显示思考中请您耐心等待,完成后 ADAM 会输出这些力场的参考文献,并告知你下一步计划是进行能量最小化。

我们可以打开 build 文件下的 input.mol2 可视化建模好的文件

可以看到我们要求的小分子和 PDB 均已成功建模和保存

  • Step 3 能量最小化

Step2 中 ADAM 会询问我们最小化的步数,我们直接告诉他就可以,比如让他最小化 20000 步

  • Step 4 预平衡

❗ 注意,目前预平衡只支持无约束的 NPT 模拟。

最小化完成后,ADAM 会询问你预平衡的步数或者时间,我们直接告诉它就可以,比如让他预平衡 20 ps。

  • Step 5 生产模拟

预平衡完成后,ADAM 会询问你预平衡的步数或者时间,我们告诉他就好,比如这里让他模拟 10000 步

  • Step 6 分析

☺ 目前支持 RMSD 分析,更多分析正在开发中

生产模拟完成后,ADAM 会告知你将对轨迹进行 RMSD 分析,我们让他继续即可

我们可以点击 rmsd.png 查看 RMSD 随时间的变化

4 注意事项&常见报错

  • 1 最小化,预平衡,生产模拟的文件可以在文件栏中的 min, pre_equilibrium, production 中找到
  • 2 Agent 输出的随机性:Agent 的输出不一定每次一样,这是正常现象。比如本教程中 Agent 就同时完成了小分子的下载和 PDB 的预处理,有时候它会分两步进行处理。
  • 3 偷懒现象:有时 Agent 会“偷懒”,比如它声称自己将要完成什么任务但是没有出现“思考中”字样,你这时候需要提醒他立刻执行。
  • 4 建模报错:大多是因为输入文件不合理或者输入文件不支持,遇到该情况可在论坛提问。
  • 5 模拟报错:有时模拟也会报错,比如下图;这种报错大概率是因为体系能量过高导致模拟崩溃,建议增加最小化的步数或者预平衡的时间

5 总结

  • [轻松上手] 本文讲解了如何使用 ADAM 用自然语言进行分子动力学模拟!
  • [常见问题] 本文给出了使用过程中常见的报错及解决办法,助力您的科研和学习!
admin 将本帖设为了精华贴。 04月30日 02:35

您好我想问一下,更多分析什么时候可以上线呢。另外,我在使用的时候发现当生产模拟体系超过 10ns 的时候明显会发现页面经常崩溃,可能是得到的文件太大导致是前端资源崩溃吗,这些情况会得到优化吗

另外调用生产模块的时候偷懒的现象非常频繁,不知道应该怎么提供命令合适呢

更多分析下个版本更新就会上线啦,应该两周内。页面崩溃的内容我们正在排查,会尽快修复!

偷懒一般有两种原因:1.模型热更新了,这种过一段时间就会好。2.模型”觉得太难了“,就像小孩一样,这种情况执行步骤越长越容易出现,你可以尽可能简单地告诉它指令,说的简单一些会减少偷懒概率。我们也注意到了偷懒问题,下个版本我们将对偷懒进行针对性更新。

您好,想请教一下,已经有 mol2 文件,如何用 adam 加水盒子?试了一下,出现了报错,想问一下如何解决。

很抱歉,在为小分子加水盒子建模的过程中出现了错误。错误的核心信息是 AttributeError: 'int' object has no attribute 'get_atom_coordinates',这表明在代码里尝试对一个整数对象调用 get_atom_coordinates 方法,然而整数对象并没有这个方法。

可能的原因在于调用 Xponge.add_solvent_box 函数时,传入的参数类型不符合预期,导致出现了整数对象而非分子对象。

解决方案如下:

仔细检查 Xponge.add_solvent_box 函数的输入参数,保证传入的是正确的分子对象。 确认 mixed 和 WAT 变量在调用该函数之前已经正确初始化,并且它们是分子对象。 我将重新梳理参数,再次尝试进行建模。

需要 登录 后方可回复, 如果你还没有账号请 注册新账号