分享科研观点 3Zeta 级别 Pople 基组热化学别用了？看看两方观点如何在 JPCA 上碰撞

admin · 2026年04月14日 · 6 次阅读

本文首先于2026年3月9日发表在星使智算微信公众号

前言

Pople 基组一直在有一定计算化学人心中有着特殊的地位，这种特殊的地位毫无疑问可以追溯到 Gaussian 软件在应用计算化学领域几十年如一日的风靡。但在 def2 系列基组的诸多优势（不用额外加极化/系统构建/对第五周期起自带赝势/支持元素广泛/标配辅助基组）的冲击下，也有越来越多人实际应用转向了 def2 系列基组。在 2023 年一篇 JPCA 直接在热化学问题上对 Pople 3zeta 6-311G 系列亮剑，comment 随之而来，紧接着又是一篇 reply to comment，下面就请您随我看待这场学术碰撞。

6-311G 系列都拉完了！

首先来看第一篇发难之作：新南威尔士大学 Laura K. McKemmish 等人的发难之作，计算软件是 Q-Chem v5.4.2

来源：J. Phys. Chem. A 2023, 127, 48, 10295–10306

标题起的就极度吸睛:"Benchmarking Basis Sets for Density Functional Theory Thermochemistry Calculations: Why Unpolarized Basis Sets and the Polarized 6-311G Family Should Be Avoided" ，翻译过来就是热化学密度泛函基组测试——为什么不加极化的基组和加了极化的 6-311G 系列都别用了。

这个标题中也包含着任何合理的计算化学家/量子化学家都知道的事情，计算要带极化！计算要带极化！计算要带极化！（重要的事说三遍）当然，def2 系列基组相比于 Pople 基组一个优点就是用不带极化的 def2 系列基组是困难的，但丢掉 Pople 基组的极化是计算新手的常犯错误。这里的测试集选择的是知名主族热化学数据集 GMTKN55 的改动版 diet-139-GMTKN55，里面的一些数据因为太过耗时/涉及到部分基组没有数据集分子含有的元素定义而被删除。一句话概括就是作者用的是删减过的 diet-139-GMTKN55 数据集。B3LYP/M06-2X/ωB97M-V 三个泛函被选取并结合各路基组（Pople/def2/Dunning/Jensen）进行暴力 benchmark，得到如下结果：

来源：Figure 6 of J. Phys. Chem. A 2023, 127, 48, 10295–10306

上面的数据很好的反应了应用量子化学工作者之间的一些共识：

M06-2X 算主族的能量不错，但是ωB97M-V 更优，B3LYP 算能量一般般
3zeta 的基组算能量是比较有必要的，可以大大降低误差

几组 Pople 基组的"内战"结果令人惊讶：

6-311G*给出了和 6-31G*相仿的精度，zeta 数提升白提升
都加弥散的 6-311+G*甚至还没比过 6-31+G*，居然还倒退
加了不少额外极化的 6-311G(2df,p) 也就和 6-31++G**拼了个仿佛，加 zeta 加极化居然和加弥散差不多

看一下 def2 系列基组，给出了很多预料之内的信息，值得顺带一提的是 def2 加弥散有两种主流实现方式：一种是前缀加 ma，一种是后面加 D，这里测试的是后面加 D 的版本，弥散相比前缀加 ma 要加的更多。

def2-TZVP 显著强于 def2-SVP，也显著强于 def2-SVPD
def2 系列的 3zeta 各种变体显然没有 6-311G 家族来的繁多
有趣的是在 3zeta 级别上继续上极化没有上弥散对结果影响大

下图是 TOC，横向对比了 Pople/def2/Jensen 系列基组的 3zeta 误差，可以看到 6-311G 家族对加极化是不太敏感。

来源：TOC of J. Phys. Chem. A 2023, 127, 48, 10295–10306

基于上述测试，文章在结尾部分对 3zeta 的 Pople 系列基组展开锐评：

“On the use of 6-311G family: Despite its name, polarized 6-311G should not be considered to be of triple valence zeta quality (this paper provides compelling quantitative evidence to support the very early results of Grev and Schaefer that have unfortunately often been ignored).”

翻译大意：尽管 6-311G 有 3zeta 之名，但无 3zeta 质量之实！（Grev 和 Scheafer 早就说了，但大家都如若无睹！）

结论不可谓不犀利！且看支持方如何反击。

是你极化加不明白！

在九个月后，俄亥俄州立大学的 John.M.Herbert 等人针对上面的文章给出了 Comment，测试软件是 Q-Chem v6.1.1

来源：J. Phys. Chem. A 2024, 128, 36, 7739–7745

作者上来就抛出了直接的观点：

"Early benchmark studies suggested that Pople-type basis sets including 6-311+G(2d,p), 6-311+G(3df,2p) and 6-311+G(3df,2pd) were appropriate for thermochemical calculations and the largest Pople basis set, 6-311++G(3df,3pd), continues to be used as a benchmark-quality basis. As such, the titular prohibition on polarized 6-311G-type basis sets came as a surprise, given that none of the aforementioned examples were considered in ref (1)"

大意翻译：一堆常用能量测试的 3zeta Pople 基组你是一点没提，然后就说 6-311G 全系列都不行，无语。

他们返璞归真到了原始的 GMTKN55，并给 B3LYP 加上了 D3 的色散矫正，B3LYP-D3 or B3LYP-D3(BJ) 确实是大家更常见的用法，而且确实降低了误差。得到的数据如下图所示，里面有一个稍有陌生的基组可能是 def2-ha-TZVP，ma 是 minimal argumented 的缩写，ha 是 heavy argumented 的缩写，就是比 ma 再多加些弥散，但是仍不如 D 加的多。

来源：Figure1 of J. Phys. Chem. A 2024, 128, 36, 7739–7745

根据上图得到的一些重要结论：

6-311G+(2df,p) 和 def2-ma-TZVP 精度相仿
6-311G(2df,p) 和 def2-TZVP 精度也相仿（笔者评：这应该是数据集/统计的原因，从第一篇文章中这两者的对比还是有差距的，在这里就差不多了）
弥散函数对减小误差相当有帮助

来源：Figure2 of J. Phys. Chem. A 2024, 128, 36, 7739–7745

从第二张图和例子来看作者表示：

6-311G(d,p) 成本就是 def2-TZVP 一半，统计效果相当，赢！
6-311+(3df,2pd) 成本不到 def2-QZVP 1/10，给出仿佛精度，赢！

作者同样探讨了常说的加弥散函数不收敛问题，通过调阈值很好的解决了。（笔者评：John M. Herbert 就是 Q-Chem 核心开发者，绝大多用户肯定没他玩的 6，他调行，大家没事别乱调默认参数）

Comment 反击同样气势十足，且看 reply to comment 如何为争端画上句号。

你说的对，但是……

在同一期 JPCA 上，Laura K. McKemmish 给出了对于 Comment 的回复：

来源：J. Phys. Chem. A 2024, 128, 36, 7733–7738

这篇 reply 上来承认了 comment 的合理之处，但仍指出 6-311G 仍然不像 3zeta 基组，是加了弥散之后的 6-311+G 可以当个 3zeta 基组了。

他们对一个 3 线态 C 进行了 HF 计算并看轨道系数得到了如下的图：

来源：Figure1: Coefficient of the s-basis functions in the triplet carbon atom 1s (top) and 2s (bottom) alpha orbitals from Hartree–Fock calculations with various basis sets. J. Phys. Chem. A 2024, 128, 36, 7733–7738

这里没有加极化的原因是相对充分的，因为只算了 C 原子，极化主要是对键的取向性很有帮助，只是一个孤立原子不加无妨。

如果完全不知道 s basis function 这些基组概念也没关系，最简单的方法就是比较法：对比系统构建的 def2-SVP 和 def2-TZVP，可以知道后两个格代表的应该是 2zeta 和 3zeta 的区别，但是对比 6-31G 和 6-311G 就发现只变了一个格，就像加了一层弥散。这也部分能解释为什么第一篇文章数据展现出的 6-31+G*甚至比 6-311G**拼了个半斤八两。而 6-311+G 终于有点像 3zeta 了。这也是 6-311G 系列基组 s basis function 参数化不佳的最直观展现。

这篇 reply to comment 同时指出了一条特别重要的点：统计上的区别，第一篇 comment 用的是 95% 置信区间，但第二篇回应用的是标准差，统计方式不同带来相当不同的评价。

文章结论：

6-311G 还是不可取，但是 6-311+G 系列可取，而且 6-311+G(2df,p) 不错
但还是要用 def2-TZVP，理由是支持元素更多，使用更方便，在同计算时间的条件下误差比 6-311+G(2df,p) 小

这条结论同时也给另一个常见的应用计算化学的问题提供了可参考的答案：优化阴离子的时候假如用 def2 系列基组要不要加弥散？比如用 ma-def2-SVP 或者 def2-SVPD？

如果根据这篇文章的测试，可以说，对有机体系不那么必须。例如当你纠结要不要给 def2-SVP 上弥散的时候，应该先弄到 def2-TZVP 再说。这其实折射出来的是计算量子化学多年来在 Gaussian 建立的 Pople 基组语言上的惯性，大家再说加不加弥散的时候多数时候的出发点都是 Pople 基组而不是 def2 系列基组。

从更实践的角度来说，这给了 B97-3c 和 r2SCAN-3c 这两种 ORCA 支持相当快速的复合方法用于更广阔的用途以理由。

星使二茂铁针对整场学术论战评论和个人观点：

两方都给出了相当详实的数据和理由，论战结果各有胜负。McKemmish 接受了 6-311+G 系列还可以，Herbert 也没有再发 reply to reply to comment 穷追不舍。问题已经被讨论的比较清楚了。

统计标准导致了质量评价结果不同，展现出了统计学中人为干涉的一面
Pople 基组并非系统性构建的问题被直接指出并辅助以相当好理解的例子
Pople 基组写起来实话是很繁琐，变种奇多，def2 系列基组明显更加容易，而且新手极难犯不加极化的错误
Gaussian 多年来在理论和计算的统治地位带来了 Pople 基组本位的讨论起点
从用户角度来说，McKemmish 的文章更加有意义，Herbert 作为开发者的技巧绝非普通用户所能及。即便是擅于调收敛阈值，也让计算变得更加麻烦。正如同 Sob 社长经常在计算化学公社强调的那样，如果不是必须加弥散就别加。对于 Pople 基组尚且如此，对于 def2 系列基组更是如此

最后一句

笔者平时最常用的是 ORCA 软件，所以用的最多的还是 def2 系列基组。顺带值得一提的是，ORCA 里面没事别用 Pople 基组，因为没有对应的辅助基组，ORCA 也没有对 Pople 基组进行特别优化。多的不说了，二茂铁要继续去平台开发测试 ORCA 相关内容了，也欢迎大家使用测试我们的 ORCA 相关内容。感谢大家收看本期内容，我们下期再见。

暂无回复。

需要登录后方可回复, 如果你还没有账号请注册新账号

共收到 0 条回复

收到新回复，点击立即加载