晶体结构对材料的性能有着决定性的影响,晶体结构的研究往往作为材料研究的起点。晶体结构预测是一种仅根据特定条件下的化学成分寻找稳定或亚稳定结构的方法。它已成为发现新材料和探索相空间的有效工具。晶体结构预测方法可以帮助通过实验确定结构或设计特定结构来指导实验合成,从而显着降低实验成本。因此,具有重大的科学意义。然而,目前的晶体结构预测技术仍然受到以下两个方面的限制:
为了解决第一个问题,本文提出利用机器学习潜力进行替代计算。生成随机结构后,随机选择这些结构的子集来执行 DFT 单点能量、力和应力计算,以构建训练集。然后使用该数据集训练初始机器学习潜力。在后续的搜索过程中,计算量大的DFT结构优化被机器学习力场取代。在优化过程中,需要外推的结构被记录。如果外推超过预定阈值,则对这些结构进行DFT单点计算,并将它们添加到训练集中,用于重新训练力场以校正势函数。这个过程一直持续到优化过程可以完全由机器学习代理执行。由于机器学习力场引入的误差,搜索结束后需要使用第一性原理计算进行校准。
为了解决第二个问题,研究团队选择利用图论来减少搜索空间。进化算法中的一个重要概念就是将优秀的“基因”从父代保留到子代。对于晶体结构,这些“基因”代表局部结构基序。虽然这些优秀的图案可以是分子晶体搜索中的分子,但对于普通的延伸晶体来说,确定它们并不容易。然而,通过将周期性晶体结构抽象为图,可以采用社区检测算法来完成此任务。例如,对于扩展的α-硼结构,当将其转化为商图并进行社区检测算法时,提取的0维分量对应于硼二十面体。
在随后的测试中,研究团队发现机器学习方法可以将自洽计算的数量减少大约两个数量级,而图论则有助于将到达目标结构所需访问的结构数量减少30%。利用该方法,研究团队在行星科学、超硬材料、高能密度材料、超导材料等领域取得了一系列突破。