模型材料

机器学习顶刊汇总NatRevPh

发布时间:2022/7/12 17:58:34   
理论计算助攻顶刊,+成功案例,全职海归技术团队、正版商业软件版权!经费预存选华算,高至15%预存增值!1.IF=31.!加州大学Nat.Rev.Phys.评述机器学习在DFT发展中的应用机器学习(ML)除了擅长于人类设计规则的棋盘游戏外,在科学研究中也有令人印象深刻的应用。在过去十年中,ML在近似密度泛函方面取得了重大进展,但这是否意味着人类设计泛函的终结还有待观察。图1.超算资源中DFT计算的占比在此,美国加州大学尔湾分校KieronBurke等人讨论了ML在泛函设计中的兴起。在物理科学中,DFT通常是解决电子结构问题的首选计算方法。通过将耦合的多体问题映射到单粒子问题,DFT以直接求解薛定谔方程的一小部分成本提供了完全量子解。然而,根据GIGO原则,DFT中的计算精度仅与使用的近似函数相关且存在较大的系统误差。因此,克服这些基本挑战对于扩展DFT在凝聚态物理中的适用性和可靠性至关重要。为此,作者列举了ML-DFT的实际示例。对于一个简单的问题,即一维盒子中非相互作用费米子的动能,可使用ML方法(核岭回归)通过对来自精确数值计算的示例进行训练来找到泛函的近似值,但这只对简单的模型系统有用。后来,研究人员直接通过机器学习从外部电位学习密度,如丙二醛分子动力学模拟中的质子转移。图2.基于机器学习绕过Kohn-Sham方程自此,开始有许多将ML代入实用、可概括的泛函构造的相关研究。上述进展可分为两类:一部分偏向于局部/半局部近似,另一部分偏向非局部近似,但这种非局部泛函的泛化性可能很差。最近令人兴奋的发展来自DeepMind公司,该公司提出了一种深度学习网络DM21(DeepMind21),通过在分子数据和具有分数电荷和自旋的虚构系统上训练神经网络来克服DFT的基本限制。目前,DM21仅在分子上进行了训练和测试,其中基于波函数的量子化学提供了高精度的基准数据。然而,DFT的真正目的是找到同时适用于分子和材料的单一泛函,该方法是否也适用于材料仍有待进一步研究。但是,从宏观上看,这种发展是否标志着人类设计泛函终结的开始?相信未来的研究会有一个答案。图3.DM21算法改进DFT的应用Machinelearninganddensityfunctionaltheory,NatureReviewsPhysics.DOI:10./s---22.哥大重磅Nat.Biotechnol.:可解释机器学习预测蛋白质-配体结合亲和力尽管生物化学家几十年来一直在测量生物物理参数,但这些测量通常是低通量的。相比之下,基于高通量测序的分析往往侧重于检测仅间接反映这些数量的富集模式。此外,现代机器学习方法,如深度神经网络,往往会产生高度过度参数化的黑箱模型,其参数没有直接的生物物理意义。在此,美国哥伦比亚大学HarmenJ.Bussemaker等人描述了一种灵活的机器学习方法并将其称为ProBound,它可以根据平衡结合常数或动力学速率准确定义序列识别。ProBound使用三层对多库测序数据系统地建模:1)结合层利用序列识别模型从序列预测结合自由能或酶效率;2)分析层对生成库的选择步骤进行编码并预测所有配体的频率;3)测序层在测序期间对库的随机采样进行建模。这些层被组合在一个似然函数中,该函数被优化以推断识别模型。尽管由于随机库的复杂性,许多配体具有噪声计数或完全缺失,但最终的识别模型是稳健的。此外,每一层都易于扩展。默认情况下,对应于特定位置的亲和矩阵,结合层可扩展为包括碱基相互作用或多个转录因子(TF)的协同结合。分析层的灵活性使替代过程的建模成为可能,如酶改性。最后,可以联合分析多个测序层以分析更复杂的现象(如甲基化敏感性)。图1.TF结合模型性能的验证作者展示了ProBound使用模型来量化TF的行为,该模型可用于探测以前无法访问的生物物理参数的测序分析,如捕捉DNA改性的影响和多TF复合物的构象灵活性,并直接通过ChIP-seq等体内数据推断特异性而无需峰值调用。当与称为KD-seq的分析结合使用时,该方法可以确定蛋白质-配体相互作用的绝对亲和力。此外,作者还应用ProBound来分析量化了激酶-底物相互作用的动力学。随着在序列识别方面的研究越来越复杂,如序列的综合影响、辅助因素、DNA甲基化和TF浓度或体外和体内观点的整合,作者预计对互补数据的严格整合将变得越来越重要。据预计,ProBound将在配体或底物的合理工程等至关重要的生物技术领域有诸多应用,并为解码生物网络和合理设计蛋白质-配体相互作用开辟新途径。图2.综合建模量化了甲基化和辅助因子对TF结合的影响Predictionofprotein-ligandbindingaffinityfromsequencingdatawithinterpretablemachinelearning,NatureBiotechnology.DOI:10./s---03.罗格斯大学/普林斯顿AM:自动化合成+机器学习设计聚合物-蛋白质杂化物聚合物-蛋白质杂化物是一种有趣的材料,可增强蛋白质在非天然环境中的稳定性,从而增强其在各种医学、商业和工业应用中的效用。其中,一种稳定策略包括设计合成随机共聚物,其组成与蛋白质表面协调,但合理的设计由于巨大的化学和组成空间而变得复杂。为此,美国新泽西州立罗格斯大学AdamJ.Gormley、普林斯顿大学MichaelA.Webb等人开发了一个集成自动化聚合物化学和机器学习(ML)的强大设计框架,以有效地发现具有增强三种化学性质不同的酶的热稳定性的聚合物-蛋白质杂化物(PPH)。作者通过学习-设计-构建-测试循环进行迭代,以识别高性能PPH。其中,每次迭代包括4个步骤:1)学习:训练酶特异性高斯过程回归(GPR)代理模型并根据共聚物特性预测PPH的保留酶活性(REA),2)设计:使用主动和无监督的ML识别PPH的24种候选共聚物批次,3)构建:通过光诱导电子/能量转移可逆加成-断裂链转移(PET-RAFT)聚合自动合成所提出的共聚物,4)测试:将合成共聚物与酶混合以形成热应力PPH并评估其REA。然后,使用新获得的和现有的数据开始新的主动学习迭代。图1.本研究迭代过程概述值得注意的是,ML引导的数据采集是针对每种酶有效定制的。此外,通过对已开发的替代ML模型的分析,作者确定了共聚物的特定化学特征,这些特征推动了每种酶的保留活性增加。成功的聚合物-蛋白质杂化设计的生物物理学特性表明,类似伴侣的结构再折叠辅助是一种可能的稳定机制。这种PPHs的发现平台可向多个方向扩展:1)首先,该方法可扩展到其他蛋白质、共聚物化学/替代设计目标;2)此外,由于共聚物化学品所跨越的广阔化学空间,该平台可扩展以适应同时追求多个设计目标;3)收集的分析数据可与基于模拟的模型结合使用,以进一步阐明和验证分子水平的稳定性机制;4)最后,该平台有可能从更小、更有针对性的实验选择开始发现高性能PPH。总之,该领域的见解有助于减少高通量材料发现工作所需的资源。图2.生物物理表征表明共聚物辅助再折叠MachineLearningonaRoboticPlatformfortheDesignofPolymer-ProteinHybrids,AdvancedMaterials.DOI:10./adma.018094.李腾教授AFM:时间减少倍,DFT+机器学习合理设计双原子催化剂!目前,学术界对双原子催化剂(DACs)的兴趣日益浓厚,它不仅继承了单原子催化剂(SACs)的优点(最大的原子利用率、高活性和选择性),而且克服了SACs的缺点(低负载和孤立活性位点)。然而,由于其巨大的设计空间,DACs的设计对于实验和计算研究的成本仍然过高。为此,美国马里兰大学李腾教授等人通过结合DFT和基于拓扑信息的机器学习(ML)算法,提出了一种数据驱动的高通量设计方法以评估个DACs在析氧(OER)和氧还原(ORR)反应中的稳定性和活性。首先,作者进行了DFT计算以评估个DAC系统的稳定性及OER/ORR催化性能。然后,作者使用来自个DAC系统的DFT结果作为ML算法的训练和测试数据集。ML算法基于两方面的拓扑信息:金属原子和基底原子的原子性质(即节点信息),以及对应DAC的原子结构及其周围基底缺陷(即拓扑结构)。基于拓扑信息的ML模型工作流程包含以下三个步骤:1)训练数据生成,2)通过基于拓扑信息的ML算法进行训练/测试,3)基于ML预测筛选DAC。图1.基于拓扑信息的ML模型的工作流程结果显示,这种高通量设计方法揭示了种OER活性优于OER最有效催化剂IrO2()及种ORR活性优于ORR最有效催化剂Pt()的DAC。此外,作者确定了个双功能DAC,其超越了IrO2()的OER性能和Pt()的ORR性能。最重要的是,作者揭示了将DAC的催化活性与DAC的拓扑结构和电子结构及其键合碳表面结构相关联的内在描述符。这种设计方法不仅产生了显著的预测精度(R20.),而且与纯DFT计算相比,筛选时间也大幅减少了倍。总之,这项研究的结果为以大幅降低的成本加速发现高性能和低成本DACs提供了巨大的希望,展示的ML策略可以很容易地适应并加速发现各种原子级催化剂。图2.筛选性能最佳的DACData-DrivenHigh-ThroughputRationalDesignofDouble-AtomCatalystsforOxygenEvolutionandReduction,AdvancedFunctionalMaterials.DOI:10./adfm.034395.吴恒安/余昊CEJ:动力学理论+机器学习快速预测页岩纳米孔中的甲烷吸附了解页岩纳米孔中的气体吸附行为对于页岩气储层估计和性能预测至关重要,但考虑到页岩的地质环境和纳米孔结构的复杂性,这一点仍不清楚。一般来说,基于实验和分子动力学(MD)模拟的传统方法总是昂贵且耗时。为此,中国科学技术大学吴恒安教授、余昊等人从微观和动力学理论的角度构建了一个预测页岩纳米孔中甲烷吸附行为的机器学习(ML)框架,其中提出了与势能分布(PED)相关的三个新参数来表征页岩狭缝纳米孔中的甲烷吸附特性。为了实现快速准确的预测,作者建立了一系列由GCMC/MD模拟仿真结果组成的数据集来训练ML模型。然后,利用狭缝纳米孔甲烷吸附能力参数(γ)获取算法来表征现实页岩狭缝纳米孔的性质,其分析结果作为ML过程最终预测的输入参数。作者采用的ML算法为全连接神经网络(FCNN),其架构是一层中的所有节点或神经元都连接到下一层的神经元。此外,数据集共包括个碳狭缝纳米孔中的甲烷吸附曲线,其中20%作为测试数据集,80%作为训练数据集。图1.输入参数、FCNN模型架构和预测吸附曲线基于5折交叉验证的结果显示,预测结果和模拟结果之间的R2值相似,通常高于0.99,表明构建的FCNN模型可有效预测甲烷吸附特性。本研究主要结论可归纳如下:1)提出并利用平均最小势能ω、最小势能标准差ξ和狭缝纳米孔甲烷吸附能力参数γ来表示狭缝纳米孔结构的吸附特性,并考虑动力学理论;2)基于ML方法,快速准确地预测不同温度和压力下不同狭缝纳米孔中甲烷的吸附曲线;3)获取无机和有机狭缝纳米孔甲烷吸附能力参数γ,基于参数γ获取和应用算法预测不同温度和压力条件下的吸附曲线,结合预测结果分析甲烷吸附行为;4)应用所提出的ML模型来预测甲烷在不同地质条件下的吸附行为,表明预测页岩纳米孔中气体吸附行为的可行性。此外,这项工作中获得的见解对于预测复杂环境因素下的纳米约束流体行为也具有指导意义。图2.ML算法预测结果Fastpredictionofmethaneadsorptioninshalenanoporesusingkinetictheoryandmachinelearningalgorithm,ChemicalEngineeringJournal.DOI:10./j.cej...复旦刘智攀教授Chem.Sci.:机器学习势在沸石模拟中的应用概述由于沸石具有多元素(通常是Si-Al-P-O-H五元素)、成分多变、微观结构丰富、周期性大的特点,因此对沸石的结构和性质进行预测一直是一个很大的挑战。机器学习(ML)势作为近年来发展起来的一种理论方法,旨在准确、经济地描述复杂材料体系的势能面(PES),有望为沸石研究领域提供突破性的贡献。图1.沸石稳定性和形成机理的理论研究路线图在此,复旦大学刘智攀教授等人概述了沸石原子模拟的现状,并展示了先进的ML势在沸石系统中的一些应用。首先,作者简要回顾了使用从经典力场到量子力学计算和最新ML势等模拟工具对沸石的理论研究。ML势作为下一代原子模拟技术开辟了模拟和解释沸石系统的新途径,从而为最终预测沸石的结构-功能关系提供了广阔的前景。然后,作者从两个主要方面总结了使用ML势的最新进展:沸石稳定性的起源和沸石相关催化反应的机理。此外,作者还讨论了ML势应用的可能场景,不应仅局限于个案研究方式的大规模原子模拟。这些先进应用包括沸石稳定性评价、形态/暴露表面的预测及酸度预测,可通过将基于云计算的技术与基于ML势的原子模拟相结合来实现。图2.沸石稳定性在线评价最后,作者展望了ML势在沸石模拟方面的未来发展:(1)在提高计算精度方面,应注意准确性和速度是一对悖论,需要在实践中取得平衡。作者开发的G-NN势代表了一种具有理想可转移性和对复杂材料具有良好可预测性的ML势,还开发了一种多网络架构以进一步提高准确性并增加描述多元素系统的能力;(2)扩大应用范围方面,不限于催化剂,沸石还被用作分离气体且最近用作固态锂离子电池的固体电解质,这些应用要求详细了解沸石中气体分子和碱金属阳离子的扩散和迁移。因此,为这些系统构建ML势并创建在线数据库有利于加速材料设计;(3)在构建沸石相关数据集方面,收集和生成数据的共同努力在ML时代是绝对重要的。目前,各研究小组之间的数据交换和方法共享需要更加简单和透明。总之,未来仍有足够的空间开发新的ML方法来加速沸石的基础研究和应用。图3.双网络框架的示意图Machinelearningpotentialeraofzeolitesimulation,ChemicalScience.DOI:10./D2SCATEM、球差云视频,加急测!球差、冷冻电镜、原位TEM、HR-TEM、EDS-Mapping、SAED、HADDF-STEM、EELS、ABF-STEM应有尽有!Science、Nature级别水平!发顶刊,拍TEM,找我们就对了!

添加下方

转载请注明:http://www.aideyishus.com/lkyy/718.html

------分隔线----------------------------

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章