一种基于机器学习的MOFs合成路线多目标优化方法
未命名
07-22
阅读:107
评论:0
一种基于机器学习的mofs合成路线多目标优化方法
技术领域
1.本发明涉及人工智能与纳米复合催化材料技术领域,特别是指一种基于机器学习的mofs合成路线多目标优化方法。
背景技术:
2.金属有机框架(mofs)是一类新兴的高多孔晶体化合物家族,由无机结构单元(原子、簇等)与有机配体通过配位键组装而成的周期性网状结构。由于mofs具有独特的多孔结构、可调控的化学功能和广泛的拓扑结构,它在催化领域的应用吸引了多个学科研究人员的极大关注和积极参与。基于深入的实验和理论研究,mofs在催化反应(例如,diels-alder反应、knoevenagel缩合反应、二氧化碳加氢反应、双环戊二烯加氢反应等)的应用中很大程度上依赖于其结构不规则性(即缺陷)。提高催化性能的有效方法是通过引入缺陷或掺杂剂来调整活性中心的电子结构,不饱和配位位点(即配体缺陷位点)可作为底物活化的活性位点。因此,对mofs中的结构缺陷进行智能控制对于实现理想性能至关重要。
3.另一方面,虽然mofs的缺陷工程为催化应用提供了新的机会,但是缺陷工程导致mofs晶体稳定性降低,其结构容易坍塌。其中,mofs的热稳定性对于高温应用非常关键,例如涉及放热催化反应的应用,mofs材料的热稳定性是金属中心与有机配体结合强度以及连接金属离子或簇的有机配体数量的结果,金属中心之间的有机配体缺失可能对热稳定性产生不利影响。因此,如何制备获得具有良好催化性能,并且仍具有一定热稳定性的mofs是高效开发mofs催化材料的迫切需求。
4.目前,尽管对mofs合成的研究已经深入,但对合成过程本身以及干预其中的不同实验变量的影响的系统分析却相当缺乏,针对缺陷调控的研究模式主要依赖传统的实验试错法,存在研发周期长、成本高、效率低的典型问题。因此,在待探索的实验空间中精准制定合成路线,从根本上改变依赖先验知识的传统试错式实验方法,是一个有待解决的科学难题。以机器学习辅助合成策略的高效规划是实现目标mofs材料精准制备的必由之路,能有效避免盲目实验导致时间和成本的浪费,驱动mofs材料的精准合成,因此开发一种基于机器学习的mofs合成路线多目标优化方法具备广阔的实用前景。
技术实现要素:
5.本发明要解决的技术问题是提供一种基于机器学习的mofs合成路线多目标优化方法,其能克服在同时优化mofs材料缺陷含量和热稳定性两种性能时存在实验周期长以及实验成本高等缺点,而提供一种简便快捷、低成本、节省人力的基于机器学习技术同时优化多性能的方法。本发明采用机器学习的多目标优化策略试图实现从根本上改变依赖先验知识的传统试错式实验方法,精确高效地指导mofs材料的实验合成,实现研发效率的大幅跃迁。
6.为解决上述技术问题,本发明提供如下技术方案:
7.一种基于机器学习的mofs合成路线多目标优化方法,包括以下步骤:
8.s1、采集制备ce-uio-66的反应温度、反应时间、调节剂用量等合成条件并通过热重分析曲线评估其缺陷含量及热稳定性,以此作为ce-uio-66合成条件—性能数据集;
9.s2、将数据集随机划分为训练集和测试集,采用八种机器学习算法分别对ce-uio-66各性能进行建模,并筛选确定用于各性能预测的代理模型;
10.s3、确定候选合成条件空间作为待优化的搜索空间,计算搜索空间中ce-uio-66各性能的目标实现概率(pa)值并扩展为多目标评估因子,筛选获得预期达到目标性能的合成方案;
11.s4、采用水热法依据预期合成方案制备ce-uio-66材料;
12.s5、对制备获得的ce-uio-66材料进行目标性能的表征测试,若测试数据不满足目标需求,则更新数据集及代理模型。
13.其中,优选地,s1中,所述ce-uio-66合成条件—性能数据集,具体为:针对ce-uio-66进行文献调研,建立包含反应温度、反应时间、甲酸用量、硝酸铈铵用量、对苯二甲酸用量、n,n-二甲基甲酰胺(dmf)用量、水用量七维实验变量的ce-uio-66合成条件—性能数据集,包括合成条件、配体缺失的缺陷含量和热稳定性。
14.其中,优选地,s1中,所述通过热重分析曲线评估其缺陷含量及热稳定性,具体为:找到热重分析数据曲线的二阶导极值点,作为材料失重过程的区域,在失重区域的曲线台阶前水平处作切线与曲线拐点处作切线,两条切线的交点即为该材料失重过程起始发生的参考温度点,用于表征材料的热稳定性,作为机器学习的目标性能之一;两条切线交点的重量百分比记为y1,材料在500℃处完成失重过程,完全热分解后的重量百分比记为y2,通过理论公式计算ce6o
6+x
(bdc)
6-x
中配体缺失的缺陷含量用于表征材料的催化活性,作为机器学习的目标性能之一。
15.其中,优选地,s2中,所述在性能建模过程中,选用八种机器学习算法包括:随机森林、核岭回归、支持向量机、k近邻、神经网络、xgboost(extreme gradient boost)、adaboost(adaptive boost)和lightgbm(light gradient boosting machine)八种机器学习算法,并使用贝叶斯优化进行超参数的调优。
16.其中,优选地,s2中,所述将数据集随机划分为训练集和测试集,筛选确定用于各性能预测的代理模型,具体为:在训练过程中,按照0.8:0.2的比例将数据集随机分成训练集和测试集,采用公式计算模型预测的平均绝对误差mae,其中,x表示整个样本的训练集数据,y表示整个样本的测试集数据,xi表示实际表征的数据,yi表示机器学习模型预测的数据,i表示训练集或测试集中数据样本的序号,n表示训练集或测试集中数据样本的总数量,重复这个过程100次,计算mae在训练集和测试集上的均值以分析模型的准确性,所述平均绝对误差最低的机器学习模型分别为用于材料缺陷含量和热稳定性性能预测的代理模型。
17.其中,优选地,s2中,所述最优模型算法为adaboost算法。
18.其中,优选地,s3中,所述确定候选合成条件空间作为待优化的搜索空间,具体为:根据所述的制备ce-uio-66的合成条件类别,确定反应温度、反应时间、甲酸用量、硝酸铈铵用量、对苯二甲酸用量、n,n-二甲基甲酰胺用量、水用量七维实验变量组成的ce-uio-66合成条件的搜索空间,限定反应温度大于等于30℃,小于等于130℃,变化步长为10℃;限定反
应时间大于等于15min,小于等于1470min,变化步长为30min;限定甲酸用量大于等于0mmol,小于等于110mmol,变化步长为10mmol;限定硝酸铈铵用量为2mmol;限定对苯二甲酸用量大于等于1mmol,小于等于4mmol,变化步长为1mmol;限定水用量大于等于400mmol,小于等于2200mmol,变化步长为100mmol;为保证对苯二甲酸的完全溶解,n,n-二甲基甲酰胺用量被限定为对苯二甲酸用量的80倍。
19.其中,优选地,s3中,所述计算搜索空间中ce-uio-66各性能的目标实现概率(pa)值并扩展为多目标评估因子,具体为:通过所述m个性能预测代理模型对搜索空间内各合成方案进行性能预测,得到m个预测值,确定性能预测值的均值μ与方差σ,确定材料缺陷含量目标g
dc(defect content)
=50%,热稳定性目标g
ts(thermal stability)
=300℃,按照公式确定搜索空间中每一合成方案对应各性能的目标实现概率(pa)值,其中,φ代表累积分布函数,μ(x)、σ(x)、g分别为预测的均值、预测的标准差和预期的预定目标值,通过公式计算各性能目标实现概率的加权累加,将评价因子扩展为多目标,其中ωm表示pam的权重,设置ωm=(0.7,0.3)确定缺陷含量和热稳定性的比例。
20.其中,该方法还包括如果测试数据满足需求则终止设计,获得多性能协同优化的ce-uio-66材料。
21.本发明的上述技术方案的有益效果如下:
22.1)采用机器学习辅助合成策略的高效规划的方式,避免了传统实验密集型的“试错”实验带来的资源上的浪费,降低了研发成本,缩短了研发周期;
23.2)采用多目标优化的设计方法协同提升了材料催化活性和热稳定性,具备良好的实用价值;
24.3)采用本发明提供的方法能够实现候选合成空间中全局最优合成方案的快速搜索,克服了广阔空间中海量实验方案难以进行逐一尝试的缺点。
附图说明
25.图1为本发明的逻辑框架图;
26.图2a为本发明中mofs缺陷含量性能预测的模型性能评估图。
27.图2b为本发明中mofs热稳定性性能预测的模型性能评估图。
具体实施方式
28.为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
29.实施例
30.在一个实施例中,如图1所示,本发明实施例提供一种基于机器学习的mofs合成路线多目标优化方法,包括如下步骤:
31.s1、针对ce-uio-66进行文献调研,建立包含反应温度、反应时间、甲酸用量、硝酸铈铵用量、对苯二甲酸用量、n,n-二甲基甲酰胺用量、水用量七维实验变量的ce-uio-66合成条件—性能数据集,包括合成条件、配体缺失的缺陷含量和热稳定性;确定热重分析数据
曲线的二阶导极值点,作为材料失重过程的区域,在失重区域的曲线台阶前水平处作切线与曲线拐点处作切线,两条切线的交点即为该材料失重过程起始发生的参考温度点,用于表征材料的热稳定性,作为机器学习的目标性能之一;两条切线交点的重量百分比记为y1,材料在500℃处完成失重过程,完全热分解后的重量百分比记为y2,通过理论公式计算ce6o
6+x
(bdc)
6-x
中配体缺失的缺陷含量用于表征材料的催化活性,作为机器学习的目标性能之一。
32.s2、分别针对缺陷含量性能训练集和热稳定性性能训练集,按照0.8:0.2的比例将数据集随机分成训练集和测试集,分别训练随机森林、核岭回归、支持向量机、k近邻、神经网络、xgboost、adaboost和lightgbm八种机器学习模型算法,以ce-uio-66合成条件为模型输入,缺陷含量和热稳定性为模型输出,采用贝叶斯优化方法进行模型超参数的调优,采用公式公式计算平均绝对误差,其中,x表示整个样本的训练集数据,y表示整个样本的测试集数据,xi表示实际表征的数据,yi表示机器学习模型预测的数据,i表示训练集或测试集中数据样本的序号,n表示训练集或测试集中数据样本的总数量,重复这个过程100次,计算mae在训练集和测试集上的均值以分析模型的准确性,将确定的最优参数模型应用于训练集进行训练。图2a和图2b所示分别为缺陷含量和热稳定性性能预测的adaboost模型性能评估图,其中,热稳定性性能预测的adaboost模型超参数为'learning_rate':0.80,'loss':'square','n_estimators':85,'random_state':420;缺陷含量性能预测的adaboost模型超参数为'learning_rate':0.19,'loss':'exponential','n_estimators':84,'random_state':420。
33.s3、根据所述的制备ce-uio-66的合成条件类别,确定反应温度、反应时间、甲酸用量、硝酸铈铵用量、对苯二甲酸用量、n,n-二甲基甲酰胺用量、水用量七维实验变量组成的ce-uio-66合成条件的搜索空间,限定反应温度大于等于30℃,小于等于130℃,变化步长为10℃;限定反应时间大于等于15min,小于等于1470min,变化步长为30min;限定甲酸用量大于等于0mmol,小于等于110mmol,变化步长为10mmol;限定硝酸铈铵用量为2mmol;限定对苯二甲酸用量大于等于1mmol,小于等于4mmol,变化步长为1mmol;限定水用量大于等于400mmol,小于等于2200mmol,变化步长为100mmol;为保证对苯二甲酸的完全溶解,n,n-二甲基甲酰胺用量被限定为对苯二甲酸用量的80倍。
34.进一步地,计算搜索空间中ce-uio-66各性能的目标实现概率(pa)值并扩展为多目标评估因子,具体为:通过所述m个性能预测代理模型对搜索空间内各合成方案进行性能预测,得到m个预测值,确定性能预测值的均值μ与方差σ,确定材料缺陷含量目标g
dc(defect content)
=50%,热稳定性目标g
ts(thermal stability)
=300℃,按照公式确定搜索空间中每一合成方案对应各性能的目标实现概率(pa)值,其中,φ代表累积分布函数,μ(x)、σ(x)、g分别为预测的均值、预测的标准差和预期的预定目标值,通过公式计算各性能目标实现概率的加权累加,将评价因子扩展为多目标,其中ωm表示pam的权重,设置ωm=(0.7,0.3)为缺陷含量和热稳定性在多目标优化过程中的权重比例。
35.s4、采用水热法依据候选合成方案制备ce-uio-66材料,步骤如下:
36.取硝酸铈铵溶于去离子水溶液中得到溶液a,同时取对苯二甲酸溶于n,n-二甲基甲酰胺溶液中得到溶液b,分别超声5min后将溶液b倒入溶液a中再超声1min使其混合均匀,随后将溶液倒入圆底烧瓶中,密封,在预期反应温度反应预期时间,冷却至室温后,使用dmf中离心洗涤两次,使用丙酮离心洗涤四次,所得的固体在70℃的空气中干燥24h,得到ce-uio-66材料。
37.s5、针对s4制备的ce-uio-66材料,空气气氛下,使用热重分析仪(tga)测定样品的热稳定性,升温速率为5℃
·
min-1
,升温范围从30℃到800℃,得到新制备ce-uio-66材料的合成条件和目标性能数据信息,再反馈至初始数据集执行各目标性能的迭代协同优化。
38.根据上述实施步骤,通过3轮实验迭代,每轮迭代中10个实验方案被选择实施,获得符合目标需求的ce-uio-66材料,其热分解温度达到303℃,缺陷含量达到45.03%,与在多目标优化中所设置的材料热稳定性目标g
ts
=300℃、缺陷含量目标g
dc
=50%基本一致。
39.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
技术特征:
1.一种基于机器学习的mofs合成路线多目标优化方法,其特征在于,包括以下步骤:s1、采集制备ce-uio-66的合成条件并通过热重分析曲线评估其缺陷含量及热稳定性,以此作为ce-uio-66合成条件—性能数据集;s2、将数据集随机划分为训练集和测试集,采用八种机器学习算法分别对ce-uio-66各性能进行建模,并筛选确定用于各性能预测的代理模型;s3、确定候选合成条件空间作为待优化的搜索空间,计算搜索空间中ce-uio-66各性能的目标实现概率pa值并扩展为多目标评估因子,筛选获得预期达到目标性能的合成方案;s4、采用水热法依据预期合成方案制备ce-uio-66材料;s5、对制备获得的ce-uio-66材料进行目标性能的表征测试,若测试数据不满足目标需求,则更新数据集及代理模型。2.根据权利要求1所述的基于机器学习的mofs合成路线多目标优化方法,其特征在于,s1中,所述ce-uio-66合成条件—性能数据集,具体为:针对ce-uio-66进行文献调研,建立包含反应温度、反应时间、甲酸用量、硝酸铈铵用量、对苯二甲酸用量、n,n-二甲基甲酰胺用量、水用量七维实验变量的ce-uio-66合成条件—性能数据集,包括合成条件、配体缺失的缺陷含量和热稳定性。3.根据权利要求1所述的基于机器学习的mofs合成路线多目标优化方法,其特征在于,s1中,所述通过热重分析曲线评估其缺陷含量及热稳定性,具体为:找到热重分析数据曲线的二阶导极值点,作为材料失重过程的区域,在失重区域的曲线台阶前水平处作切线与曲线拐点处作切线,两条切线的交点即为该材料失重过程起始发生的参考温度点,用于表征材料的热稳定性,作为机器学习的目标性能之一;两条切线交点的重量百分比记为y1,材料在500℃处完成失重过程,完全热分解后的重量百分比记为y2,通过理论公式计算ce6o
6+x
(bdc)
6-x
中配体缺失的缺陷含量用于表征材料的催化活性,作为机器学习的目标性能之一。4.根据权利要求1所述的基于机器学习的mofs合成路线多目标优化方法,其特征在于,s2中,所述在性能建模过程中,选用八种机器学习算法包括:随机森林、核岭回归、支持向量机、k近邻、神经网络、xgboost、adaboost和lightgbm八种机器学习算法,并使用贝叶斯优化进行超参数的调优。5.根据权利要求1所述的基于机器学习的mofs合成路线多目标优化方法,其特征在于,s2中,所述将数据集随机划分为训练集和测试集,筛选确定用于各性能预测的代理模型,具体为:在训练过程中,按照0.8:0.2的比例将数据集随机分成训练集和测试集,采用公式计算模型预测的平均绝对误差mae,其中,x表示整个样本的训练集数据,y表示整个样本的测试集数据,x
i
表示实际表征的数据,y
i
表示机器学习模型预测的数据,i表示训练集或测试集中数据样本的序号,n表示训练集或测试集中数据样本的总数量,重复这个过程100次,计算mae在训练集和测试集上的均值以分析模型的准确性,所述平均绝对误差最低的机器学习模型分别为用于材料缺陷含量和热稳定性性能预测的代理模型。6.根据权利要求1所述的基于机器学习的mofs合成路线多目标优化方法,其特征在于,
s2中,所述最优模型算法为adaboost算法。7.根据权利要求1所述的基于机器学习的mofs合成路线多目标优化方法,其特征在于,s3中,所述确定候选合成条件空间作为待优化的搜索空间,具体为:根据所述的制备ce-uio-66的合成条件,确定反应温度、反应时间、甲酸用量、硝酸铈铵用量、对苯二甲酸用量、n,n-二甲基甲酰胺用量、水用量七维实验变量组成的ce-uio-66合成条件的搜索空间,限定反应温度大于等于30℃,小于等于130℃,变化步长为10℃;限定反应时间大于等于15min,小于等于1470min,变化步长为30min;限定甲酸用量大于等于0mmol,小于等于110mmol,变化步长为10mmol;限定硝酸铈铵用量为2mmol;限定对苯二甲酸用量大于等于1mmol,小于等于4mmol,变化步长为1mmol;限定水用量大于等于400mmol,小于等于2200mmol,变化步长为100mmol;为保证对苯二甲酸的完全溶解,n,n-二甲基甲酰胺用量被限定为对苯二甲酸用量的80倍。8.根据权利要求1所述的基于机器学习的mofs合成路线多目标优化方法,其特征在于,s3中,所述计算搜索空间中ce-uio-66各性能的目标实现概率pa值扩展为多目标评估因子,具体为:通过所述m个性能预测代理模型对搜索空间内各合成方案进行性能预测,得到m个预测值,确定性能预测值的均值μ与方差σ,确定材料缺陷含量目标g dc
=50%,热稳定性目标g ts
=300℃,按照公式确定搜索空间中每一合成方案对应各性能的目标实现概率(pa)值,其中,φ代表累积分布函数,μ(x)、σ(x)、g分别为预测的均值、预测的标准差和预期的预定目标值,通过公式测的均值、预测的标准差和预期的预定目标值,通过公式计算各性能目标实现概率的加权累加,将评价因子扩展为多目标,其中ω
m
表示pa
m
的权重,设置ω
m
=(0.7,0.3)确定缺陷含量和热稳定性的比例。9.根据权利要求1所述的基于机器学习的mofs合成路线多目标优化方法,其特征在于,当测试数据满足需求则终止设计,确定多性能协同优化的ce-uio-66材料。
技术总结
本发明公开了一种基于机器学习的MOFs合成路线多目标优化方法。该方法为采集制备Ce-UiO-66的合成条件并通过热重分析曲线评估其缺陷含量及热稳定性,作为初始数据集;将数据集随机划分为训练集和测试集,采用八种算法分别对Ce-UiO-66各性能进行建模并筛选用于各性能预测的代理模型;计算合成空间内各性能的目标实现概率(PA)值并扩展为多目标评估因子;制备Ce-UiO-66材料;对获得材料进行表征测试,若测试数据不满足需求,则更新数据集及代理模型。本发明基于可靠的实验数据和机器学习,对优化MOFs的催化和稳定性能具有低成本、短周期等优点,可推广至其他材料合成路线的设计。可推广至其他材料合成路线的设计。可推广至其他材料合成路线的设计。
技术研发人员:王戈 林璟 高鸿毅 刘志盟 班涛 李恬 周圣澜
受保护的技术使用者:北京科技大学
技术研发日:2023.03.22
技术公布日:2023/7/20
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
