导读:受制于耗时的传统试错方法和巨大的未开发成分空间,高效地发现具有优异性能的新型高熵合金仍然是一个巨大的挑战。在此,作者提出了一种基于机器学习的合金设计系统(MADS),以促进具有增强硬度的高熵合金的合理设计。首先构建硬度数据库,然后通过4步特征选择筛选出影响高熵合金硬度的关键特征。原子量的平均偏差( ADAW )、列的平均偏差( ADC )、比容的平均偏差( ADSV )、价电子浓度( VEC )和平均熔点( Tm ) 5个描述符被确定为关键特征。进一步,以这5个特征为输入,构建了基于支持向量机的硬度预测模型。训练好的模型在测试集和留一法交叉验证( LOOCV )中的Pearson相关系数均达到0.94。随后,通过实验合成了反投影和高通量筛选推荐的几种优化组合。最佳表现者表现出超高的硬度,比原始数据集中的最高硬度高出24.8 %。此外,引入夏普利加性解释( SHAP )提高模型的可解释性,表明VEC在硬度预测中具有重要作用。值得注意的是,当VEC < 7.5时,VEC对硬度有积极影响。成果展示:作者为了筛选出最合适的算法,引入了几种广泛使用的机器学习算法,包括多元线性回归(MLR) 、反向传播人工神经网络(BPNN) 、梯度提升回归(GB) 、随机森林(RF)、极端梯度提升(XGBoost) 、径向基核函数支持向量回归(SVR-rbf) 、线性核函数支持向量回归(SVR-lin)和多项式核函数支持向量回归(SVR-poly),构建了基于高熵合金元素成分的硬度预测模型。图1比较了基于各种算法的10折交叉验证的均方根误差(RMSE),皮尔逊相关系数(R)。显然,SVR-rbf模型优于其他模型,具有更高的R和更小的RMSE。据此,确定SVR-rbf为构建高熵合金硬度预测专用模型的机器学习算法。图1 以成分为输入,基于不同机器学习算法的建模结果比较图2(a)显示了去除高度相关特征的过程。根据已发表的文献,确定0.95为阈值。如果两个特征之间的皮尔逊相关系数大于0.95,则只保留建模误差较小的特征。经过该过程,特征数量从142个减少到85个。图2(b)利用RF算法去除不太重要的特征。RF可以对每个特征的重要性进行排序。如果一个特征的重要性小于某个阈值,则可以认为是不必要的。可以发现,将阈值设置为0.013是最佳选择。图2(c)是前向选择。构建SVR-rbf模型所选择的第一个特征往往与目标属性的关系最为密切,然后在随后的每一步中,选择与目标相关的净相关性最大的特征进入模型。当特征数增加到10时,模型产生的误差最小。图2(d)是最优子集选择。作者通过考虑上一步筛选出的10个特征的所有可能子集来建立多个模型,以确定使模型误差最小化的最佳子集合。基于不同特征子集的SVR-rbf模型的10倍交叉验证误差如图2(d)所示。最终,经过四步特征选择,从142个特征中筛选出5个关键特征,列于表1。
图2特征选择的过程。(a)相关性筛选。(b)基于RF的特征选择。(c)前向选择。(d)最优子集选择表1采用四步特征选择法筛选出的关键特征
以关键特征为输入,利用SVR-rbf建立了高熵合金维氏硬度的回归模型。以RMSE和R作为评价指标,估计硬度预测值与实验值之间的误差和相关性。图3 (a)和图3 (b)分别描述了训练集和测试集中高熵合金的预测硬度与相应的实验硬度。从图中可以看出,大部分数据点分布在对角线附近,说明预测结果与测量结果具有较好的一致性。同时,不可忽视的是,有几个点的偏离是相当明显的。预测硬度与实测硬度之间的差异可能是由于相应区域缺乏足够的数据以及铸态高熵合金硬度的不均匀性造成的。为了评估所获得的SVR-rbf模型的性能并防止过拟合,图3的(c)和(d)部分分别基于训练集的10倍交叉验证和LOOCV绘制了预测值作为高熵合金硬度实验值的函数。10折交叉验证和LOOCV的R都达到了0.94,这表明模型表现良好。此外,为了减少训练集和测试集的随机划分对模型的影响,将原始数据集按4:1的比例随机分割为训练集和测试集,共分割3次。然后根据选择的特征进行模型重建。对于10折交叉验证和LOOCV,训练集的平均R分别为0.94和0.95。对于测试集,R的平均值为0.93。这些结果在一定程度上揭示了训练好的模型的鲁棒性和通用性。
图3 预测硬度作为观察硬度的函数为( a )训练集,( b )测试集,( c )训练集的10倍交叉验证,( d )训练集的LOOCV ( N代表样本数)考虑到原始数据集中含钒合金具有较高的硬度,因此采用IP方法设计具有增强硬度的含钒高熵合金。在我们的数据库中,有34个含钒高熵合金样品,可分为硬度大于600 HV的15个正样品和硬度小于600 HV的19个负样品。图4说明了用Fisher方法对不同样品的含钒高熵合金进行模式识别。可以发现,两类样本除了4个错分点外,在虚线的左右侧均有较好的分布。由于正样本主要聚集在右侧,即最优区域,在该区域硬度增强的新样本可能按照趋势分布。此外,考虑到新的候选者最好位于硬度较高的样品附近,作者在图4中设计了两个以紫色五角星为标记的样品。这两个设计点可以看作是已知硬度较高样品的外推。利用IP可以获得设计样本在原始空间中的特征。设计的两个样品对应的成分分别为Co18Cr7Fe35Ni5V35和Al20Cr5Cu15Fe15Ni5Ti10V30。利用所建立的SVR-rbf模型对设计样品的硬度进行预测,结果汇总见表2。除了上述方法外,还采用了高通量筛选( HTS )来向下选择可能的成分组合,以发现具有所需硬度的成分,因为一些合金系统的样本很少,在模式识别的投影图上不存在明显的分布趋势。除含钒合金外,Al20Cr20Fe20Ni20Mo20合金在原始数据库中具有最高的硬度,由此构建Al-Cr-Fe-Ni-Mo合金系的虚拟成分空间,筛选出最优成分。利用已有的SVR-rbf机器学习模型,基于这些成分的5个关键特征,对虚拟样品的硬度进行预测。根据预测结果,筛选出硬度较高的Al21Cr27Fe29Ni5Mo18候选高熵合金。为了验证模型预测,合成并表征了IP和HTS推荐的3种组分。实验结果也列于表2。显然,Co18Cr7Fe35Ni5V35表现出优异的硬度,比原始数据库中的最佳值高24.8 %。预测误差为12.7 %,与之前评估的模型误差一致。对于Al20Cr5Cu15Fe15Ni5Ti10V30,预测误差为58.2 %。预测和实验之间的显著差异可能源于模型在原始数据集之外的外推预测的巨大风险。此外,在高维空间中,IP点的解不计其数。对于HTS推荐的Al21Cr27Fe29Ni5Mo18,预测误差为39.1 %,这可能源于搜索空间中已知数据的不足。
图4 采用Fisher方法对不同样品进行材料模式识别表2优化成分的硬度
如图5 ( a )所示,SHAP方法被用于计算特征重要性并评估特征对模型预测的影响。横坐标表示SHAP值,纵坐标表示不同的特征,每个点代表一个样本。一个特征的正负脉冲充电SHAP值意味着该特征提高/削弱了硬度。点的颜色代表了特征值的大小。颜色越黄,该特征的值越大。反之,颜色越绿,该特征值越小。对于单个特征而言,水平覆盖范围越广,该特征对预测结果的影响越大,即该特征越重要。从图5 ( b )中可以看出, VEC是这五个特征中最重要的因素。换言之,VEC在预测高熵合金硬度方面具有重要作用。由图5 (a)可知,VEC值越小,SHAP值越大,即硬度越大。对于其他4个特征,特别是ADAW、ADSV和ADC,这3个特征主要反映了高熵合金中原子尺寸的差异,表征了晶格畸变的程度。从图5 (a)中,我们可以发现,上述三个特征对硬度的影响表现出相当一致的正趋势。尺寸差异越大,硬度越高。
图5 基于SHAP的特征分析。( a )不同样本的SHAP值分布。( b )基于SHAP的特征重要性排序。图6 (a)显示了SHAP值随VEC的变化。有趣的是,当VEC为7.5时,VEC对硬度有正向影响。最后提到的特征是Tm。从图6 (b)中可以看出,当Tm为1800 K时,Tm对硬度有轻微的削弱或改善作用,Tm的影响主要为正。进一步分析Tm > 1800 K区域的数据散射,发现这些样品的成分基本都含有一些高熔点的元素,如Ti、Mo、V、Cr等,这些元素在之前的研究中已经被证明可以提高合金的强度和硬度。
图6 SHAP值随( a ) VEC,( b ) Tm的变化而变化为了进一步验证该方法的可靠性并证明其对其他铸态高熵合金的适用性,从已发表的文献中收集了138组Co-Cr-Ti-Mo-W系高熵合金的铸态硬度数据。根据各元素的成分和原子参数计算出关键特征,然后以上述特征为输入建立硬度预测模型。建模结果如图7所示,直接建模和LOOCV对硬度的预测误差分别为7 %和11 %。结果表明,这些关键特征对Co - Cr - Ti - Mo - W系高熵合金的硬度预测也有一定的影响,进一步证明了所发现的关键特征对其他高熵合金体系的硬度预测具有一定的泛化能力。
图7预测的硬度作为观察到的硬度的函数:( a )直接建模,( b ) Co-Cr-Ti-Mo-W高熵合金的LOOCV相关研究成果以:“A machine learning-based alloy design system to facilitate the rational design of high entropy alloys with enhanced hardness”为题发表在Acta Materialia 222 (2022) 1174 31,论文的第一作者为Chen Yang,通讯作者为Gang Wang ,Minjie Li ,Wencong Lu。论文链接:https:///10.1016/t.2021.117431。声 明:文章内容来源于张蓉 强韧之路。仅作分享,不代表本号立场,如有侵权,请联系小编删除,谢谢!
关注官微
加入群聊


会务组联系方式 展会咨询