https://oss.v-suan.com/2025/07/20250701091726692.jpg

顶刊综述|机器学习在二维材料中的运用

1. 引言

自石墨烯被发现以来,二维材料因其独特的物理和化学性质而受到广泛关注。这些材料具有丰富的内部自由度(如自旋、激子、谷、亚晶格和层伪自旋),以及通过精确选择堆叠顺序和相对晶体学排列来定制异质结构的能力。二维材料的这些特性使其在电子器件、光电器件、催化和能源存储等领域具有巨大的应用潜力。然而,由于涉及多维参数空间和大规模数据集,传统的实验方法和计算策略(如密度泛函理论(DFT)和分子动力学MD))变得越来越耗时和资源密集。

顶刊综述|机器学习在二维材料中的运用

机器学习ML)作为一种数据驱动的方法,能够显著降低计算成本,提高研究效率,并为二维材料的自主实验提供新的范式。ML通过从数据中学习模式和关系,能够快速预测材料的性质,优化制备工艺,并发现新的材料。文章通过分析187篇相关出版物,全面概述了机器学习在二维材料研究中的主要突破、年度发表数量、特定研究方向的发表数量和引用次数,展示了机器学习与二维材料交叉领域的快速发展。

2. 机器学习算法

2.1 目标识别

机器学习算法的选择取决于具体的研究目标。监督学习算法(如回归和分类)用于处理标记数据,而非监督学习算法(如聚类和降维)用于处理未标记数据。回归算法适用于预测连续值(如带隙和居里温度),而分类算法适用于解决离散任务(如热力学稳定性和磁性属性的预测)。例如,Miyazato等人在2018年使用高斯朴素贝叶斯分类算法搜索新型磁性二维材料,而Rajan等人则使用支持向量机(SVM)算法预测功能化MXenes的带隙。这些研究展示了机器学习在不同任务中的灵活性和适用性。

顶刊综述|机器学习在二维材料中的运用

2.2 数据收集与预处理

数据的质量和数量是影响机器学习模型性能的关键因素。数据可以从已发表的论文、实验和计算中获取。开源数据库(如C2DBMaterials ProjectICSD)为机器学习模型的训练提供了高质量的数据。数据预处理步骤包括处理缺失值、降噪、去除异常值和数据归一化。例如,Torelli等人使用PBE+U功能从C2DB中筛选磁性绝缘体,确保了数据的一致性和可靠性。此外,数据的标准化和归一化处理可以显著提高模型的训练效率和预测准确性。

顶刊综述|机器学习在二维材料中的运用

2.3 特征工程

特征工程是机器学习模型性能的关键因素之一。特征(或描述符)用于描述材料的属性,包括化学组成、原子或分子参数、结构参数和合成过程条件。特征选择算法(如LASSOPCA和决策树)可以去除冗余特征并建立结构性能关系。例如,Hansen等人使用成对原子间力场方法估计分子的原子化和总能量,确保了描述符的对称性和不变性。此外,特征工程还可以通过领域知识或算法(如SISSO)生成新的特征,从而提高模型的预测能力。

2.4 模型训练

在选择数据库和特征后,机器学习模型被训练并优化其参数。超参数的预设和调整可以通过网格搜索、随机搜索、贝叶斯优化等方法进行。模型验证和评估是确保模型泛化能力的重要步骤,常用的方法包括交叉验证和模型评估指标(如均方误差、平均绝对误差、决定系数等)。例如,Garg等人通过最小二乘法和线性回归优化特征数据,使用遗传算法和Nelder-Mead单纯形算法生成或选择候选特征,从而提高了模型的预测准确性。

3. 二维材料性质预测

3.1 热力学稳定性

热力学稳定性是高通量筛选二维材料的基本因素。Schleder等人基于C2DB数据库,使用SISSO方法构建特征空间并获得描述符,成功预测了非磁性材料的热力学稳定性。他们通过随机梯度提升决策树分类器评估每个描述符对输出预测的贡献,最终选择了六个最佳描述符。研究发现,周期表中的族和电子亲和力是描述热力学稳定性的关键因素。尽管研究没有涉及更复杂的磁性材料,但该方法成功地仅依赖于原型结构预测了热力学稳定性。

顶刊综述|机器学习在二维材料中的运用

3.2 热导率

热导率描述了材料传递热量的能力,是热管理和散热应用中的关键参数。Chan等人开发了一种基于监督机器学习的WSe2键序势模型(ML-BOP),成功预测了WSe2的热导率。该模型使用自定义的Tersoff-Brenner函数描述WSe2的原子间势,并通过DFT计算获得的特征数据(如晶格参数、弹性性质、状态方程、结合能和声子色散)进行训练。研究发现,模型能够准确预测单层、多层、无序和其他低维纳米结构的WSe2的热导率,为低维材料的热管理提供了重要指导。

顶刊综述|机器学习在二维材料中的运用

3.3 电子带结构

电子带结构是固体晶体的基本特征,决定了材料的电子性质。Thygesen等人基于非磁性二维半导体的DFT计算结果,使用梯度提升模型预测了约700种二维半导体的G0W0修正带结构。这些预测结果已发布在C2DB网页上,为二维材料的电子性质研究提供了宝贵的数据资源。此外,Ferreira等人基于不同晶格、几何和材料的二维和三维光子晶体,构建了多层感知器和人工神经网络(ANN),能够快速计算光子带隙和能量带结构。

顶刊综述|机器学习在二维材料中的运用

3.4 带隙

带隙是二维材料电子性质的关键参数,影响其在光电器件中的应用。Dong等人提出了一种材料描述符,用于识别混合硼氮石墨烯的结构与带隙之间的相关性,并成功预测了不同配置的带隙。他们训练了包括残差卷积网络(RCN)、VGG16卷积网络(VCN)和连接卷积网络(CCN)在内的卷积神经网络(CNN)模型,预测精度超过90%。此外,Zhang等人基于C2DB数据库,使用四种算法(支持向量回归、多层感知器、梯度提升决策树和随机森林)预测二维材料的带隙,发现梯度提升决策树和随机森林在预测二维材料的带隙值方面表现优于其他算法。

顶刊综述|机器学习在二维材料中的运用

3.5 机械性能

机械性能是二维材料在纳米机械和电子器件中应用的关键因素。Garg等人提出了一种基于机器学习的模型,用于建立石墨烯纳米结构的剪切模量与系统参数(如温度、缺陷和原子平面数量)之间的明确关系。他们的模型预测结果与现有实验结果一致,发现缺陷数量对剪切模量的影响最为显著。此外,Lew等人使用卷积长短期记忆模型(CLSTM)预测石墨烯的断裂机制,通过从分子动力学模拟数据集中提取断裂传播的时空关系,快速预测裂纹不稳定性和分支行为,从而优化了弹性纳米材料的设计。

顶刊综述|机器学习在二维材料中的运用

4. 新二维材料的发现

机器学习在新二维材料的发现中发挥了重要作用,显著加速了材料的筛选和设计过程。文章总结了多项研究,包括催化材料、光电器件材料和磁性材料的发现。

4.1 催化材料

Kumar等人开发了一个八面体二维材料的数据库,用于寻找高效的水分解光催化剂。他们通过机器学习模型分析了材料的活性位点与底物之间的相互作用,优化了催化剂的活性,并成功筛选出TaBNbTe2NbBHfTe2MoBMnBHfSe2TaSe2Nb@SAC等高效催化剂。这些研究展示了机器学习在催化剂设计中的潜力,通过结合DFT计算和机器学习,可以显著提高催化剂的性能。

顶刊综述|机器学习在二维材料中的运用

4.2 光电器件材料

Jin等人设计了一种基于机器学习和高通量筛选的高效方法,从ICSD数据库中识别出26种高效准确的二维光电器件候选材料。他们使用了包括梯度提升、支持向量机、随机森林、AdaBoost、随机梯度下降分类器、决策树和逻辑回归在内的多种机器学习算法,并通过四个指标(准确性、召回率、精确度和AUC)评估了模型性能。研究发现,梯度提升算法在预测二维光电器件材料方面表现最佳,为光电器件的设计提供了重要指导。

4.3 磁性材料

Lu等人构建了一个自适应框架,通过结合高通量DFT计算,成功筛选出20种铁磁半导体、21种半金属和51种金属。他们使用晶体图多层描述符和梯度提升算法,结合特征层选择和材料分类,最终通过DFT计算验证了预测结果。这项研究展示了机器学习在磁性材料研究中的潜力,特别是在处理小规模数据集时的高效性和准确性。

5. 二维材料的制备

机器学习在二维材料的制备中也有广泛应用,包括化学气相沉积(CVD)、机械剥离和液相剥离等方法。这些方法的优化和自动化对于实现高质量二维材料的大规模生产至关重要。

5.1 底部向上制备

Xu等人提出了一种训练模型,用于优化CVD合成参数(如反应温度、上升时间和沉积时间),以实现多层WTe2的可控生长。他们通过机器学习推荐的源比例(RTe/W)研究了其对样品形态的特定影响,发现源比例主导了WTe2纳米棒的长宽比。此外,Xia等人开发了一个基于深度学习的框架,用于分析动力学蒙特卡洛模拟的数据,并使用KNNSVMRF分类器预测WS2单层的各向异性生长。这些研究展示了机器学习在优化CVD合成参数和预测晶体生长方面的潜力。

5.2 顶部向下制备

机械剥离是一种简单且成本低廉的制备方法,但样品的尺寸、层数和形态难以控制。Shin等人设计了一种全自动机器人检测系统,结合深度神经网络和光学显微镜,对石墨烯进行分类。该系统能够根据层数、形状和厚度对石墨烯进行自动识别和分类,从而实现大规模生产。此外,Haraguchi等人设计了一种基于稀疏建模的尺寸分布预测器,用于从有机分散介质中剥离的表面修饰纳米片的尺寸预测。通过动态光散射(DLS)估计过渡金属氧化物纳米片的横向尺寸,并将潜在因素输入机器学习模型,成功获得了单分散纳米片。

6. 二维材料的表征

机器学习在二维材料的表征中也有重要应用,包括层数识别和缺陷定位。这些应用不仅提高了表征的效率和准确性,还为材料的性能优化提供了重要指导。

6.1 层数识别

Han等人利用卷积神经网络(CNN)研究了13种材料的光学显微镜图像,成功识别了二维材料的类型和厚度。他们通过随机旋转增强方法扩展数据集,提高了模型的泛化能力。研究发现,CNN模型能够准确识别13种二维材料的类型和厚度,对亮度、对比度、白平衡和光场不均匀性等特征变化具有较强的鲁棒性。此外,Dong等人通过合并超光谱反射图像和RGB图像,使用3D卷积神经网络(3D-CNN)识别和分割MoS2薄片,显著提高了数据收集和预处理的效率,并以超过80%的准确率预测层分布和分割单个层。

顶刊综述|机器学习在二维材料中的运用

6.2 缺陷识别

Yang等人提出了一种基于深度学习的模型,用于分类和定位二维过渡金属二硫化物中的原子掺杂剂和缺陷。他们使用环形暗场(ADFSTEM图像进行多层计算模拟,并通过CNN算法增强和去噪图像,以提高信噪比。研究发现,该模型能够以约1×10^12 cm-2的检测限和约98%的测量精度精确映射原子掺杂剂和缺陷的位置。此外,Lee等人通过冷却介导的CVD合成2H-WSe2-2xTe2x样品,并使用基于FCN的深度学习模型定位和分类点缺陷,生成缺陷的2D图。

顶刊综述|机器学习在二维材料中的运用

7. 二维材料基础研究的指导

机器学习在二维材料的基础研究中也发挥了重要作用,包括原子级缺陷对性能的影响、掺杂对电子性能的影响等。这些研究不仅深化了对二维材料性质的理解,还为新材料的设计和优化提供了理论支持。

顶刊综述|机器学习在二维材料中的运用

8. 总结与展望

文章总结了机器学习在二维材料研究中的潜力和挑战。尽管机器学习在降低计算成本和提高研究效率方面表现出色,但数据不足和模型的可解释性仍是主要挑战。文章强调了建立更完整的图像数据库的重要性,并展望了机器学习在二维材料研究中的未来发展方向。通过结合机器学习和传统计算方法,可以进一步加速二维材料的发现和应用,为材料科学领域带来革命性的变化。

原文链接:https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202305277

找华算做计算👍专业靠谱省心又省时!

益于理论计算化学的快速发展,计算模拟在纳米材料研究中的运用日益广泛而深入。科研领域已经逐步形成了“精准制备-理论模拟-先进表征”的研究模式,而正是这种实验和计算模拟的联合佐证,更加增添了论文的可靠性和严谨性,往往能够得到更广泛的认可。

“实验+计算”的模式已逐渐成为顶刊标配!
华算科技是专业的理论计算与科研测试解决方案服务商,为高校和企业的科研团队提供材料、催化、能源、生物等领域的理论计算和测试表征解决方案。

华算科技已向国内外1000多家高校/科研单位提供了超过50000项理论计算和测试表征服务,部分计算数据已发表在Nature & Science正刊及大子刊JACS、Angew、PNAS、AM系列等国际顶刊。

添加下方微信好友,立即咨询计算服务:电话/微信:13129551561
顶刊综述|机器学习在二维材料中的运用

声明:如需转载请注明出处(华算科技旗下资讯学习网站-学术资讯),并附有原文链接,谢谢!
(0)
上一篇 2025年4月14日 下午3:06
下一篇 2025年4月14日 下午3:10

相关推荐