机器学习顶刊汇总:Nature、AM、Mater. Today、Angew、Nat. Commun.等
•
顶刊解读
1. 9个共同一作,深度强化学习登上Nature,用于控制核聚变!
托卡马克是利用磁约束进行受控核聚变研究的环形装置,是产生可持续电力的主要候选者。其核心挑战是在托卡马克容器内形成和维持高温等离子体,这需要使用磁致动器线圈进行高维、高频、闭环控制,且由于各种等离子体配置的不同要求进一步复杂化。
在此,英国DeepMind公司Brendan Tracey, Jonas Buchli联合瑞士洛桑联邦理工学院Federico Felici等人展示了一种基于深度强化学习(RL)设计的磁控制器,并通过实验验证了其在托卡马克上的性能。
该架构可以自主学习控制全套控制线圈,具体通过与托卡马克模拟器的交互来学习,主要分为三个主要阶段:首先,设计者为实验指定目标,控制目标可能随时间变化。其次,深度RL算法与托卡马克模拟器交互,以找到接近最优的控制策略来满足指定目标。第三,以神经网络表示的控制策略直接在托卡马克硬件上实时运行。该策略被证明能够直接在硬件上进行托卡马克磁控制,成功地弥合了“模拟到真实”的差距,这实现了从对预先设计状态的工程驱动控制到由操作员指定目标的AI驱动优化的根本转变。与传统设计相比,该架构设计的控制器在结构上大大简化。RL驱动设计不是一系列控制器,而是创建单个网络控制器。
作者在可变配置托卡马克(TCV)上进行的实验中证明了本研究提出的控制器的有效性,并展示了对各种等离子体形状的控制,包括简单拉长的形状及高级等离子体如负三角形和“雪花”状等,实现了对这些等离子体的位置、电流和形状的准确跟踪。此外,作者还在TCV展示了持续的“液滴”,其中两个独立的等离子体同时保持在容器内,这代表了托卡马克反馈控制的显著进步。最重要的是,托卡马克磁控制是已应用RL的最复杂的现实世界系统之一。这是等离子体控制器设计的一个有前途的新方向,更广泛地说,该方法可以通过联合优化等离子体形状、传感、驱动、壁设计、热负荷和磁控制器来发现新的反应堆设计,以最大限度地提高整体性能。
Magnetic control of tokamak plasmas through deep reinforcement learning, Nature 2022. DOI: 10.1038/s41586-021-04301-9
2. 马蔚/彭茹雯/刘咏民AM: 嵌入式统计机器学习打破超表面的设计极限
作为二维超材料,超表面提供了一种前所未有的操纵光的方法,能够在单个平面器件中实现多重不同的功能。目前,大多数对多功能超表面的追求都是以增加结构复杂性为代价,依靠经验来适应更多功能,而几乎没有研究给定超原子的内在限制以达到设计的最终极限。
为此,浙江大学马蔚研究员、南京大学彭茹雯教授及美国东北大学刘咏民教授等人从概念上提出了一种统计视角来评估多功能超表面的设计能力并因此展示了一种端到端的设计流程,可以在给定的参数空间中通过实验实现这种物理约束的优化设计。到目前为止,使用传统参数扫描或基于算法的逆向方法的多功能超表面设计都遵循两步自上而下的设计方案。
首先,将设计目标手动解耦为几个子功能,并检索超表面平面上的理想光学响应分布。随后,设计有限数量的代表性超原子来近似离散化的相位和幅度值。这些方法将超表面上所需光学响应分布的检索和单个超原子的设计隔离开来,因此所需超原子响应的复杂性增加。相比之下,作者将统计机器学习(ML)作为直接连接每个单个超原子的结构参数和目标超表面性能的桥梁,从而将超原子的设计能力推向极限。
图1. 在多功能超表面全息图的GS算法中嵌入统计学习模型
本研究提出的ML模型由多个概率逆检索模型和一个确定性预测模型组成,准确捕捉并忠实再现了超原子结构的高维联合分布及其光学响应的统计特征,可通过根据特定的超表面功能将所提出的ML模型与其他算法嵌入端到端设计循环中来实现系统级多目标优化。最终,作者首次在不涉及空间复用或Pancharatnam-Berry相位的情况下实现了超表面聚焦透镜和全息图,在频率和偏振的不同组合下显示多达8种不同的光学响应。值得注意的是,这项工作中使用的ML模型是一种通用的逆向设计解决方案,不限于基于等离子体共振的耦合矩形谐振器超原子,该设计策略和实验演示将激发应用ML和其他AI技术来改变光学设计、集成和测量领域的研究热情。
图2. 针对x和y偏振的目标、计算和实验测量的多色全息图像
Pushing the limits of functionality-multiplexing capability in metasurface design based on statistical machine learning, Advanced Materials 2022. DOI: 10.1002/adma.202110022
3. Mater. Today: 监督机器学习用于预测微图案表面的粘附强度
纤维状干性粘结剂由于其可调节的粘合力而在许多应用中显示出巨大的潜力,特别是用于易碎物体的拾取和放置处理。计算其粘合性能是一个多尺度接触力学问题,特定情况可以通过数值方法解决。然而,这种方法对于动态拾取和放置处理操作的在线监测来说过于缓慢,无法在机器人程序中应用。
在此,德国莱布尼茨新材料研究所Eduard Arzt等人提出了一种在线监测系统,该系统通过对与光滑玻璃基板接触的单个原纤维阵列(接触半径为350 µm)进行光学分析,然后预测其粘附性能。
作者运用监督学习算法通过光学观察来预测微图案干胶粘结剂的粘合性能,拉脱力的变化被确定为试样与标称平面玻璃基板之间的错位角、单个原纤维粘附力的统计分布及中心和模拟偏心夹持的函数。预测依赖于接触特征(即从光学图像中提取的视觉特征),这些特征是在预加载时从接触中提取的,利用透明基板中受挫式内部全反射来增强对比度。反过来,这些特征被用于创建线性模型并训练不同的线性和非线性回归模型,以根据未对准角度预测粘附力。
最终,可以得出以下结论:(1)监督学习算法和原位观察技术可以成功地高精度预测粘附性能。事实上,这种新方法不仅克服了线性数学模型和现有解析模型精度有限的问题,甚至包括耗时的数值模拟问题,并有助于在处理过程中进行近乎实时的预测。(2)从测试的回归算法来看,支持向量回归(SVR)模型具有最高的R2(0.84)、最低的均方根误差(RMSE=0.72)和平均绝对误差(MAE=0.46),表现出最佳的预测性能并且优于文献中报道的分析模型。总体而言,这种新方法可以通过近乎实时的接触观察来预测抓取物体,这可能会极大提高拾取和放置处理的操作可靠性。
Predicting the adhesion strength of micropatterned surfaces using supervised machine learning, Materials Today 2022. DOI: 10.1016/j.mattod.2022.01.018
4. Angew: 人工神经网络用于预测无机离子对在水中的溶解度
无机离子对的溶解、结晶和沉淀在自然过程和合成中极为重要,但很少有溶解度预测模型能够超越晶格能量与溶解度的反比关系,尽管这种关系并不总是正确。
在此,美国俄勒冈州立大学May Nyman教授及西班牙加泰罗尼亚化学研究所Carles Bo教授等人基于碱金属-多金属氧酸盐(POM,由前过渡金属离子通过氧连接而形成的一类多金属氧簇化合物)的研究,在[Nb24O72H9]15-(Nb24)中确定了碱金属-POM对的第三种一般溶解度趋势。该趋势介于正常溶解度和异常溶解度趋势之间,具有两性溶解度的阴离子在中间碱(Na、K)中的溶解度最低,并且作者在实验上首次描述了Nb24-POM。通过计算,作者定义了一个描述符(σ曲线)并使用Kohonen人工神经网络(KNN)来预测从简单卤化物到直径为几纳米且包含>100原子的含氧阴离子的大小和复杂性范围内的所有三种溶解度趋势:两性,正常(Li+>Na+>K+>Rb+ >Cs+)和异常(Cs+>Rb+>K+>Na+ >Li+)。
作者通过实验证明了另外两种POM([TiNb9O28]7-,TiNb9;[Ti2Nb8O28]8-,Ti2Nb8)的两性溶解度趋势,从而验证了该描述符的准确性。水中碱金属-Ti2Nb8离子相互作用的溶液和固态研究都显示出其强烈的二聚化趋势,并产生了一种新的POM [Ti6Nb14O54]14-,其在计算上被预测具有异常溶解度。基于以上结果,现在有两个 POM(Nb10和Ti2Nb8)的例子,它们具有预测/实验确定的与碱的两性溶解度趋势。此外,上述POM经历溶液相转变为不同的POM后也表现出两性溶解度(Nb24 和 Ti3Nb7-二聚体)。这一结果表明,在水性金属氧化物化学中虽然pH是众所周知的溶解度和物种形成的驱动因素,但经常被忽视的支持性反离子和电解质是许多反应的活跃和重要参与者。
Predicting the Solubility of Inorganic Ions Pairs in Water, Angewandte Chemie International Edition 2022. DOI: 10.1002/anie.202117839
5. Nat. Commun.: 通过概率嵌入的对比学习预测用于材料发现的状态密度
用于材料发现的机器学习主要集中在预测单个标量而不是多个相关属性,其中光谱属性是一个重要示例。基本的光谱特性包括声子态密度(phDOS)和电子态密度(eDOS),它们分别/共同是大量可观察材料和功能的起源。
在此,美国加州理工学院John M. Gregoire, 康奈尔大学Carla P. Gomes及劳伦斯伯克利国家实验室Jeffrey B. Neaton等人受GATGNN、CGCNN和MEGNet模型的启发,提出了一种建立在H-CLMP(一个多属性预测模型,用于预测仅来自材料成分的实验光学吸收光谱)概念之上的材料到光谱(Mat2Spec)模型。该模型通过图神经网络(GNN)材料编码器与概率嵌入生成和对比学习相结合,解决了光谱特性预测的开放挑战。首先,将标签和特征编码到潜在的高斯混合空间中,对齐特征和标签嵌入以利用底层相关性;然后,利用对比学习最大化特征和标签表示之间的一致性以学习标签感知特征表示。这两个模块可以分别被认为是一个多组件编码器和解码器,它们共同形成一个端到端模型。
作者演示了Mat2Spec用于eDOS和phDOS光谱预测,并将其用于Materials Project中具有周期性晶体结构的广泛材料集。考虑到生成这些光谱的计算成本及预测这些光谱的能力,该模型代表了一种有价值的工具来执行材料筛选以指导从头计算。研究表明,当应用于小型但质量更高的光谱数据集时,Mat2Spec可以提供更大的计算节省,这些数据集通常从头计算或实验测量的成本更高。此外,作者通过一个基于金属系统中低于但接近费米能量(VB)带隙的识别证明了材料发现的这种加速。最重要的是,该模型可以推广到其他领域,如物种的丰度预测、分类问题的二元交叉熵损失及物种的存在/不存在预测等。
Density of states prediction for materials discovery via contrastive learning from probabilistic embeddings, Nature Communications 2022. DOI: 10.1038/s41467-022-28543-x
6. 亚眠大学npj Comput. Mater.: 人工神经网络多相分割电池电极纳米CT图像
电池电极断层扫描(CT)图像的分割是一个关键的处理步骤,将对材料表征和电化学模拟的结果产生额外的影响。然而,手动标记X射线CT图像(XCT)非常耗时,并且这些XCT图像通常难以用直方图方法进行分割。
在此,法国亚眠大学Arnaud Demortière等人针对现实世界的电池材料数据集提出了一种具有不对称深度编码-解码器卷积神经网络(CNN, LRCS-Net)的深度学习方法,并展示了在开源SegmentPy软件框架内从头开始训练CNN的工作流程。在编码器端,LRCS-Net总共包含五层卷积和三个索引最大池(MP),并以sigmoid函数而不是网络其余部分中应用的泄漏函数结束。在解码器端包含八层卷积,每个块的第一个卷积层具有三个上采样接收索引。尽管与常用的U-net网络相比,该模型在其他领域的语义分词中可训练参数较少,但CT图像每秒吞吐量可以达到U-net的两倍,且对十亿体素体积的预测速度快四分之一。此外,通过调整超参数(HP)可提高CNN的性能。在研究的HPs中,学习率和批量大小是最敏感的,因此需要仔细调整。
图1. LRCS-Net与输入图像和损失函数组合的示意图
此外,这些发现已在锂离子电池正极的两个XCT数据集上得到验证,并且使用相衬技术在另外两个Li-O2电池数据集上也可重现。进一步,作者还展示了将迁移学习应用于类似数据集中训练的增量效果。总之,目前的工作不仅证明了CNN的预测能力,而且还解决了电池CT材料分割中不确定性这一具有挑战性的话题。作者通过识别由于训练数据中稀释的人为偏见而导致的不确定性来解开分割质量的这种模糊定义,使用合成数据的进一步CNN训练显示了这种不确定性对材料特性的定量影响。最后,作者建议在实践中可以进行更精细的分割调整,且可以使用更多的CT切片来组成每个数据集。
Artificial neural network approach for multiphase segmentation of battery electrode nano-CT images, npj Computational Materials 2022. DOI: 10.1038/s41524-022-00709-7