寻找具有定制性能材料的任务,正日益扩展到高阶组合空间,候选材料的数量相应成爆炸性增长。一个关键的挑战是,在合成空间中发现材料具有新特性的区域。传统的材料特性预测模型不够精确,无法指导搜索。在此,来自美国加州理工学院的John M. Gregoire等研究者,通过自动化实验和数据科学发现复杂氧化物。相关论文以题为“Discovery of complex oxides via automated experiments and data science”发表在Proceedings of the National Academy of Science of the United States of America上。论文链接:https://www.pnas.org/content/118/37/e2106042118数据科学,在材料研究中的日益融合,预计将加速发现性能改善的材料及其组合,用于需要多功能材料的技术应用。机器学习,是构建预测模型的一种流行方法,但有限的训练数据往往会影响预测的准确性,特别是在没有训练数据的组合空间。训练数据在高阶成分空间(例如,至少三个正离子氧化物)中特别有限,这为通过形成相(即包含所有三个正离子的晶体结构或替代合金),来调整多种性质提供了机会。大量潜在的高阶成分,超过了现有的发现或预测方法,而预测替代合金相及其性能,仍然是一个巨大的挑战。在此,研究者开发了两种数据科学方法,来发现高阶组成空间中的材料。相图模型采用热力学平衡假设,仅利用光学吸收数据提出候选相图。涌现特性模型,使用相同的数据,来识别那些光学特性不能用相同元素的低阶组分的组合来解释的组分。该工作还描述了高通量工作流的设计和实现,该工作流为这些模型提供数据,以及一个用于指导发现的示例用例。研究者的主要发现是,适当构建的数据科学模型可以使用传统上不用于相表征的数据来推断复杂材料的相行为。这些推论增加了现有数据集的科学价值,并指导了材料的发现工作。在此,研究者通过高通量实验,结合自动化质量控制和光谱显微镜数据建模,演示了这种方法在三阳离子氧化物系统中的应用。选择的三阳离子氧化物组合物与低阶氧化物组合物相比具有独特的性质,因此,可以进行更昂贵和耗时的结构和功能表征。这种方法不同于计算逆设计,在计算逆设计中,模型预测材料具有特定的性能,这是一种很有前途的策略,但受到了实验性能计算预测和可合成材料计算生成的双重挑战的阻碍。研究者的方法,将策略从识别具有特定属性的材料转变为快速筛选可能具有任何属性的材料。通过发布实验和分析数据库,研究者旨在加快社区对组合空间的选择,并在其中发现具有广泛属性的材料。由于组合空间的组合学,无论是通过实验还是计算,发现具有理想性质的复杂相都是非常具有挑战性的。搜索材料项目中含有氧的条目,拥有一个相关的无机晶体结构数据库条目,在排除惰性气体和非金属元素(He、Ne、Ar、Kr、Xe、Rn、C、N、F、P、S、Cl、Se、Br、I、H)的情况下,73个阳离子元素可生成755个1-阳离子氧化物。对双阳离子氧化物进行同样的搜索,发现的材料数量增加到4345种,尽管对三阳离子氧化物进行相应的搜索,只得到3163种材料。最终,研究者以Mg、Fe、Co、Ni、Cu、Y、In、Sn、Ce和Ta为基础,从108个三阳离子氧化体系中筛选了376,752个不同的组分。候选相图和具有突出光学性质的三阳离子组成的数据模型,指导了具有复杂相依赖性质的材料的发现,如Co-Ta-Sn取代合金氧化物的发现,其透明度、催化活性和在强酸电解质中的稳定性可调。这些结果,需要数据验证与实验设计的紧密耦合,以生成可靠的端到端高通量工作流,以加速科学发现。使用这种方法,就不需要使用自动化的高通量方法来测量感兴趣的每一种材料属性。(文:水生)图1 金属氧化物库的合成、表征和分析工作流程。图2 三阳离子氧化物光学制图的说明性范例和总结。图3 Sn-Co-Ta氧化物的光学相分析。图4 利用溅射沉积薄膜对Sn-Co-Ta氧化物成分空间进行后续研究。