0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI算法新成果:在不需要额外训练的情况下,可自主发现实用新材料

ss 来源:学术头条 作者:学术头条 2020-11-26 17:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

每当看到 AI 这个词,你脑海中是否会浮现出超级智能计算机?或者想到不需要人类辅助即可执行任务的机器人?或许,这些梦想并不遥远。

近年来,机器学习在化学领域的应用正以惊人的速度增长,在材料性能预测、新材料探索与设计等领域也取得了很大进展。但是,机器学习与实验过程的直接耦合还存在巨大的挑战。

近日,一个包括美国国家标准与技术研究所(NIST)在内的多机构研究团队在 AI 研究领域取得了又一项重要研究成果:他们开发出了一种名为 CAMEO 的 AI 算法,该算法在不需要科学家额外训练的情况下,自主发现了一种潜在的实用新材料。利用 CAMEO 算法实现的 AI 系统,可以有效地减少科学家在实验室中花费的“反复”实验时间,同时最大限度地提高科研效率。

该研究成果以“ On-the-fly closed-loop materials discovery via Bayesian active learning ”为题,于 11 月 24 日在线发表在科学期刊《自然-通讯》(Nature Communications)上。

对此,论文作者之一、NIST 研究员 Aaron Gilad Kusne 表示,在材料科学领域,科学家们一直以来都在不断寻求可用于特定应用场合的新材料,比如 “一种可用于制造汽车的轻巧坚固金属,或者可承受喷气发动机的高应力和高温环境的材料”。

帮助解决科研痛点

新材料的发现是推动现代科学发展与技术革新的源动力之一,而传统的材料研发需要进行大量的试验,效率低且成本高——要想寻找这样的新材料,不仅需要研究人员进行大量的实验,还需要耗费大量的时间去做理论调查。

如果一个研究人员想要分析一种材料在不同温度下的特性,那么他可能需要在各种不同温度下进行 N 次试验。然而,温度只是材料的一个指标之一,如果在一项实验中有 5 个指标要分析,每个指标又有 10 个值,那就意味着该研究人员必须进行 10^5 次试验。

Kusne 表示,对于试验次数如此多的实验,研究人员可能会花费几年甚至几十年的时间,所以,这样的实验,几乎不可能进行。

CAMEO 算法的“用武之地”正在于此,CAMEO 可以跳过那些会提供冗余信息的实验,确保每个实验都可以最大限度地帮助科学家获取知识和见解,提升他们的理解能力。通过节省实验时间,可以有效帮助科学家更快实现其目标,也使实验室的有限资源能够得到更有效地利用。

那么,CAMEO 算法如何实现这一点?

CAMEO 是基于机器学习的一个自学习 AI 算法,为材料研究领域的探索提供了一种全新的范式。CAMEO 通过闭环操作来寻找有用的新材料,首先从数据库中加载材料数据,然后通过贝叶斯机器学习对数据进行分析,预测未知材料的结构和功能特性,并通过主动学习来确定下一步要研究的最有价值的材料。在进行下一轮实验之前,CAMEO 还可以要求科学家根据过去所执行的实验经验,提供材料的晶体结构等信息。

论文作者之一、马里兰大学材料科学与工程教授 Ichiro Takeuchi 表示:“实验的关键在于,我们能够在一个由多种材料构成的组合库中启动(unleash)CAMEO 算法。”

在通常的组合研究中,阵列中的每一种材料都会被依次测量,以寻找具有最佳性能的化合物。即使使用快速的测量设置,也需要花费很长时间。而有了 CAMEO 算法,仅需很少量的常规测量就可以找到最佳材料。

图 | CAMEO 在一个闭环操作中寻找新材料的过程(来源:NIST)

该 AI 算法还被设计成包含关键原理的知识,包括过去的模拟和实验室实验的知识、设备的工作原理以及物理概念。例如,研究人员使 CAMEO 掌握了相位图知识,相位图描述了材料中原子的排列如何随化学成分和温度的变化而变化。而理解原子在材料中的排列方式对于确定材料的特性至关重要,根据排列方式可以确定材料的硬度、电绝缘性,以及材料的应用场合。

Kusne 说:“CAMEO 算法是无监督的,许多类型的 AI 算法都需要进行训练或监督,我们不要求它学习物理规律,而是将它们编码到 AI 中。这样一来,就不需要人类再去训练 AI 模型。”

了解材料结构的最佳方法之一是 X 射线衍射法,即使用 X 射线轰击材料。通过识别 X 射线反射的角度,科学家可以确定原子在材料中的排列方式,从而使他们能够确定其晶体结构。然而,一次内部 X 射线衍射实验可能需要一个小时或更长时间。在斯坦福同步辐射光源(SSRL)进行的实验中,由于快速移动的粒子会发射大量的 X 射线,一台足球场大小的大型机器以接近光速的速度加速带电粒子,整个过程可能需要 10 秒钟。

(来源:Nature Communications)

CAMEO 算法安装在一台计算机上,通过数据网络与 X 射线衍射设备相连接,通过确定 X 射线反射的角度,科学家们可以确定原子在材料中的排列方式,从而弄清楚材料的晶体结构。在每次进行新的迭代时,CAMEO 都会从过去的测量中学习并确定下一个要研究的材料。这使得 AI 可以探索材料的成分如何影响其结构,并确定完成任务的最佳材料。

Kusne 说:“把这个过程想象成制作一份完美的蛋糕,你正在混合各种类型的材料(比如,面粉、鸡蛋或黄油),通过使用各种配方来制作最好的蛋糕。” 而借助人工智能,则可以搜索制作 “配方” 或实验流程,来确定材料的最佳成分。如此一来,便节省了大量的实验时间。

自主发现,性能更优

CAMEO 就是使用这种方法发现了 GST467 材料。

CAMEO 通过给定的 177 种潜在的材料进行研究,这些材料涵盖了大范围的组成配方。为了获得这种材料,CAMEO 耗时 10 小时完成了 19 个不同的实验,相比之下,一个科学家大约需要 90 个小时才能完成同样多的实验。

图 | GST467 的发现过程(图片来源:nature communications)

CAMEO 发现的新材料 GST467 由三种不同的元素(锗、锑、碲,Te-Ge-Sb)组成,是一种相变存储材料,即当它受热迅速熔化时,其原子结构会从晶态(原子在指定的、有规律的位置上的固体材料)变为非晶态(原子在随机位置上的固体材料)。这种相变存储材料被用于数据存储等电子存储应用程序。

图 | GST467 的纳米结构和器件性能(图片来源:nature communications)

虽然 Ge-Sb-Te 合金系统中可能存在无限种成分变化,但 GST467 是适合相变应用的最佳材料。研究人员希望 CAMEO 算法能找到最佳组合的 Ge-Sb-Te 合金,以满足在晶态和非晶态之间的 “光学对比度” 差异最大的特性。

例如,在 DVD 或蓝光光盘上,光学对比度允许扫描激光通过区分高反射率或低反射率的区域来读取光盘。研究人员发现,GST467 的光学对比度是 DVD 常用的材料 GST225 的两倍,较大的对比优势也使其表现出了明显优于传统材料的特性。

GST467 还可应用于用于控制电路中光的方向的光子开关器件,还可以应用于神经形态计算(旨在开发模拟大脑神经元结构和功能的设备,为新型计算机的出现以及从复杂图像中提取有用数据等其他应用提供可能)。

远程科研或成现实

研究人员认为,不只是 GST467,CAMEO 还可以发现许多其他材料。如今,他们已经将 CAMEO 的代码开源,免费提供给科学家和研究人员使用。

与类似的机器学习方法不同,CAMEO 算法不是对大量数据进行机器学习和预测,而是通过关注晶体材料的成分、结构和性质之间的关系,追踪材料相应功能的结构来源,引导系统发现有用的新化合物。

CAMEO 的一个好处是最大限度地降低了成本,因为在同步加速器设施中进行实验是需要花费时间和金钱的。研究人员估计,使用 CAMEO 可以将实验数量减少十分之一,相应地可以将实验时间缩短十倍。由于人工智能正在运行测量数据、收集数据,分析数据的过程,这也大大降低了研究人员进行实验所需的知识量,他们只需关注正在运行的 AI 系统。

CAMEO 的另一个好处是为科学家提供了远程工作的能力。SLAC 美国国家加速器实验室的研究员 Apurva Mehta 说:“这掀起了一波科研热潮,科学家不需要在实验室中,就可以继续工作和生产。” 这可能意味着,如果科学家们可以依靠人工智能在实验室进行实验,更加安全地远程从事传染性疾病或病毒的研究。

研究人员表示,他们将继续改进这一 AI 算法,并尝试使该算法可以解决更复杂的问题。Kusne 说:“CAMEO 拥有机器人科学家的智慧,它的构建,是为了以一种非常高效的方式,来设计、运行和学习实验。”

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4802

    浏览量

    98521
  • AI
    AI
    +关注

    关注

    91

    文章

    41049

    浏览量

    302557
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI大模型微调企业项目实战课

    业、守规矩、完全掌控的专属 AI 底座,已经成为头部企业的隐性共识。 二、 核心破局:微调——用极低成本撬动专业能力 很多企业对“自主训练大模型”存在误解,认为这
    发表于 04-16 18:48

    哪些情况下需要用单模光缆

    单模光缆因其独特的传输特性,需要长距离、高速率、低损耗或抗干扰能力强的通信场景中具有显著优势。以下是需要使用单模光缆的典型情况: 1. 长距离通信需求 跨城/跨国骨干网:单模光缆的传
    的头像 发表于 01-20 10:45 279次阅读

    STM32H5开发VL53L8CX(2)----设置自主模式

    自主模式”(Autonomous mode)通常指的是设备或系统能够没有外部输入的情况下独立完成任务。对于传感器,如VL53L8,自主模式可能意味着传感器可以独立、定期地进行测量,
    的头像 发表于 12-22 15:29 2293次阅读
    STM32H5开发VL53L8CX(2)----设置<b class='flag-5'>自主</b>模式

    请问SPI为什么不需要加上拉电阻?

    SPI为什么不需要加上拉电阻?
    发表于 11-25 07:52

    系统c盘满了怎么清理不需要文件

    不需要的文件, 按步骤逐条操作, 每步后检查可用空间, 如果不确定要删除哪个文件, 先备份到外置硬盘或云端, 这些步骤优先考虑安全, 避免删除 windows 运行所需的系统文件.   步骤 1, 清空回收站   你删除的文件会进入回收站, 仍然占用空间, 桌面右键回收
    的头像 发表于 11-22 09:30 1205次阅读

    AES和SM4算法重构分析

    Table,LUT)和基于伽罗瓦域(Galois Field,GF)两种方式。基于LUT实现S盒,AES加解密需要2块LUT,SM4加解密需要1块LUT,合计3块LUT。然而,两种算法的S盒
    发表于 10-23 07:26

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    优化计算资源并有效地适应任务的复杂性。 显著特征: MoE 模型的一个显著特征是管理大型数据集方面的灵活性较高,它能够计算效率小幅降低的情况下,将模型容量扩大上千倍。稀疏门控混合专家层
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望没有人类的引导AI自主的提出科学假设,诺贝尔奖级别的假设哦。 A
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    持续发展体现在: 1、收益递减 大模型的基础的需要极大的算力,这首先源于昂贵的高性能AI芯片,然后是宝贵的电力、水等与环境相关的资源。 收益递减体现在: ①模型大小 ②训练数据量 ③训练
    发表于 09-14 14:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    同时软件算法材料工艺等方面也需要着重大创新。 ①算法/模型创新②工艺/器件创新③材料创新
    发表于 09-12 16:07

    AI 芯片浪潮,职场晋升新契机?

    运算能力,是其深度学习训练环节发挥优势的关键,相关工作成果对证明专业能力极为重要。 若投身于 FPGA 芯片研发,鉴于 FPGA 重构、灵活性高以及
    发表于 08-19 08:58

    光纤线需不需要套管

    光纤线是否需要套管,需根据具体应用场景、环境条件及安装要求综合判断。大多数实际工程中,为了保护光纤、确保信号稳定性和延长使用寿命,套管是必要的防护措施。以下是详细分析: 一、需要套管的情况
    的头像 发表于 08-07 09:45 2371次阅读
    光纤线需<b class='flag-5'>不需要</b>套管

    奇瑞汽车亮相2025年国际汽车新材料大会

    题,邀请了9位院士、80余位各领域专家与会交流,设置了一个主会场、9个新材料专业分会场,旨在深入探讨新材料汽车领域的最新进展与应用前景,着力推动产学研用深度融合,加速科技成果的转化与
    的头像 发表于 05-27 16:32 989次阅读

    不借助Linux系统,Windows如何搭建ZMC900E交叉编译环境

    嵌入式Linux系统,由于系统资源的匮乏,通常无法安装本地编译器进行本地开发,而需要在借助一台主机进行交叉开发。一般情况下主机安装相应的交叉编译器,将在主机编
    的头像 发表于 05-21 11:34 1072次阅读
    不借助Linux系统,<b class='flag-5'>在</b>Windows<b class='flag-5'>下</b>如何搭建ZMC900E交叉编译环境

    海思SD3403边缘计算AI数据训练概述

    AI数据训练:基于用户特定应用场景,用户采集照片或视频,通过AI数据训练工程师**(用户公司****员工)** ,进行特征标定后,将标定好的训练
    发表于 04-28 11:11