0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于机器学习的分析和介绍以及应用

MATLAB 来源:djl 作者:Austin D. Sendek 2019-09-11 14:18 次阅读

2016 年 6 月 14 日,由喷气推进实验室研究人员打造的一款类猿灾区救援机器人 Robo Simian 在实验室内爆炸并起火。次年,在经历火灾和爆炸事件后,一家大型手机制造商全球召回新版平板电脑。自此以后,类似事件报道层出不穷。经认定,每一起事故的罪魁祸首都是锂离子电池

锂离子电池基础知识:液体电解质面临的问题

在锂离子电池中,随着电池的充放电,锂离子将在电解质中迁移。由于水与锂会发生反应,电池制造商使用有机溶剂(而不是水基溶剂)作为电解质。因此会导致这样一个问题:与水不同,汽油、发胶和洗甲水等有机溶液通常易燃而且不稳定。

除安全问题之外,液体电解质至少还有两个缺点。首先,很难使用液体电解质制造高电压电池,因为随着电压的增加很可能发生故障。其次,无法彻底阻止枝晶生长现象,这也是导致电池提前报废的主因。总之,正是由于存在上述种种缺点,人们才会不遗余力地寻找适合的固体电解质。

这些电池的问题在于采用液体电解质,倘若电池推动装置无法足够迅速地冷却,往往会引起液体蒸发或起火。研究人员正在积极寻找离子导电性和电化学稳定性良好的固体电解质材料,替换存在潜在危险的液体电解质,但进展始终十分缓慢。通过实验或模拟评估一种候选材料可能需要数周时间,材料项目数据库中包含超过 12,000 种含锂结晶固体,它们都有可能成为候选材料 — 更不必说尚未编入目录的数千乃至数百万种材料。

采用在MATLAB 中开发的机器学习模型,我和我的同事找到了好的方法:在我们分析的 12,000 多种材料中找到少量特殊固体电解质。运用一套已知良好的电解质及其原子结构进行训练,MATLAB 模型识别潜在新材料的效率比随机猜测高出三倍,比从事相关领域工作的斯坦福大学研究生的效率高出两倍。

从多个源收集数据

在 Evan Reed 教授的督导下,首先汇总三个来源的数据:材料项目数据库、发表的论文以及无机晶体结构数据库(ICSD,一种存储经实验验证的原子结构的在线数据库)。

首先,我们识别了材料项目数据库中的全部 12,831 种含锂固体。经过结构稳定性、化学稳定性和低电子导电性筛查后,排除了 92% 以上的初始材料。此外,还编译了有关材料地球丰度及其预测成本的信息。经过初始筛查后,剩下 300 多种稳定候选材料。当且仅当锂电导率足够快速时,才有望作为固体电解质材料。为实现这一目标,我们将目光转向机器学习。

首先梳理科学文献,找出 40 种固体结晶材料,再由研究人员确定晶体结构特征,在室温下测量离子电导率。在这 40 种材料中,约 1/3 具备作为有效电池电解质的离子电导率,但这些材料全部存在稳定性问题,难以在固态电池中采用。这 40 种快速和慢速锂导电材料将作为机器学习算法训练集,从而快速预测新材料的锂传导行为。

接着,从 ICSD 中下载这 40 种材料的原子结构。利用这些数据,根据结构中的原子位置、质量、电负性和原子半径计算 20 种特征,描绘每种晶体的原子局部排列和化学特性。所有计算全部在 MATLAB 中完成。我们选择的 20 种特征包括多项原子指标,如每个原子的体积、锂键离子性、锂邻元素数及最小阴离子-阴离子分离距离。或许是因为直觉,或许是过往文献报告,我们认定这 20 种特征可能与离子电导率息息相关。我们发现,对小数据集应用机器学习时,必需采用此类“智能”特征(即基于现有材料物理知识的特征)。

选择机器学习模型

接下来的问题是:如何组合应用这 20 种特征,使其最适合预测训练数据?鉴于训练集相对较小,只有 40 种材料和 20 种特性,加之 MATLAB 的建模简便性和灵活性,我们可以考虑采用 10,000,000 多种可能的特征和模型组合。

在 Statistics and Machine Learning Toolbox 的帮助下,研究人员可以轻松研究数量庞大的模型,包括最小二乘回归、稳健回归、局部加权最小二乘法、SVM、逻辑回归和多类分类。我们针对每种想要测试的机器学习算法训练了一个模型,然后参照训练数据验证算法准确性。

无论任何一种模型,单凭原子特征训练均不足以预测离子电导率,但多特征模型却可以做到。最终,确定了一个具有五项特征的最佳逻辑回归模型,该模型可分类训练集材料且交叉验证误差最低仅为 10%。这对我们而言意义重大,因为逻辑回归分类器往往适合像我们这样的小型训练集。这种逻辑回归分类器可进行二元预测:这种材料是否具备足以作为固体电解质材料的锂电导率?开展这项预测时,训练模型的准确率达 90%。

然后,我们对剩余的 300 多种候选材料启用这种训练模型(图 1)。

关于机器学习的分析和介绍以及应用

图 1 机器学习模型识别的候选材料。

在分类器的帮助下,我们剔除了 93.3% 的候选材料,仅留下 21 种潜在候选材料(最初为 12,831 种)。完成模型训练后,只需几秒钟即可完成筛选步骤。总之,我们通过筛查流程淘汰了 99.8% 的候选材料。

结果和后续步骤

为测试预测有效性,我们使用精确但缓慢的量子物理模拟方法模拟这些材料的锂传导行为。截至目前,在遵循基于机器学习的模型建议的情况下,发现新锂离子传导材料的速度比采用简单反复试验方法快三倍。我们甚至对模型与人类直觉进行了对比测试,为模型和斯坦福大学材料科学专业博士生小组,提供同一份随机抽取的材料列表。模型识别优质锂离子导体的准确性是博士生小组的两倍,而且预测时间不足千分之一。

模型识别的部分候选材料完全出乎意料。这些材料的原子结构非常复杂,我们无法凭科学直觉确定材料是否达到足够的离子电导率。事实证明,这些材料确实导电,与模型预测结果一致,对我们的直觉给予了有力验证。现在,我们可以将所学的知识融入后续版本的 MATLAB 机器学习模型,随着报告的实验数据日益增多,预计这些模型也将随之改进。我们发现了一种令人振奋的材料,并为它申请了专利,而且我们很快就找到了一家感兴趣的合作企业,一起申请专利许可并继续研究材料。

我们仍将在斯坦福大学内,同时与正在研究各种候选材料的外部团体合作,审查部分材料。不久的将来,某一种候选材料或许可以通过固体电解质验证,代替锂离子电池中的液体电解质,彻底终结电池组爆炸事故。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 锂离子
    +关注

    关注

    5

    文章

    521

    浏览量

    37115
  • 电解质
    +关注

    关注

    6

    文章

    756

    浏览量

    19682
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130580
收藏 人收藏

    评论

    相关推荐

    机器学习和深度学习的区别

      机器学习和深度学习是当今最流行的人工智能(AI)技术之一。这两种技术都有助于在不需要人类干预的情况下让计算机自主学习和改进预测模型。本文将探讨
    发表于 08-28 17:31 1057次阅读

    机器学习发展历程

    增长的必要手段之一。本文将介绍机器学习的发展历程,包括机器学习的现状、机器
    的头像 发表于 08-17 16:30 1214次阅读

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?

    有许多不同的类型和应用。根据机器学习的任务类型,可以将其分为几种不同的算法类型。本文将介绍机器学习的算法类型
    的头像 发表于 08-17 16:30 1410次阅读

    机器学习与数据挖掘的区别 机器学习与数据挖掘的关系

    机器学习与数据挖掘的区别 , 机器学习与数据挖掘的关系 机器学习与数据挖掘是如今热门的领域。随着
    的头像 发表于 08-17 16:30 1538次阅读

    数据挖掘和机器学习有什么关系

    数据挖掘和机器学习有什么关系 数据挖掘和机器学习是两个不同的概念,但它们有一些重要的相似之处。这篇文章将详细介绍数据挖掘和
    的头像 发表于 08-17 16:29 2077次阅读

    机器学习算法入门 机器学习算法介绍 机器学习算法对比

    机器学习算法入门 机器学习算法介绍 机器学习算法对比
    的头像 发表于 08-17 16:27 632次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    对数据的学习分析机器学习能够自动发现数据中的规律和模式,进而预测未来的趋势。 机器学习算法优
    的头像 发表于 08-17 16:11 1096次阅读

    机器学习算法汇总 机器学习算法分类 机器学习算法模型

    是解决具体问题的一系列步骤,机器学习的算法被设计用于从大量的数据中自动学习并不断改进自身的性能。本文将为大家介绍机器
    的头像 发表于 08-17 16:11 729次阅读

    机器学习算法的5种基本算子

    自主决策的方法和插件,其中包含了一系列常用的基本算子。在本文中,我们将会介绍机器学习算法的五种基本算子。 一、 求值算子 求值算子是常用的机器学习
    的头像 发表于 08-17 16:11 1343次阅读

    python机器学习概述

    是一种非常流行的编程语言,因为它具有非常强大的数据分析和科学计算库。Python可以被用来完成一系列的任务,包括机器学习、数据分析、图像处理、自然语言处理和深度
    的头像 发表于 08-17 16:11 769次阅读

    机器学习和深度学习的区别

    机器学习和深度学习的区别 随着人工智能技术的不断发展,机器学习和深度学习已经成为大家熟知的两个术
    的头像 发表于 08-17 16:11 3399次阅读

    机器学习可以分为哪几类?机器学习技术有哪些?

    对自然语言、图像、声音、视频等数据进行分析、分类、预测的重要方法之一。在日常生活和工作中,我们可以看到机器学习广泛应用于推荐系统、搜索引擎、语音识别、自然语言处理、计算机视觉、医学诊断等领域。
    的头像 发表于 08-17 16:11 4393次阅读

    创建一个边缘机器学习系统

    本指南适用于系统设计人员,可能使用Arm Flexible access程序。 本指南将帮助您开发可以执行机器学习的片上系统(SoC)在边缘。本指南中介绍的SoC可以处理与机器
    发表于 08-02 11:02

    使用Azure和机器学习进行传感器数据分析

    电子发烧友网站提供《使用Azure和机器学习进行传感器数据分析.zip》资料免费下载
    发表于 06-16 10:57 1次下载
    使用Azure和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>进行传感器数据<b class='flag-5'>分析</b>

    机器学习的经典算法与应用

      一、机器学习基础概念   关于数据   机器学习就是喂入算法和数据,让算法从数据中寻找一种相应的关系。   Iris 鸢尾花数据集是一个
    的头像 发表于 05-28 11:29 751次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用