0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解

智能感知与物联网技术研究所 来源:未知 2023-12-18 15:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


除了模仿人类说话、写作、写代码,大模型还能用来发现新知识。

作为今年 AI 圈的顶流,大型语言模型(LLM)擅长的是组合概念,并且可以通过阅读、理解、写作和编码来帮助人们解决问题。但它们能发现全新的知识吗?

由于 LLM 已被证明存在「幻觉」问题,即生成与事实不符的信息,因此利用 LLM 来做可验证的正确发现是一项挑战。

现在,来自 Google DeepMind 的研究团队提出了一种为数学和计算机科学问题搜索解决方案的新方法 ——FunSearch。FunSearch 的工作原理是将预训练的 LLM(以计算机代码的形式提供创造性解决方案)与自动「评估器」配对,以防止产生幻觉和错误思路。通过在这两个组件之间来回迭代,最初的解决方案演变成了「新的知识」。相关论文发表在《自然》杂志上。


论文地址:https://www.nature.com/articles/s41586-023-06924-6

这项工作是首次利用 LLM 在科学或数学的挑战性开放问题方面取得新发现。

FunSearch 发现了 cap set 问题的全新解决方案,这是数学中一个长期存在的开放问题。此外,为了展示 FunSearch 的实际用途,DeepMind 还用它来发现更有效的算法来解决「装箱」问题,该问题应用广泛,比如可以用于提高数据中心的效率。

研究团队认为 FunSearch 将成为一个特别强大的科学工具,因为它输出的程序揭示了其解决方案是如何构建的,而不仅仅是解决方案是什么。这将会激发科学家的进一步见解,从而形成科学改进与发现的良性循环。

通过语言模型的进化推动发现

FunSearch 采用由 LLM 支持的进化方法,鼓励并推动得分最高的思路想法。这些想法被表达成计算机程序,以便它们可以自动运行和评估。

首先,用户需要以代码的形式编写问题的描述。该描述包括评估程序的过程和用于初始化程序池的种子程序。

FunSearch 是一个迭代过程,在每次迭代中,系统都会从当前的程序池中选择一些程序,并将其馈送到 LLM。LLM 创造性地在此基础上进行构建,生成新的程序,并自动进行评估。最好的程序将被添加回现有程序库中,从而创建一个自我改进的循环。FunSearch 使用 Google 的 PaLM 2,但对其他接受过代码训练的方法兼容。

LLM 会从程序数据库中检索出生成的最佳程序,并被要求生成一个更好的程序。

众所周知,在不同领域发现新的数学知识和算法是一项艰巨的任务,很大程度上超出了当前最先进人工智能系统的能力。为了让 FunSearch 做到这一点,该研究引入了多个关键组件。FunSearch 不是从头开始,而是从关于问题的常识开始一个进化过程,让 FunSearch 专注于寻找最关键的想法以获得新的发现。

此外,FunSearch 的进化过程使用一种策略来提高想法的多样性,以避免出现停滞情况。最后,为了提高系统效率,进化过程是并行运行的。

在数学领域开辟新天地

DeepMind 表示,他们首先要解决的是 Cap set 问题,这是一个开放性难题,几十年来一直困扰着多个研究领域的数学家。知名数学家陶哲轩曾把它描述为自己最喜欢的开放性问题。DeepMind 选择与威斯康星大学麦迪逊分校的数学教授 Jordan Ellenberg 合作,他是 Cap set 问题的重要突破者。

这个问题包括在一个高维网格中找到最大的点集(称为 cap set),其中没有三个点位于一条直线上。这个问题之所以重要,是因为它可以作为极值组合学中其他问题的模型。极值组合学研究的是数字、图或其他对象的集合可能有多大或多小。暴力破解方法无法解决这个问题 —— 要考虑的可能性数量很快就会超过宇宙中原子的数量。

FunSearch 以程序形式生成的解决方案在某些情况下发现了有史以来最大的 cap set。这代表了过去 20 年中 cap set 规模的最大增长。此外,FunSearch 的性能超过了最先进的计算求解器,因为这个问题的规模远远超出了它们目前的能力。

交互式图表显示了从种子程序(上)到新的高分函数(下)的演变。每个圆圈都代表一个程序,其大小与分配给它的分数成正比。图中仅显示底部程序的上级。FunSearch 为每个节点生成的相应函数如右侧所示。

这些结果表明,FunSearch 技术可以让人类超越困难组合问题的既定结果,而在这些问题上很难建立直觉。DeepMind 期望这种方法能够在组合学中类似理论问题的新发现中发挥作用,并在未来为通信理论等领域带来新的可能性。

FunSearch 偏好简洁、可由人类理解的程序

尽管发现新的数学知识本身意义重大,但与传统的计算机搜索技术相比,FunSearch 方法还展现出了其他的优势。这是因为,FunSearch 并不是一个只会生成问题解决方案的黑箱。相反,它生成的程序会描述出这些解决方案是如何得出的。这种「show-your-working」通常是科学家的工作方式,他们通过阐述产生新发现或新现象的过程来解释这些发现或现象。

FunSearch 更倾向于寻找高度紧凑的程序所代表的解决方案,即具有较低 Kolmogorov 复杂度的解决方案(Kolmogorov 复杂度是输出解的最短计算机程序的长度)。简短的程序可以描述非常大的对象,从而使 FunSearch 能够扩展到非常复杂的问题。此外,这也让研究人员更容易理解 FunSearch 的程序输出。Ellenberg 说:「FunSearch 为制定攻击策略提供了一种全新的机制。FunSearch 生成的解决方案在概念上要比单纯的数字列表丰富得多。当我研究它们时,我学到了一些东西。」

更重要的是,FunSearch 程序的这种可解释性可以为研究人员提供可操作的见解。例如,DeepMind 在使用 FunSearch 的过程中注意到,它的一些高分输出的代码中存在耐人寻味的对称性。这让 DeepMind 对问题有了新的认识,他们利用这种认识改进了引入 FunSearch 的问题,从而找到了更好的解决方案。DeepMind 认为,这是人类与 FunSearch 在数学领域的许多问题上进行合作的典范。

左图:通过检查 FunSearch 生成的代码,DeepMind 获得了更多可操作的见解(高亮部分)。右图:使用(更短的)左图程序构造的原始「可接受」集合。

解决一个众所周知的计算难题

在理论 cap set 问题取得成功的鼓舞下,DeepMind 决定将 FunSearch 应用于计算机科学中一个重要的实际挑战 —— 装箱问题(bin packing),以探索它的灵活性。装箱问题关注的是如何将不同尺寸的物品打包到最少数量的箱子中。它是许多现实世界问题的核心,从装载物品的集装箱到数据中心的计算工作分配,这些场景都需要最大限度地降低成本。

在线装箱问题通常使用基于人类经验的算法规则(启发式)来解决。但是,要为每种特定情况(大小、时间或容量各不相同)找到一套规则是非常具有挑战性的。尽管与 cap set 问题非常不同,但为这个问题设置 FunSearch 很容易。FunSearch 提供了一个自动定制的程序(适应数据的具体情况),优于现有的启发式方法 —— 可以使用更少的箱子来打包相同数量的物品。

使用现有启发式 ——Best-fit 启发式(左)和 FunSearch 发现的启发式(右)进行装箱的示例。

像在线装箱这样的复杂组合问题可以使用其他人工智能方法来解决,比如神经网络和强化学习。这些方法也被证明是有效的,但也可能需要大量的资源来部署。另一方面,FunSearch 输出的代码易于检查和部署,这意味着它的解决方案有可能被应用到各种现实工业系统中,从而迅速带来效益。

DeepMind:用大模型应对科学挑战将成普遍做法

FunSearch 证明,如果能防止 LLM 产生幻觉,那么这些模型的力量不仅可以用来产生新的数学发现,还可以用来揭示重要现实问题的潜在解决方案。

DeepMind 认为,对于科学和工业领域的许多问题 —— 无论是长期存在的问题还是新问题 —— 使用 LLM 驱动的方法生成有效和量身定制的算法将成为普遍做法。

其实,这仅仅是一个开始。随着 LLM 不断取得进展,FunSearch 也将不断完善。DeepMind 表示,他们还将努力扩展其功能,以应对社会上各种紧迫的科学和工程挑战。

参考链接:https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/


原文标题:DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2939

    文章

    47353

    浏览量

    408357

原文标题:DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Nature传感器新子刊第一篇论文出炉,中国青年学者联手撰写

        近期,知名学术期刊《Nature》(《自然》)旗下专注于传感器研究领域的子刊《Nature Sensors》,刊发了创刊以来的第一篇论文。     《Nature Sensor
    的头像 发表于 11-27 15:04 299次阅读
    <b class='flag-5'>Nature</b>传感器新子刊第一篇<b class='flag-5'>论文</b>出炉,中国青年学者联手撰写

    华为五大创新开启非洲移动产业黄金十年

    在2025非洲通信展(AfricaCom 2025)期间,华为无线网络产品线营销副总裁陈实发表“创新开启非洲移动产业黄金十年”主题演讲,表示非洲是充满活力的数字热土,华为将聚焦“新流量、新体验
    的头像 发表于 11-14 16:23 1180次阅读

    量子AI,芯片的新解

    本文由半导体产业纵横(ID:ICVIEWS)编译自eletimes量子AI助力,半导体供应链韧性升级。几十年来,硅一直是计算机发展的主要驱动力,但摩尔定律如今已接近极限。随着对芯片速度和能效要求
    的头像 发表于 11-12 09:40 830次阅读
    量子AI,芯片的<b class='flag-5'>新解</b>药

    十年·NDI在中国|影像志:见证视频IP化的成长与未来

    十年前,NDI改变了世界;十年后,千视与NDI携手,共同定义未来!《十年·NDI在中国纪录片》从一个疯狂的愿景开始NDI的诞生,源于一个看似疯狂却极具远见的构想。它的创造者坚信:随着视频技术
    的头像 发表于 10-22 10:43 518次阅读
    <b class='flag-5'>十年</b>·NDI在中国|影像志:见证视频IP化的成长与未来

    浅谈SPICE模型参数自动化提取

    在过去的几十年里,半导体器件紧凑型模型已经从 BJT Gummel-Poon 模型中的几个参数发展到 MOSFET BSIM 模型中的数百个参数。
    的头像 发表于 10-16 16:21 870次阅读

    手机长焦进化史:攀过十年,终抵云巅

    跨越十年的技术攻坚,凝聚成华为Pura 80 系列的“集大成者”
    的头像 发表于 08-15 03:29 914次阅读
    手机长焦进化史:攀过<b class='flag-5'>十年</b>,终抵云巅

    十年积淀,DPVR AI眼镜将正式亮相

    表示想要购买AI眼镜。一个新的智能设备时代,正在打开。在这个节点,深耕XR领域十年的DPVR(大朋VR),将带来它的首款AI智能眼镜——DPVRAIGlasses
    的头像 发表于 08-14 11:47 889次阅读
    <b class='flag-5'>十年</b>积淀,DPVR AI眼镜将正式亮相

    谷歌DeepMind重磅发布Genie 3,首次实现世界模型实时交互

    电子发烧友网综合报道 当地时间20258月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。这款被英伟达科学家Jim Fan誉为“游戏引擎2.0”的
    的头像 发表于 08-13 08:27 6543次阅读

    全球首个胃癌影像筛查AI模型发布

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE,首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登上
    的头像 发表于 06-30 14:37 3685次阅读

    爱立信携手谷歌云推出全新解决方案

    爱立信近日发布全新解决方案Ericsson On-Demand,以SaaS平台模式为CSP提供核心网服务。
    的头像 发表于 06-17 09:41 1.4w次阅读

    Vicor助力宏发打造主动悬架电源系统

    厦门宏发电声股份有限公司(宏发)打造业内性能卓越的主动悬架电源系统,旨在将长期以来仅见于豪华车型的功能引入中端车型。宏发成功突破困扰知名汽车技术供应商几十年的技术瓶颈,在满足主动悬架系统对尺寸、重量及瞬态性能的严苛需求的同时,兼顾效率提升、电磁干扰优化及对称能量回收功能改
    的头像 发表于 06-04 15:24 932次阅读

    后摩智能四篇论文入选三大国际顶会

    2025 上半年,继年初被 AAAI、ICLR、DAC 三大国际顶会收录 5 篇论文后,后摩智能近期又有 4 篇论文入选CVPR、ICML、ACL三大国际顶会,面向大模型的编码、量化
    的头像 发表于 05-29 15:37 1102次阅读

    十年磨一剑,我的新书上市了!

    大家好,我是皮哥Peter,十年磨一剑,我的新书《打通Linux操作系统和芯片开发》上市了!今天,新书开启了5折优惠,满满的干货,高颜值,双色印刷,手感厚实,新书原价139元,限时半价,只要69.5
    的头像 发表于 04-01 07:33 580次阅读
    <b class='flag-5'>十年</b>磨一剑,我的新书上市了!

    如何使用MATLAB构建Transformer模型

    Transformer 模型在 2017 由 Vaswani 等人在论文《Attentionis All You Need》中首次提出。其设计初衷是为了解决自然语言处理(Nature
    的头像 发表于 02-06 10:21 5773次阅读
    如何使用MATLAB构建Transformer<b class='flag-5'>模型</b>

    两大AI模型性能提升 登上国际榜单

    近日,由盛大AI团队研发的模型Watt-tool-70B和Newsbang/homer-72B,登上国际知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt团队研发的旗舰模型
    的头像 发表于 01-16 12:01 1178次阅读
    两大AI<b class='flag-5'>模型</b>性能提升 <b class='flag-5'>登上</b>国际榜单