0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌发布ASPIRE训练框架,提升AI选择性预测能力

微云疏影 来源:综合整理 作者:综合整理 2024-01-23 11:19 次阅读

近期,谷歌公布新版ASPIRE训练架构,该架构主要用于改进大型语言模型的选择性预测情况。谷歌表示,尽管大语言模型在自然语言理解与生成领域发展迅速,应用广泛,然而在涉及到高风险决策时,其预测能力仍待加强。为此,谷歌推出ASPIRE训练框架,通过向模型引入“可信度”机制,提升预测准确率。

该框架分为三步骤:“特定任务调整”、“答案采样”以及“自我评估学习”。首先,“特定任务调整”阶段针对基本训练的大型语言模型进一步深化训练,重点提高预测能力。其次,“答案采样”阶段模型会根据调整的参数,生成多个答案,同时建立自我评估学习数据集,产生较高信度的选项。最后,“自我评估学习”阶段则设定参数以提升机模自我评估能力,使之能检测答案准确性,以便在回答问题时附加可信度评分。

据悉该架构取得显著成效。在CoQA、TriviaQA和SQuAD三个问答数据集测试中,经由ASPIRE调整的OPT-2.7B小模型表现全面优于更大规模的OPT-30B模型。此成果证实,经适配调整,小型语言模型亦有潜力超越大型语言模型。

研究人员总结指出,ASPIRE训练框架有效改善了大型语言模型的输出精度,使小型模型经微调后可以实现“恰当且自信”的预测。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5862

    浏览量

    103269
  • AI
    AI
    +关注

    关注

    87

    文章

    26471

    浏览量

    264098
  • 语言模型
    +关注

    关注

    0

    文章

    436

    浏览量

    10057
收藏 人收藏

    评论

    相关推荐

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架
    的头像 发表于 03-01 16:25 245次阅读

    谷歌模型训练软件有哪些?谷歌模型训练软件哪个好?

    谷歌在模型训练方面提供了一些强大的软件工具和平台。以下是几个常用的谷歌模型训练软件及其特点。
    的头像 发表于 03-01 16:24 280次阅读

    谷歌模型框架是什么?有哪些功能和应用?

    谷歌模型框架(Google Model Framework)并不是一个特定的框架,而是指谷歌开发的一系列软件框架,用于支持机器学习和人工智能
    的头像 发表于 02-29 18:11 670次阅读

    谷歌模型训练软件有哪些功能和作用

    谷歌模型训练软件主要是指ELECTRA,这是一种新的预训练方法,源自谷歌AI。ELECTRA不仅拥有BERT的优势,而且在效率上更胜一筹。
    的头像 发表于 02-29 17:37 398次阅读

    谷歌发布开源AI大模型Gemma

    近日,谷歌发布了全新AI大模型Gemma,这款模型为各种规模的组织提供了前所未有的机会,以负责任的方式在商业应用中进行分发。
    的头像 发表于 02-28 17:38 409次阅读

    蚂蚁集团AI研发部门开源AI Infra技术,助力大模型训练效率提升

    蚂蚁集团AI创新研发部门NextEvo近日宣布,他们将全面开源AI Infra技术,以推动AI研发效率的提升。该技术框架名为DLRover,
    的头像 发表于 02-04 10:01 454次阅读

    谷歌发布全新AI SDK,简化安卓应用集成

    谷歌破茧而出,全新发布 Google AI SDK,引领 Android 应用迈向高性能 AI 集成新时代。这次发布的 SDK,专门为 An
    的头像 发表于 01-03 14:18 332次阅读

    谷歌发布多模态Gemini大模型及新一代TPU系统Cloud TPU v5p

    谷歌发布新一代TPU 系统——Cloud TPU v5p,以帮助训练尖端的 AI 模型。目
    的头像 发表于 12-12 10:50 805次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>发布</b>多模态Gemini大模型及新一代TPU系统Cloud TPU v5p

    OpenHarmony AI框架开发指导

    一、概述 1、功能简介 AI业务子系统是OpenHarmony提供原生的分布式AI能力的子系统。AI业务子系统提供了统一的AI引擎
    发表于 09-19 18:54

    Apple 预定 3 纳米芯片,谷歌云 A3 虚拟机将改变 AI 训练

    GPU 的 A3 GPU 虚拟机,加速 AI 模型训练速度 谷歌云近日宣布,他们将在下个月正式推出搭载 Nvidia H100 GPU 的 A3 GPU 虚拟机。这款 A3 虚拟机结合
    的头像 发表于 08-31 13:00 401次阅读
    Apple 预定 3 纳米芯片,<b class='flag-5'>谷歌</b>云 A3 虚拟机将改变 <b class='flag-5'>AI</b> <b class='flag-5'>训练</b>

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    HHB 实现了在典型网络性能比第三方工具平均提升 88%,并增加支持运行 Transformer、TensorFlow、PyTorch 等 170 余个主流框架 AI 模型。 基于此,平头哥
    发表于 08-26 14:14

    深度学习框架区分训练还是推理吗

    模型,以便将来能够进行准确的预测。推理是指在训练完成后,使用已经训练好的模型进行新的预测。然而,深度学习框架是否区分
    的头像 发表于 08-17 16:03 1033次阅读

    训练好的ai模型导入cubemx不成功怎么解决?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 08-04 09:16

    谷歌发布发布其安全人工智能框架

    随着越来越多的组织开始采用生成人工智能(AI),谷歌(Google)希望我们都更加关注安全问题。为此,近日,这家科技巨头发布了其安全人工智能框架(Secure
    发表于 06-15 17:19 214次阅读

    NVIDIA AI 技术助力 vivo 文本预训练大模型性能提升

    vivo AI 团队与 NVIDIA 团队合作,通过算子优化,提升 vivo 文本预训练大模型的训练速度。在实际应用中, 训练提速 60%
    的头像 发表于 05-26 07:15 449次阅读
    NVIDIA <b class='flag-5'>AI</b> 技术助力 vivo 文本预<b class='flag-5'>训练</b>大模型性能<b class='flag-5'>提升</b>