0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对话机器人之LaMDA

深度学习自然语言处理 来源:NLP日志 2023-01-04 14:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来自:NLP日志

提纲1 简介 2 LaMDA 3 总结

1 简介

LaMDA是在DeepMind的Sparrow跟openai的instructGPT之前由谷歌提出的对话机器人,全称Language Models for Dialog Applications,是一个在海量对话跟web数据上进行预训练再在人工标注数据上做进一步微调后得到的参数量高达137B的大模型。LaMDA除了在生成文本质量有所提升外,通过在人工标注数据上做进一步finetune以及让模型学会检索利用外部知识源的能力,使得模型在安全性以及事实性这两个关键问题上获得明显提升。

安全性指的是模型的回复应该满足一系列人为价值观,例如没有歧视跟偏见,不会生成伤害性建议。事实性指的模型的回复应该符合事实,跟外部知识源保持一致,而不是一本正经的胡说八道。‍‍‍‍‍‍‍

83dd799a-884f-11ed-bfe3-dac502259ad0.png

图1: LaMDA在生成文本在多个指标下有明显提升

2 LaMDA

Pre-training

LaMDA采用的是纯decoder的结构,类似于GPT,使用了46层Transformer,模型参数量高达130B,是Meena的50倍。预训练的任务是预测文本中的下一个token,解码策略跟Meenay一致,都是从top-40结果采样得到16个候选回复,再基于候选回复的对数似然得分跟长度选择最优的回复。不同于此前的对话模型只在对话数据上训练,LaMDA的预训练数据集包括对话数据(1.12B)和其他web文档数据(2.97B)。

83ffe962-884f-11ed-bfe3-dac502259ad0.png

图2: LaMDA预训练任务‍‍‍‍

Finetune

LaMDA的finetune包括两部分,一部分是针对生成文本质量跟安全性,另一部分则是学习如何利用外部的信息检索系统。其中质量(SS I)可以从三方面评估,分别是sensibleness(文本是否合理,跟历史对话是否有冲突),Specificity(对于前文是否有针对性,避免笼统回复,例如用户提问“I love Eurovision”,模型生成一个笼统回复“Me too”就不符合预期),Interestingness(文本是否能引起某人注意或者好奇,是否是超出期待的巧妙回复)。而安全性(Safety)的目标则是要符合谷歌AI的基本原则,避免生成会造成伤害的不符合预期的结果,或者带有偏见跟歧视。

a)Finetuning for quality and safety

这部分的finetune既包括给定上文生成回复的生成任务,也包括评估回复质量跟安全性的判别式任务。对于生成任务,训练样本格式由“”(上文,哨兵,回复)三部分拼接而成,损失只计算其中response相关那部分,也就是在给定历史上文条件下,只计算模型生成回复跟期望回复之间的损失。而对于判别任务,训练样本则是“” (上文,哨兵,回复,属性,得分)五部分拼接得到,损失只计算属性对应的rating得分损失,也就是在给定历史上文跟模型回复条件下,计算特定属性下的模型得分跟人工标注结果之间的损失。这种LaMDA同时用于生成跟判别的设计能够实现一个更佳高效的流程,在生成回复后,使用判别模型打分时需要对应指标的概率P(|),而生成模型已经处理过了,所以只需要在额外处理少量的跟attribute-name相关的token即可。

Finetune过程先对LaMDA的判别任务进行优化,使得模型可以预测候选回复的质量得分跟安全性得分,然后过滤掉安全性得分低于阈值的候选回复,再根据质量得分对候选回复进行排序(3*P(sensibleness)+P(specificity)+P(interestingness)),选择其中得分最高的回复作为模型生成的结果。再利用已经训练后LaMDA的打分模型,筛选出高质量的训练数据,用于LaMDA的生成任务的finetune,使得模型可以生成高质量的回复。根据下图也可以看到利用高质量数据进行的finetune让模型在各方面都有了明显的提升。

841e2864-884f-11ed-bfe3-dac502259ad0.png

图3: finetune模型在多个指标上的提升

b)Finetuning to learn to call an external information retrieval system

这部分也称为Groundedness,针对语言模型的可能生成看起来可信,但是违背事实的幻视问题,LaMDA通过学习使用利用外部知识源去缓解这个问题。LaMDA构建一个包含信息检索系统,计算模块,翻译模块的工具(简称TS),这部分的finetune也包括两个子任务,第一个是将历史上文跟模型回复一起输入到模型中,生成对应的检索query。第二个子任务是将历史上文+模型回复+检索结果一同输入到模型中,让模型决定是生成新的检索query或者生成最终回复(根据生成的第一个字符串决定,如果是TS,则继续检索,如果是User则返回对应结果)

8461f1d4-884f-11ed-bfe3-dac502259ad0.png

图4: LaMDA Search流程‍

在具体推理流程中,只用一个LaMDA模型,但是做了多个子任务,具体过程中该执行哪个子任务,则由当前输入的prompt决定,例如当前输入prompt是LaMDA to user就对应自动生成回复,如果当前prompt是LaMDA-Base to LaMDA-Research就对应生成检索query。

3 总结

从LaMDA跟后续的Sparrow,我们也可以看到一些共同点。1)可以使用一个强大的模型同时处理多个不同任务。‍‍‍‍2)finetune阶段高质量数据对于模型的最终性能影响颇大,为了得到这些高质量的数据,LaMDA跟Sparrow在搜集finetune数据有一套严格的方法论。3) 让模型学习检索利用外部知识源,可以缓解模型幻视的问题,让模型生成结果更佳有理可依,也让模型可以回答与时俱进的问题。‍‍‍‍‍‍‍‍‍‍‍‍‍4)为生成文本的安全性设计额外的子任务,从而缓解敏感性的问题。LaMDA的成功,依旧贯彻着大力出奇迹的思路,不仅模型的参数量庞大,预训练的语料庞大,连finetune阶段的人工标注数据也不是一般人可以承受的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    214

    文章

    31634

    浏览量

    224519
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52341

原文标题:对话机器人之LaMDA

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于米尔RK3576核心板的国产割草机器人解决方案

    在智慧庭院与机器人产业高速发展的今天,割草机器人正经历从“随机碰撞式”向“规划自主式”的深刻变革。与此同时,在国产化替代、供应链自主可控的产业政策推动下,国内整机厂商对高算力、低功耗、国产自主可控
    发表于 04-24 17:31

    为什么说关节扭矩传感器是高端机器人的“触觉神经”?

    如果把高端机器人比作一个“”,那么关节扭矩传感器就是遍布全身的“触觉神经”。没有它,机器人就像得了末梢神经麻痹——能按程序动,却感受不到外界的力量,动作僵硬、笨拙,甚至危险。 核心原因:让
    发表于 04-17 17:27

    再谈低温烧结银的应用:从春晚四家机器人出镜的幕后推手说起

    再谈低温烧结银的应用:从春晚四家机器人出镜的幕后推手说起 2026年马年春晚四家机器人公司:宇树、魔法原子、银河通用、松延动力的高动态、高精度、高可靠表现,背后离不开低温烧结银在电机驱动、传感器
    发表于 02-17 14:07

    智能AI机器人定制开发_AI陪伴对话机器人主板方案

    随着人工智能技术的飞速发展,AI机器人逐渐渗透到家庭陪伴、教育科普、商业接待等多个领域。为了满足多样化的应用需求,AI机器人硬件架构需具备“高性能、低功耗、多形态、易落地”的特点。AI机器人采用联发
    的头像 发表于 01-28 19:47 405次阅读
    智能AI<b class='flag-5'>机器人</b>定制开发_AI陪伴<b class='flag-5'>对话机器人</b>主板方案

    AI机器人方案_ai人机对话机器人PCBA硬件定制开发

    随着人工智能技术的不断进步,人机交互的方式正变得更加自然与高效。一款基于联发科MTK八核处理器的AI对话机器人方案脱颖而出,凭借其强大的性能、多样化显示方案和卓越的语音交互能力,成为家庭、教育、智能服务等场景中不可或缺的智能助手。
    的头像 发表于 12-24 20:19 1622次阅读
    AI<b class='flag-5'>机器人</b>方案_ai人机<b class='flag-5'>对话机器人</b>PCBA硬件定制开发

    探索RISC-V在机器人领域的潜力

    探索RISC-V在机器人领域的潜力 测评:洄溯 测评时间: 2025年11月 测评对象: MUSE Pi Pro开发板(基于进迭时空K1系列高性能RISC-V CPU) 一、 开篇引言
    发表于 12-03 14:40

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    时人脸识别、物体检测与跟踪等。同时,在高负载下,芯片温度稳定在65℃左右,证明了其优异的高能效比和低发热特性,非常适合对功耗和散热敏感的机器人产品。 为什么RK3576是机器人开发的理想
    发表于 10-29 16:41

    小萝卜机器人的故事

    经过我的申请, 马老师发放了, 小萝卜机器人的, 开发权限, 原来的小萝卜公司, 因为经营不善倒闭, 作为科研产品, 几个技术对此惋惜, 自掏腰包, 要让小萝卜机器人, 再生, 每次听到小萝卜说
    发表于 10-23 05:24

    什么是机器人?追溯机器人技术的演变和未来

    作者: Aswin S Babu 什么是机器人? 在日常生活里,“机器人”一词我们都不陌生,日常交谈中也常常脱口而出。但大家可曾细想过,这个词的真正含义究竟为何?接下来,不妨花些时间,深入探究机器人
    的头像 发表于 10-02 16:32 5905次阅读
    什么是<b class='flag-5'>机器人</b>?追溯<b class='flag-5'>机器人</b>技术的演变和未来

    机器人竞技幕后:磁传感器芯片激活 “精准感知力”

    2025 世界人形机器人运动会于 8 月 17 日圆满收官,赛场上机器人在跑步、跳跃、抓取等项目中的精彩表现,背后是运动控制、环境感知等技术的迭代升级。而在这些技术中,磁传感器芯片凭借独特优势,成为
    发表于 08-26 10:02

    工业机器人的特点

    0.3%的年化生产力提升。因此,发展工业机器人推动国内自动化水平,提高产出是目前的不二选。 ** 适用范围广** 机器人相对于工人的优势还体现在应用范围广。机器人可以运用在危险、恶劣
    发表于 07-26 11:22

    对话:人形机器人连接器与线缆有何攻关点?

    与线缆技术突破成为破局关键。然而,机器人高频传输与空间压缩的技术矛盾、百万次弯折寿命的可靠性挑战,以及行业标准缺失引发的产业链协同困境,正成为制约机器人产业发展的核心瓶颈。 《国际线缆与连接》通过深度对话TE Connectiv
    的头像 发表于 07-11 15:13 1340次阅读
    <b class='flag-5'>对话</b>:人形<b class='flag-5'>机器人</b>连接器与线缆有何攻关点?

    机器人遇上“语言障碍”:CCLINKIE转Profinet的“破冰外挂”来啦\\!

    ”才到机器人控制器,焊接精度从±0.1mm“漂移”到±0.3mm。直到一次技术改造,让不同协议的设备实现了“无障碍对话”,这场工业互联的破局战,藏着哪些硬核逻辑? 一、协议壁垒下的生产痛点 某合资车企
    发表于 06-04 14:31

    工业机器人与协作机器人概念不同

    在自动化生产的浪潮中,工业机器人与协作机器人逐渐成为企业提升效率、优化产能的得力助手。但它们并非同一概念,在功能、设计与应用场景上有着显著差异。北京沃华慧通测控有限公司凭借深厚的技术沉淀,为不同需求的企业提供适配的机器人解决方案
    的头像 发表于 06-03 13:15 1449次阅读
    工业<b class='flag-5'>机器人</b>与协作<b class='flag-5'>机器人</b>概念不同

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    连续的长句语音识别,还是复杂口音的处理,都能快速响应,保证语音机器人与用户之间流畅的对话体验。 其丰富的接口为语音机器人的功能拓展提供了可能。USB接口可以连接高灵敏度的麦克风阵列,实现精准的语音采集
    发表于 05-28 11:36