0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是大模型的badcase?如何修复大模型的badcase呢?

深度学习自然语言处理 来源:包包的算法笔记 2023-12-14 16:40 次阅读

badcase 定义

首先我们定义什么是大模型的badcase,大模型badcase是指在应用场景中,出现不符合预期的答复。但实际上不符合预期的答复可能多种多样,原因也各不相同,有没有什么统一的思路能处理这些badcase呢?

badcase修复思路

首先在处理badcase流程上有个基本的套路,就是发现问题,总结规律,评估影响,设法修复。这个套路如果泛化一点的话,大概就是解决问题的基本思路。

发现的问题对应着大模型的评估,测试等。基本的发现问题手段有自动化和非自动化的方式,主要体现在样本的构造过程中。非自动化对应着手工测试,标注录入,收集用户反馈等;自动化的方式对应着用户模拟器,固定测试集推断等。有了样本之后,我们进入了第二步,总结规律。

解决badcase问题的关键在于通过归类的方式总结模式和规律,然后在badcase分布下解决关键的几种特定问题,比如典型的幻觉,复读机等。在自己具体的应用场景下,往往有不一样的特殊的要求,比如场景是RAG的应用,会存在检索知识不符合预期等问题。总结规律的方式上可以靠专家经验,对预期之外的结果进行归类,并形成明确的可执行标准,将标准传达给标注团队,进行一定规模的标注分析。

评估影响对应着两方面,一个是问题发生的概率,对应的是步骤二中总结问题的分布。另一方面是badcase对应的严重性,badcase概率乘上badcase严重性就是处理问题的优先级排序。确定好优先级之后,我们就可以按部就班进入第四步,尝试解决。

修复大模型的badcase,从解决问题的方式分类有两种,一种是彻底解决,从大模型生成的机理上削减此类问题发生的概率。另一种是掩盖问题,不在模型的生成的过程中根本解决,通过手段规避发生,事后修复等方法掩盖问题。

重点是第四步,解决对应问题的badcase,我们对这部分进行展开讲解。

实践解法

首先是机理上解决方法,机理上解决对应着大模型训练的四个阶段,预训练,sft,对齐,推断。

属于预训练阶段的问题大概率是难啃的骨头,也对应着大模型能力的上限,解决这些问题并让他生成非兜底的预期答复,基本等同于基座能力的提升,类似gpt3.5提升到gpt4,这也是一种非常通用但是成本非常高,难度非常大的方式。

这类问题典型的比如复读机,在gpt3.5我们还是比较容易触发大模型的复读机行为,但是在4.0几乎就看不到了。

除了此类问题,我们如果针对某些问题有些特定的badcase并不需要提升基座的基础能力,如安全方面用户引诱回答政治敏感类问题。那么我们期望的答复可以简化为兜底的拒绝回答,在sft和对齐阶段都有对应的方案。

sft和对齐阶段对应方案最简单直观的方法就是强化训练数据,让大模型“记住“更多的这种类型的模式,比如构造正确的数据进行强化训练。对应在对齐中,就是使用正例构造reward model的正样本,badcase构造负样本,使用ppo或者dpo等方法强化大模型的认知,这种打补丁的方式对一些模式明显的问题又一定帮助,但复杂的问题还是无能为力。

推断阶段可以解决的问题,可以分成两类,第一类是生成参数调整上,第二类是通过prompt层面调整解决。

生成参数调整能一定程度上解决一类特定问题,典型的是复读机问题等。复读机问题可以通过生成函数的多样性参数增加多样性,重复惩罚参数等后置概率调整手段一定程度上减轻。当然,复读机问题的本质还是模型训练的“不够好”,最好能在数据,训练,对齐全流程上进行优化,从根本上解决。

prompt调整层面对应的典型方案是使用RAG方案对抗幻觉,RAG方案就是承认基座能力的局限性,也不期望短期通过提升基座能力,从根本上解决大模型幻觉问题,而是给模型更多的“参考信息”,让模型有一定的外部知识储备。除此之外,RAG还有动态更新,外部知识增强的能力,在实际应用上有很多价值。

通过cot,tool use等构建的agent能力也是承认大模型的局限性,一定程度在prompt上给更多的过程提示,工具调用参考等,期望大模型通过任务规划,调用外部工具一定程度上弥补模型能力的不足。

此类方案在大家的探索中都已经演进成为成熟的落地解决方案。

除了通过各种手段解决badcase,模型直接输出正确的内容之外,还有一种线上更实用的前后置处理方案,这类方案在模型的风控和安全上有典型的应用。

比如,模型上线的前后置风控处理上。前置风控主要面向的内容是用户输入prompt的检查上,进行相关的风险评级,可以设定为通过,拒绝回答,通过且增加限制的system prompt等几种典型策略,确保用户输入到大模型的内容不会触发大模型产生不合规,不安全的答复。

后置处理主要面向的内容是大模型的输出,确保大模型输出内容送达用户端的时候保证合规性。最简单的方式为检测大模型输出内容不合规的时候,对输出内容进行整体替换。通常为了保证大模型的交互体验,会流式送达用户端,因此针对大模型输出内容的质检有一定的滞后性,这也是我们在一些产品体验中流式生成一顿后,会整体覆盖替换为另一段固定话术的原因。

整体来看,天下没有免费的午餐,打补丁的方式可以快速解决某类特定的问题,但是想从根本上提高模型能力,应对各种case,又是一个难度和成本都非常高的路径。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模拟器
    +关注

    关注

    2

    文章

    818

    浏览量

    42699
  • 大模型
    +关注

    关注

    2

    文章

    1543

    浏览量

    1140

原文标题:大模型如何修复badcase

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    哪位大侠有lm5104的pspice模型

    哪位大侠有lm5104的pspice模型
    发表于 12-11 09:05

    无仿真模型问题??

    我在调用LF398采样保持器时,没有仿真模型,不能进行仿真,但是点击下面选项后可以运行仿真,请教:这个选项是什么意思??不管这个仿真模型的意思?这个器件也不起作用??是这个意思吗。。另外对于没有仿真
    发表于 04-24 20:49

    为什么没有模型

    by J_J1 is undefinedCircuit has errors ... run abortedSee output file for detailsINFO(ORPROBE-3188): Simulation aborted为什么spice中没有模型
    发表于 05-08 09:57

    我的差分对模型不对,怎么更新到PCB

    请教各位 我的差分对模型不对 我主要原理图中调整了管脚位置 请问这种情况怎么更新到PCB?我导入网表这个就是不变我的差分对模型不对 我主要原理图中调整了管脚位置 请问这种情况怎么更新到PCB
    发表于 01-29 14:35

    3d模型问题

    错。我修改了wrl中的url连接也不行。请问,有贴图的模型要怎么样才能正确转成wrl?2.ase模型的读取因为不能转成wrl,我就又换成了ase格式的,这时候贴图不丢失。但是,不知道该如何导入ase
    发表于 11-12 17:14

    GPU编程的平台模型、执行模型、内存模型及编程模型

    GPU编程--OpenCL四大模型
    发表于 04-29 07:40

    什么是模型模型给我们带来了什么?

    什么是模型?什么是关系?怎样确定一个模型模型给我们带来了什么?
    发表于 07-02 07:13

    模型预测控制介绍

    是model-based。有人会问,我这个系统的模型怎么来?我想到两点解决方法:1. 文献上去找别人已经建好的,公认的模型;2. 首先进行系统辨识,再进行建模。(难度太大,不建议)下面给上经...
    发表于 08-18 06:21

    MRAS模型和可调模型参考

    1、简写MRAS参考模型和可调模型参考模型和可调模型方程:简写为如下形式:参考模型:可调模型:定
    发表于 08-27 06:44

    如何利用MATLAB的simulink建立仿真模型

    如何利用MATLAB的simulink建立仿真模型?并与stm32cubemx搭建数据链
    发表于 11-18 07:17

    怎样去解决pytorch模型一直无法加载的问题

    rknn的模型转换过程是如何实现的?怎样去解决pytorch模型一直无法加载的问题
    发表于 02-11 06:03

    为什么RK3399Pro平台YOLOv4 pytorch模型转RKNN模型会失败

    为什么RK3399Pro平台YOLOv4 pytorch模型转RKNN模型会失败?有何解决办法?
    发表于 02-11 09:29

    基于Gauss滤波和Euler修复模型的SAR图像去噪

    基于Gauss滤波和Euler修复模型的SAR图像去噪_王田芳
    发表于 01-07 16:24 2次下载

    基于深度学习的图像修复模型及实验对比

    深度学习技术在解决¨大面积缺失图像修复”问題时具有重要作用并带来了深远影响,文中在简要介绍传统图像修复方法的基础上,重点介绍了基于深度学习的修复模型,主要包括
    发表于 04-08 09:38 20次下载
    基于深度学习的图像<b class='flag-5'>修复</b><b class='flag-5'>模型</b>及实验对比

    基于改进曲率驱动模型的敦煌壁画修复算法

    针对敦煌壁画裂纹形状复杂、划痕不规则,采用CDD曲率扩散算法修复时易出现假边缘、阶梯效应以及修复时间长的问题,提岀一种改进曲率驱动模型的自适应敦煌壁画修复算法。首先对CυD算法中梯度消
    发表于 06-07 11:11 6次下载