0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

错误使用GPT-3:成本却降低了40倍,速度提高了5倍

jf_WZTOguxH 来源:Buildt 2023-03-01 09:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Buildt 使用 OpenAI 基础模型已经有一段时间了。这些模型非常强大,关于这一点,互联网上已经有了大量的记录,特别是随着 ChatGPT 的出现,它的关注度超过了之前 GPT-3 的 100 倍。然而,在应用这些模型解决相应问题(代码库搜索、理解和增强)的过程中,我们发现了一个明显的障碍:延迟和成本。比较大的模型(特别是 davinci 家族)无疑能产生最高质量的输出,但运行起来也最慢、最昂贵。

要获得良好的搜索体验,显然速度就得快。你看谷歌,100 毫秒就可以索引数百万个网页,代码库搜索也是如此。我们发现,在单个搜索中,其中一个最耗时的点就是生成输出的 LLM 层(我们使用 LLM 来增强搜索,让你可以搜索代码是什么,而不是它做什么,例如“找出最慢的递归函数”)。Alex grave 是 Github Copilot 的创建者之一。据他说,每增加 10 毫秒的延迟,完成率就会下降 1%。这一逻辑也适用于搜索。所以,当务之急是从 davinci 这样的大型模型转向 ada 和 babbage 这样的小型模型。

92440896-b1cb-11ed-bfe3-dac502259ad0.png

我们的解决方案很简单,对于给定的任务,由 davinci 生成一个中等大小的语料库,并精心优化像 babbage 这样的模型来完成相同的任务。如果操作得当,你可以以低 40 倍的成本、低 4-5 倍的延迟获得几乎相同的完成率(或至少 90% 的相似性)。

如果你愿意花点时间,则还可以在循环中加一个人:我们最近就做了这样的事情来优化 babbage 模型,以便能够识别代码的特征,所以我让 ChatGPT 帮我创建了一个基本的 Web UI,让我们可以轻松地审核和改进 davinci 所的识别结果;从根本上说,你永远无法从一个更小的模型那里获得类似的性能,所以让完成率胜过你试图模仿的模型,意味着你至少在训练完成时就比较接近。

9264637a-b1cb-11ed-bfe3-dac502259ad0.jpg

关于这种技术,我想的最多的一个问题是:我需要多少样本?答案恐怕是“视情况而定”。

根据经验,如果你只是想标准化平淡无奇的输出格式,那么你可以用几百个样本;如果你是在做逻辑推理,那么你至少需要 1000 个样本;如果你在做 DSL 工作,那么你需要几千个样本。样本大小通常会是一个障碍,但有了用更大的模型来生成合成数据集的方法,那突然变得比较容易处理了,特别是当这些模型变得越来越好时。

这种方法有很多应用场景;如果你有一个提示符,它可以重复做同样的工作,那么你就可以使用这项技术来加快速度,降低成本。

有人问过我这种方法的维护问题,特别是如果想要更改输出结构时会出现什么情况。我们内部构建了一个经过精心优化的管道来自动化整个过程,其底层是 davinci-003 提示符,然后我们用它来生成 n 个合成样本,格式化后传递给 OpenAI 调优 API,它会吐出一个调优过的模型。这样,如果你想更改提示符的输出,只需一次单击就可以更新一个调优过的模型。

我总是很乐意谈论这个话题,欢迎在 Twitter 上关注我(@AlistairPullen),我上面描述的所有内容都可以在我们的代码搜索工具 Buildt 中找到。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52257
  • OpenAI
    +关注

    关注

    9

    文章

    1248

    浏览量

    10263

原文标题:错误使用 GPT-3:成本却降低了40 倍,速度提高了5 倍

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    卫星通信引爆增长神话:净利暴增超40!射频企业涌入押注

    分化。其中,臻镭科技归母净利润实现超过640%的增长、扣非净利润暴涨4332%成为市场关注焦点。     臻镭科技: 40 爆发式增长 ,卫星通信赛道领跑者 臻镭科技在2025年实现净利润暴涨40
    的头像 发表于 01-29 09:15 7881次阅读
    卫星通信引爆增长神话:净利暴增超<b class='flag-5'>40</b><b class='flag-5'>倍</b>!射频企业涌入押注

    这个压电路如何叠加电压输出的?

    输出电压多少? 2.正负半周期分别是如何叠加输出压的?叠加路径? 3.正半周期时,电源给C1充电,会经C5→C4→D3返回N吗? 4.负半周期时,电源给C
    发表于 04-10 09:24

    力争百万 Tokens 推理成本降低:云天励飞发布未来三年大算力芯片战略,首曝 DeepVerse 路线图

    集中于攻克大模型落地的“成本壁垒”,致力于通过底层架构创新,力争实现百万 Tokens 推理成本降低 100 以上的目标,推动 AI 从技术尝鲜走向普惠生产力。产业变局:推理竞速,从
    的头像 发表于 02-03 20:25 3132次阅读
    力争百万 Tokens 推理<b class='flag-5'>成本</b><b class='flag-5'>降低</b>百<b class='flag-5'>倍</b>:云天励飞发布未来三年大算力芯片战略,首曝 DeepVerse 路线图

    如何使用EtherCAT总线网关与福TwinCAT3系列PLC通讯

    01 概述 EtherCAT (以太网控制自动化技术) 是由德国福公司开发的、基于以太网的开放现场总线系统,EtherCAT为系统的实时性能和拓扑的灵活性树立了新的标准,同时,它还符合甚至降低了
    的头像 发表于 01-15 13:51 2821次阅读
    如何使用EtherCAT总线网关与<b class='flag-5'>倍</b>福TwinCAT<b class='flag-5'>3</b>系列PLC通讯

    Neway微波产品的国产化替代方案

    的低损耗、高稳定性性能。这种自主化生产方式不仅提高了产品的可靠性,还降低了生产成本。三、供应链本地化整合Neway通过整合本地供应链资源,实现了微波产品的快速交付和灵活定制。例如,在定制化服务中
    发表于 12-18 09:24

    什么是变镜头

    什么是变镜头变镜头是一种可以连续调节放大倍率或视场范围的光学镜头。它通过内部光学组的相对移动,实现倍率/焦距的连续变化,而且需要保证在变过程中成像仍然清晰、畸变小。特点:适合需要多倍率观察
    的头像 发表于 12-01 15:31 769次阅读
    什么是变<b class='flag-5'>倍</b>镜头

    AI算法开发,SpeedDP打辅助!不止10效率

    往日的职场生存法则正在被AI一点一点改变,以前是人卷人,现在即使是再卷,也卷不过AI,24小时不间断工作的AI,能够为企业带来巨大的成本节省。对于企业而言,谁能够给自己带来更多的利润,谁就是首选
    的头像 发表于 11-20 18:09 757次阅读
    AI算法开发,SpeedDP打辅助!不止10<b class='flag-5'>倍</b>效率

    为什么FPU在MCU中很重要呢?

    核心去处理其他任务(如控制逻辑、通信、中断处理),提高了系统的整体响应能力和多任务处理能力。 降低功耗: 由于计算速度大大加快,完成相同计算任务所需的时间显著缩短,CPU 可以更快地进入低功耗睡眠
    发表于 11-18 07:05

    西门子EDA AI System驱动芯片设计新纪元

    芯片设计是一项复杂的系统工程,尤其验证和优化环节极其耗费时间和精力。为了有效降低错误率、提升设计质量,EDA工具的自动化、智能化发展成为关键。近年来,随着AI技术在EDA领域的应用逐渐成熟,为芯片设计领域带来了革命性的变化。AI加持显著
    的头像 发表于 11-17 14:14 2537次阅读
    西门子EDA AI System驱动芯片设计新纪元

    ‌Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 提速背后的黑科技

    Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 提速背后的黑科技‌ 最近,Moonshot AI 的千亿参数大模型 ‌Kimi K2‌ 在 ‌GroqCloud‌ 上
    的头像 发表于 08-07 10:01 1321次阅读

    AI 眼镜销量激增10 :带动芯片需求,产业链迎来双向爆发

    今年上半年,智能眼镜市场迎来爆发式增长,品类成交量同比激增10,入驻品牌数量较去年增长超3。更值得关注的是,在国家补贴与产业链协同的双重作用下,智能眼镜的入手门槛不断降低,产品均价
    的头像 发表于 07-25 15:26 745次阅读

    汽车导航系统EMC整改:工程师必看,成本降低40%的秘诀

    南柯电子|汽车导航系统EMC整改:工程师必看,成本降低40%的秘诀
    的头像 发表于 07-22 11:07 780次阅读

    压整流电路的工作原理及电路设计

    压整流电路学习
    发表于 05-23 10:26 4次下载

    如何在VS Code中使用瑞萨RL78系列MCU

    RL78家族系列MCU,以其业界领先的低功耗和各种内置的高性能外围功能,极大地提高了电源效率,降低了BOM成本,实现了设备的小型化。
    的头像 发表于 04-23 13:49 4425次阅读
    如何在VS Code中使用瑞萨RL78系列MCU

    MVG推出SpeedProbe DL解决方案:有源相控阵天线校准速度提升至5

    系统高达5的校准速度,显著提升有源相控阵天线在防务领域的测试效率与性能。 MVG销售总监 Per Noren 表示:“SpeedProbe DL解决方案 在IDEX展会上
    发表于 04-21 16:35 1821次阅读
    MVG推出SpeedProbe DL解决方案:有源相控阵天线校准<b class='flag-5'>速度</b>提升至<b class='flag-5'>5</b><b class='flag-5'>倍</b>