0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

错误使用GPT-3:成本却降低了40倍,速度提高了5倍

jf_WZTOguxH 来源:Buildt 2023-03-01 09:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Buildt 使用 OpenAI 基础模型已经有一段时间了。这些模型非常强大,关于这一点,互联网上已经有了大量的记录,特别是随着 ChatGPT 的出现,它的关注度超过了之前 GPT-3 的 100 倍。然而,在应用这些模型解决相应问题(代码库搜索、理解和增强)的过程中,我们发现了一个明显的障碍:延迟和成本。比较大的模型(特别是 davinci 家族)无疑能产生最高质量的输出,但运行起来也最慢、最昂贵。

要获得良好的搜索体验,显然速度就得快。你看谷歌,100 毫秒就可以索引数百万个网页,代码库搜索也是如此。我们发现,在单个搜索中,其中一个最耗时的点就是生成输出的 LLM 层(我们使用 LLM 来增强搜索,让你可以搜索代码是什么,而不是它做什么,例如“找出最慢的递归函数”)。Alex grave 是 Github Copilot 的创建者之一。据他说,每增加 10 毫秒的延迟,完成率就会下降 1%。这一逻辑也适用于搜索。所以,当务之急是从 davinci 这样的大型模型转向 ada 和 babbage 这样的小型模型。

92440896-b1cb-11ed-bfe3-dac502259ad0.png

我们的解决方案很简单,对于给定的任务,由 davinci 生成一个中等大小的语料库,并精心优化像 babbage 这样的模型来完成相同的任务。如果操作得当,你可以以低 40 倍的成本、低 4-5 倍的延迟获得几乎相同的完成率(或至少 90% 的相似性)。

如果你愿意花点时间,则还可以在循环中加一个人:我们最近就做了这样的事情来优化 babbage 模型,以便能够识别代码的特征,所以我让 ChatGPT 帮我创建了一个基本的 Web UI,让我们可以轻松地审核和改进 davinci 所的识别结果;从根本上说,你永远无法从一个更小的模型那里获得类似的性能,所以让完成率胜过你试图模仿的模型,意味着你至少在训练完成时就比较接近。

9264637a-b1cb-11ed-bfe3-dac502259ad0.jpg

关于这种技术,我想的最多的一个问题是:我需要多少样本?答案恐怕是“视情况而定”。

根据经验,如果你只是想标准化平淡无奇的输出格式,那么你可以用几百个样本;如果你是在做逻辑推理,那么你至少需要 1000 个样本;如果你在做 DSL 工作,那么你需要几千个样本。样本大小通常会是一个障碍,但有了用更大的模型来生成合成数据集的方法,那突然变得比较容易处理了,特别是当这些模型变得越来越好时。

这种方法有很多应用场景;如果你有一个提示符,它可以重复做同样的工作,那么你就可以使用这项技术来加快速度,降低成本。

有人问过我这种方法的维护问题,特别是如果想要更改输出结构时会出现什么情况。我们内部构建了一个经过精心优化的管道来自动化整个过程,其底层是 davinci-003 提示符,然后我们用它来生成 n 个合成样本,格式化后传递给 OpenAI 调优 API,它会吐出一个调优过的模型。这样,如果你想更改提示符的输出,只需一次单击就可以更新一个调优过的模型。

我总是很乐意谈论这个话题,欢迎在 Twitter 上关注我(@AlistairPullen),我上面描述的所有内容都可以在我们的代码搜索工具 Buildt 中找到。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51712
  • OpenAI
    +关注

    关注

    9

    文章

    1238

    浏览量

    9813

原文标题:错误使用 GPT-3:成本却降低了40 倍,速度提高了5 倍

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek最新论文:训练速度提升9,推理速度快11

    是上一代Grok2的15左右。在Benchmarks中,Grok3毫无悬念成功地领先Deepseek R1、o3 mini等对手。   不过用如此大规模的算力集群,花费上一代15
    的头像 发表于 02-20 11:25 2646次阅读
    DeepSeek最新论文:训练<b class='flag-5'>速度</b>提升9<b class='flag-5'>倍</b>,推理<b class='flag-5'>速度</b>快11<b class='flag-5'>倍</b>!

    为什么FPU在MCU中很重要呢?

    核心去处理其他任务(如控制逻辑、通信、中断处理),提高了系统的整体响应能力和多任务处理能力。 降低功耗: 由于计算速度大大加快,完成相同计算任务所需的时间显著缩短,CPU 可以更快地进入低功耗睡眠
    发表于 11-18 07:05

    ‌Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 提速背后的黑科技

    Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 提速背后的黑科技‌ 最近,Moonshot AI 的千亿参数大模型 ‌Kimi K2‌ 在 ‌GroqCloud‌ 上
    的头像 发表于 08-07 10:01 651次阅读

    汽车导航系统EMC整改:工程师必看,成本降低40%的秘诀

    南柯电子|汽车导航系统EMC整改:工程师必看,成本降低40%的秘诀
    的头像 发表于 07-22 11:07 444次阅读

    如何在VS Code中使用瑞萨RL78系列MCU

    RL78家族系列MCU,以其业界领先的低功耗和各种内置的高性能外围功能,极大地提高了电源效率,降低了BOM成本,实现了设备的小型化。
    的头像 发表于 04-23 13:49 3843次阅读
    如何在VS Code中使用瑞萨RL78系列MCU

    MVG推出SpeedProbe DL解决方案:有源相控阵天线校准速度提升至5

    系统高达5的校准速度,显著提升有源相控阵天线在防务领域的测试效率与性能。 MVG销售总监 Per Noren 表示:“SpeedProbe DL解决方案 在IDEX展会上
    发表于 04-21 16:35 1340次阅读
    MVG推出SpeedProbe DL解决方案:有源相控阵天线校准<b class='flag-5'>速度</b>提升至<b class='flag-5'>5</b><b class='flag-5'>倍</b>

    准谐振反激式开关电路分析及高能效设计指南

    ,同条件效率比硬开关高。 4、变压器二次匝数较少。方便二次采用安规绝缘线绕制。 5、非对称设计。 6、体积相对较小 7、二次整流元件要求很低。 8、低电压整流元件有效提高了整流效率和降低成本。 9
    发表于 03-21 16:16

    EP磁致伸缩位移传感器助力汽车轮毂制造突破生产瓶颈

    博尔森EP磁致伸缩位移传感器是气动门控制系统的核心组件,采用国产技术实现100%自主可控。通过优化气动门开关速度降低了企业运营成本提高了生产效率。同时,通过提供高精度反馈,
    的头像 发表于 03-09 11:56 571次阅读
    EP磁致伸缩位移传感器助力汽车轮毂制造突破生产瓶颈

    Nordic开发工具之NRF54L15-DK

    128MHz的Arm Cortex-M33处理器,处理能力比nRF52840提高了,同时降低了功耗。拥有1.5MB非易失性存储器和256KB RAM,可同时运行多个无线协议。 提供安全启动、安全固件
    发表于 03-05 10:39

    Profinet 转 Modbus TCP 借网关达成西门子 PLC 与福伺服传感器连接

    了每个零部件的装配质量,产品的一致性和可靠性,减少了因装配误差导致的产品缺陷和召回风险,提升了整车的质量和安全性。同时,提高了装配效率,缩短了生产周期,降低了生产成本
    的头像 发表于 02-27 14:49 604次阅读
    Profinet 转 Modbus TCP 借网关达成西门子 PLC 与<b class='flag-5'>倍</b>福伺服传感器连接

    制造业上了MES后,生产过程透明化,实时掌握生产动态

    MES系统可以简化人工操作,如通过移动终端报工、扫码确认工序等,减少纸质单据流转和人工录入时间。这不仅提高了工作效率,还降低了人工错误率。例如,某企业应用MES后,数据录入时间减少90%,人工
    的头像 发表于 02-22 10:12 750次阅读
    制造业上了MES后,生产过程透明化,实时掌握生产动态

    工厂为什么要上设备数据采集系统?

    工厂上设备数据采集系统通过实时监控、优化生产流程和精准安排生产计划,有效提高了生产效率,降低了生产成本提高了整体生产能力。
    的头像 发表于 01-20 10:17 734次阅读
    工厂为什么要上设备数据采集系统?

    采用通行密钥后,X的登录成功率提高了1

    作者 / 开发者关系工程师 Niharika Arora X 是一款社交媒体应用,涵盖各类时事内容,旨在帮助全球近 5 亿用户通过实时评述了解事件始末。最近,X 开发者改进了 Android
    的头像 发表于 01-20 10:11 1151次阅读
    采用通行密钥后,X的登录成功率<b class='flag-5'>提高了</b>1<b class='flag-5'>倍</b>

    OpenAI GPT-5开发滞后:训练成本高昂

    近日,据最新消息,OpenAI在推进其备受期待的下一代旗舰模型GPT-5的开发进程上遇到了困难。由于计算成本高昂且高质量训练数据稀缺,GPT-5的开发已经落后于原定计划半年之久。 据悉,OpenAI
    的头像 发表于 12-23 11:04 1428次阅读

    SL4008B dcdc5V-40V耐压 输出支持升压、升降压电源芯片

    简化了外围设计降低了系统的复杂性。此外芯片还内置了过流保护、EN脚关断功能以及过温保护电路这些保护机制确保了电源和负载的安全提高了系统的可靠性。 芯片的工作频率可通过外接电阻进行调节这一特点使得
    发表于 12-19 11:24