0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GitHub基于大语言模型构建Copilot的经验和教训

jf_WZTOguxH 来源:AI前线 2023-10-17 17:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GitHub 在一篇文章中分享了他们在构建和扩展 GitHub Copilot——一个使用大语言模型的企业应用——过程中所学到的经验教训。

在 GitHub 的一篇博文中,GitHub 的 AI 产品负责人 Shuyin Zhao 描述了他们如何在三年多的时间里历经三个阶段——“Find it”、“Nail it”和“Scale it”——成功推出了 GitHub Copilot。

在“Find it”阶段,他们专注于找到 AI 可以有效解决的问题,通过一种足够专注的方式快速推向市场,并且足以产生影响。

这包括确定到底是为了谁而解决问题——帮助开发人员更快地编写代码,减少上下文切换。此外,他们只关注 SDLC 的一部分:IDE 中的编码功能,并结合当下的 LLM 的能力。这样他们就可以专注于让工具提供代码建议,而不是生成全部代码。他们还致力于确保他们所做的是对现有工具进行增强,不要求开发人员改变已有的工作流程。

“在设计产品时,我们不仅要考虑输出需要人类进行评估的模型,也要考虑正在学习如何与 AI 互动的人类。”

——Idan Gazit,GitHub Next 高级研发总监

在“Nail it”阶段,他们基于从 A/B 测试中获得的真实用户反馈进行迭代式产品开发。他们进行快速迭代、试错和学习。在使用 Copilot 的 Web 接口进行了简短的实验后,他们将重点转向了 IDE,以减少在编辑器和 Web 浏览器之间切换,并让 AI 在后台运行。在进一步的迭代中,通过观察开发人员在编码时打开的多个 IDE 选项卡,GitHub Copilot 可以同时处理多个文件。

随着生成式 AI 的迅速发展,他们开始重新审视过去所做出的决策,技术的进步和用户对它的熟悉程度有时会让过去的决策变得过时。于是,提供交互式聊天的想法开始活跃起来,他们需要基于沉没成本谬论改变决策,例如,当大语言模型的进步允许一个模型处理多种语言时,就需要改变为每种语言构建 AI 模型的想法。

最后,在“Scale it”阶段,他们致力于确保 AI 模型结果的一致性、管理用户反馈,并定义了关键性能指标,以实现应用程序的普遍可用性 (GA)。他们还考虑了安全性和 AI 责任问题,使用过滤器来避免为用户建议不安全或具有冒犯性的代码。

改进质量和可靠性方面的工作包括缓解大语言模型的幻觉,即答案可能是不可预测的,并且每次查询都有所不同。解决这个问题的策略包括修改发送给大语言模型的参数,以减少响应的随机性,并缓存频繁的响应以减少变化和提高性能。

GitHub 使用等待列表来管理技术预览版的早期用户。这意味着他们可以获得来自一小群早期采用者的评论和反馈。对真实用户反馈的深入分析使得 GitHub 团队能够识别出有问题的更新,并改进产品的关键性能指标,例如开发人员保留了多少由 Copilot 生成的代码。

最后,他们确保开发人员生成的代码是安全的,并通过过滤器来拒绝可能引入安全问题 (如 SQL 注入) 的代码建议。社区也提出了一些问题,例如 Copilot 的代码建议与公开的代码相重叠可能会产生许可问题或其他影响。他们为此提供了一个代码参考工具,帮助开发人员做出明智的选择。

在市场策略方面,他们向一些有影响力的社区成员展示了技术预览版,并且面向的是个人用户而不是企业。这有助于在正式发布时获得广泛的支持,从而促使企业采用它。

关键在于展示专注于特定问题的重要性、整合实验结果和用户反馈,以及在应用扩展时优先考虑用户需求。

由于生成式 AI 的采用仍处于早起阶段,GitHub 也在密切关注市场对生成式 AI 工具的需求。感兴趣的读者可在 GitHub 的博客上阅读全文。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编辑器
    +关注

    关注

    1

    文章

    829

    浏览量

    33086
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11345
  • GitHub
    +关注

    关注

    3

    文章

    489

    浏览量

    18770

原文标题:GitHub 基于大语言模型构建 Copilot 的经验和教训

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度文心衍生模型PaddleOCR登顶GitHub Star OCR全球第一

    3月30日,百度文心衍生模型PaddleOCR在GitHub上的Star数突破73.3K,超越谷歌Tesseract OCR,成为全球Star数最高的OCR项目。
    的头像 发表于 03-31 11:40 502次阅读

    GitHub王炸:AI编程进入"多智能体时代",1.8亿人彻夜未眠

    的Claude与OpenAI的Codex两大顶级AI编程智能体深度集成至平台核心。此次开放预览版率先面向GitHub Copilot Pro Plus及Enterprise订阅用户,覆盖网页端、移动端
    的头像 发表于 02-06 15:06 348次阅读
    <b class='flag-5'>GitHub</b>王炸:AI编程进入&quot;多智能体时代&quot;,1.8亿人彻夜未眠

    什么是大模型,智能体...?大模型100问,快速全面了解!

    一、概念篇1.什么是大模型?大模型是指参数规模巨大(通常达到数十亿甚至万亿级别)、使用海量数据训练而成的人工智能模型。2.什么是大语言模型
    的头像 发表于 02-02 16:36 1158次阅读
    什么是大<b class='flag-5'>模型</b>,智能体...?大<b class='flag-5'>模型</b>100问,快速全面了解!

    VLA与世界模型有什么不同?

    Language Action,VLA),另一些则致力于构建并应用世界模型(World Model)。这两种路径有什么不同? 什么是VLA,什么是世界模型 先说说VLA。VLA是英文Vision-Language-Action
    的头像 发表于 12-17 09:13 906次阅读
    VLA与世界<b class='flag-5'>模型</b>有什么不同?

    微软Microsoft Copilot Studio智能体平台全面升级

    近期,微软lgnite大会重磅宣布Microsoft Copilot Studio全面升级,集成智能体构建、自动化与治理,支持多模型和跨平台集成,强化安全与可控性。企业可一站式打造高效、合规,且可扩展的智能体系统,推动流程重塑与
    的头像 发表于 12-09 17:36 1511次阅读

    构建CNN网络模型并优化的一般化建议

    通过实践,本文总结了构建CNN网络模型并优化的一般化建议,这些建议将会在构建高准确率轻量级CNN神经网络模型方面提供帮助。 1)避免单层神经网络:我们清楚神经网络本身是需要不断抽象出
    发表于 10-28 08:02

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别的神经网络
    发表于 10-22 07:03

    3万字长文!深度解析大语言模型LLM原理

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持本文转自:腾讯技术工程作者:royceshao大语言模型LLM的精妙之处在于很好地利用数学解决了工业场景的问题,笔者基于过往工程经验
    的头像 发表于 09-02 13:34 3629次阅读
    3万字长文!深度解析大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>LLM原理

    【VisionFive 2单板计算机试用体验】3、开源大语言模型部署

    的系统和芯片架构。 3、拉取/运行大语言模型 ollama的使用方法和docker很像。 返回到ollama的编译路径,找到ollama可执行文件 执行 ./ollama run qwen3:0.6b
    发表于 07-19 15:45

    Copilot操作指南(一):使用图片生成原理图符号、PCB封装

    “  上周推出支持图片生成模型的华秋发行版之后,得到了很多小伙伴的肯定。但看到更多的回复是:为什么我的 Copilot 无法生成符号?只有普通的文本回复?今天就为大家详细讲解下图片生成符号、封装
    的头像 发表于 07-15 11:14 5403次阅读
    <b class='flag-5'>Copilot</b>操作指南(一):使用图片生成原理图符号、PCB封装

    微软开源GitHub Copilot Chat,AI编程迎来新突破

    GitHub Copilot + vscode的组合我已经用了很久,我的代码开发效率完全提升了一个level。帮我代码提示,代码不全,注释理解生成代码等等,这些我是我经常用到的功能。 在今天凌晨4点
    的头像 发表于 07-02 09:34 1456次阅读
    微软开源<b class='flag-5'>GitHub</b> <b class='flag-5'>Copilot</b> Chat,AI编程迎来新突破

    瑞芯微模型量化文件构建

    模型是一张图片输入时,量化文件如上图所示。但是我现在想量化deepprivacy人脸匿名模型,他的输入是四个输入。该模型训练时数据集只标注了人脸框和关键点,该模型的预处理是放到
    发表于 06-13 09:07

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 1412次阅读

    各大厂商与新兴企业推出的 EDA Copilot 工具

    当前EDA(电子设计自动化)领域正经历AI驱动的智能化转型,各大厂商与新兴企业推出的EDA Copilot工具通过自然语言交互、自动化设计优化等技术,显著提升芯片设计效率。以下是基于最新行业
    的头像 发表于 06-06 09:34 3351次阅读