0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型时代的程序员:不会用AIGC编程,未来5年将被淘汰?

jf_WZTOguxH 来源:AI前线 2023-08-04 15:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言

下面是一段利用 Co-Pilot 辅助开发的小视频,这是 Apache SeaTunnel 开发者日常开发流程中的一小部分。如果你还没有用过 Co-Pilot、ChatGPT 或者私有化大模型帮助你辅助开发的话,未来的 5 年,你可能很快就要被行业所淘汰。因为这些善于使用 AIGC 辅助编程的人可以 10 倍于你的速度开发相应的代码,而你没有这个技能。我并不是危言耸听,读完此文,我相信你对 AIGC 研发提升研发效率会有全新的认知。

2大模型颠覆传统初级程序员的培训和辅导过程,让技术和经验“平权”

过去,初级程序员入职学习编程时,往往是师傅给一个任务需求,教大体的思路,然后在初级程序员写出代码工作当中培训和纠正,针对不同的命题告诉不同的方案,直到初级程序员把这些经验学会。

但大模型的到来把这个过程完全改变了。大模型自己具有广泛的知识,而且有一些基础的推理能力,它可以经历无数次的实践,学习公司里各种各样的代码和业务定义,它所遇到的场景要比师傅当年要遇到的场景多得多,同时它会根据开发者的需求和目标给出可能的答案。

这个过程就像我们多了一个无所不能的“师傅”,随叫随到还可以给你直接写出可能的代码,让你参考学习,让一个初级的程序员快速具有“师傅”写代码的能力。经过自己的学习和调整,就可以提交出一个远超你自己个人水平的代码,让别人 Review。

那么,我们有什么理由不使用大模型来提高自己的研发效率呢?

3如何使用大模型辅助编程?

目前常见的工具有 ChatGPT、Co-Pilot、私有化大模型等等,在不同场景下要用不同的方法来编写程序:

cb8b7254-3288-11ee-9e74-dac502259ad0.png

可以看到,人类其实最适合就是做比较有挑战和创新的架构类产品,或者是某个新业务场景的代码,如果中间有复用的部分或者类似的算法,可以使用 Co-Pilot 快速提升效率;ChatGPT 可以用于类似场景的代码来自动生成,稍微修改就可以使用;私有化大模型更适合对数据和代码安全有要求,而又需要大模型比较了解你的业务知识的场景,私有化大模型是需要 FineTune 的。

可能有人会说,私有化大模型普通公司玩不起的!其实这是一个误解,如果你要原生训练一个原生私有化大模型,估计中国能玩得起的公司不超过 5 个,而大多数公司不需要训练大模型,只需要根据开源大模型优化(Finetune)大模型就可以让大模型理解自己的业务了,而这个代价就是 1-2 张 3090/4090 的显卡就可以了,整个的实行过程可能也只需要 2~3 个小时的配置就可以(感兴趣的话可以参考下面这篇文章:《用一杯星巴克的钱,训练自己私有化的 ChatGPT》,里面讲的利用是 Apache DolphinScheduler 和配置好的模板,拖拽就可以训练一个大模型的例子)。

使用私有化大模型可以直接实现以下功能:

软件众多功能中,直接找到你所需要的功能;

众多复杂的使用手册和规则,找到你所需要的功能和说明;

辅助编程,Txt2SQL,提高数据程序员的效率。

使用私有化大模型来辅助编程,真的距离我们一点都不遥远。如果你还不太相信 AIGC 自动化编程时代已经来临了,那么下面这个开源项目如何利用 AIGC 提高研发效率的例子,或许可以帮助你更好理解。

4大模型自动化编程实例:Apache SeaTunel

Apache SeaTunnel 愿景是“连接万源,同步如飞”,也就是可以连接市面上所有的数据源(包括数据库、SaaS、中间件、BinLog),而且同步效率要做的最高。这对于任何一家公司都是不可能做到的事情,而面对几千上万的 SaaS 软件和不断变化的接口,甚至人类也无法做到这一点,那么 Apache SeaTunnel 核心项目团队是怎么在这个 AI 时代设计这样一款开源软件呢?总体如下图所示:

cb9930f6-3288-11ee-9e74-dac502259ad0.png

首先,计算核心引擎部分,属于专门为同步而生的计算引擎,它不同于 Flink、Spark,主要在同步复用内存、CPU、带宽和确保数据一致性上下功夫,所以大部分代码都没有可借鉴的,需要核心开发工程师直接编写、修正,以确保“同步如飞 ”。当然,因为是开源项目,核心引擎部分得到了众多大厂专家的修正和讨论,以确保时刻跟进全球最先进的技术。

其次,数据库的核心 Connector,例如 Iceberg Connector,这些接口实现比较复杂,除了保证代码正确之外还要保证数据传输效率很高,这时候直接使用大模型是无法达到我们所需要的效果的。因此主力还是人,但可以复用自己和云端过去常用的代码来做,这时候使用 Co-Pilot 就是最佳方案,主导者是人,而大模型可以作为辅助来帮你补充常规算法和复用的代码,如开头视频所示的样子。

面对浩如烟海的 SaaS 接口,例如 MarTech 领域的 SaaS 就超过 5000 个,靠人力对接接口是不可能的。SeaTunnel 核心团队就想了一个办法,根据多次尝试,把过去为人写的十几个接口进行抽象,不断和 ChatGPT 磨合,最终变成 2 个可以让 ChatGPT 理解并写出优雅代码的接口,然后利用 ChatGPT 可以读懂 SaaS 接口文档的特点,直接生成相关代码。这在 SeaTunnel 当中叫“AI Compatible”特性,兼容 AI。我理解这更是程序员和 AI 的一种“和解”,大家不要相互抢饭碗,程序员为 AI 做好准备,AI 来做程序员无法做到的事情。

这个特性在 Apache SeaTunnel 2.3.1 里面已经发布了,当然作为众创的开源软件,该功能还有各种各样的缺陷有待提升。不过因为代码是完全开源的,我相信会有越来越多的爱好者把它打磨到更加自动化。比如,我已经听到有一个开发者要做一个 GPT Coder,监控 GitHub 上的 SaaS issue,自动化调用 ChatGPT,生成代码并提交 PR,让机器人和人类卷到极致。

cbcdac00-3288-11ee-9e74-dac502259ad0.png

5大模型自动化编程存在的问题

虽然 ChatGPT、Co-Pilot 可以辅助编程,但它们也不是无敌的,目前大模型生成代码还有很多挑战:

准确率问题;

无法做 code review;

无法实现自动化测试;

无法担责。

大模型依然会出错,这在未来一段时间是常态,哪怕是 ChatGPT4,写出来的代码也就 90% 的正确率,所以要尽量简化它写代码的过程,否则可能会写出来完全不对的代码。大模型快速生成代码之后,人类的 code review 会跟不上,因为机器是无法确定最终代码实现业务逻辑是不是对的;而大模型做 code review 的话,你会发现每次都给你煞有其事地提出来不同的改进点,但其实都是无关痛痒部分,无法确定最终的逻辑正确性。

同时,自动化测试案例和自动化测试也是当前大模型一个弱点,TestPilot 属于在学术圈比较活跃的内容,大家可以参考 Cornell 的《Large Language Models are Few-shot Testers: Exploring LLM-based General Bug Reproduction》和《Adaptive Test Generation Using a Large Language Model》都是一些比较有意思的文章,不过距离工程化使用都还有一定距离。

当然,自动化编程还有最后也是最难得一关——责任问题,就像自动化驾驶一样,哪怕是做到 L5,如果出问题到底是谁的责任。就像 WhaleOps 实现了 Txt2SQL 之后,很多用户问,为什么不直接把 SQL 执行出来变成最终的结果给我,这才是业务部门最终需要的东西。

我认为这是一个哲学问题,而不是一个技术问题了。不说现在 ChatGPT 90% 的准确率,假设将来大模型可以做到 99.9999%,你敢直接问一句话让它自动计算全公司的工资然后自动对接银行发工资么?如果出问题,你觉得是谁的问题呢?永远不能幻想用技术解决所有的业务问题,大模型也是如此。

6未来展望

现在我们还处于大模型自动化编程的初期,很多小伙伴还在处于试用 Co-Pilot 和 ChatGPT 阶段,大多数程序员还没有用上私有化大模型来根据自己公司的业务提升编程效率,不过我认为未来的 3-5 年,自动化辅助编程一定会成为我们这一届开发者的标配工具:

国产基础大模型拉进 ChatGPT 距离,易用性提高;

开源大模型准确性、性能提升,更多的公司使用私有化大模型 ROI 提升;

大模型自动化门槛减低,除了 DolphinScheduler,更多的大模型训练平民化工具诞生;

技术管理者对于大模型自动化编程认知提升,技术管理流程适配大模型时代;

在当前经济周期下,降本提效利用大模型提高效率势在必行。

所以,未来几年,如果你在研发过程还是只会 CRUD,不会有效利用大模型将自己的经验和业务理解 X10 或者 X100 的话,那么不用等到 35 岁,你就会被会大模型编程的那批程序员所取代,他们 X10 之后,你就是那被淘汰的 9 个人。

当然,虽然有点危言耸听,但是编程提效当中的大模型趋势是势不可挡的,我也只是在大模型自动化编程这方面不断实践摸索的小学生,我相信会有很多的技术管理者和架构师加入到大模型自动化编程的浪潮中来,不断迭代和优化在开发领域当中人和大模型之间的关系。最终,让程序员、AI、技术研发流程更有效的为业务服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ChatGPT
    +关注

    关注

    31

    文章

    1600

    浏览量

    10397
  • AIGC
    +关注

    关注

    1

    文章

    393

    浏览量

    3273
  • 大模型
    +关注

    关注

    2

    文章

    3796

    浏览量

    5276

原文标题:大模型时代的程序员:不会用AIGC编程,未来5年将被淘汰?

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Codex AI编程实战课资源

    AI 编程时代来临,Codex 实战带你抢占未来开发先机 站在 2026 的技术奇点,编程的边界正在被无限拓宽。随着 OpenAI Cod
    的头像 发表于 04-27 13:55 60次阅读

    2026智泊第23期AGI大模型应用开发实践班v6.0

    获课地址:pan.baidu.com/s/1g64x9D_jp9ufk4uBpQBmvA?pwd=497f 未来开发者必备:智泊23期AGI大模型实战,构建十淘汰的技术壁垒 在20
    的头像 发表于 04-22 15:12 840次阅读

    华为昇腾深度适配智谱AI全新开源模型GLM-5

    20262月12日,智谱AI发布Agentic Engineering时代最好的开源模型GLM-5,从“写代码”到“写工程”的能力进一步演进。在Coding与Agent能力上取得开源
    的头像 发表于 02-25 14:41 1389次阅读
    华为昇腾深度适配智谱AI全新开源<b class='flag-5'>模型</b>GLM-<b class='flag-5'>5</b>

    Claude Code在国内怎么使用?AI编程人员必看的完整指南!

    这两,AI编程工具层出不穷,但最近 Claude AI 在程序开发者圈子里备受欢迎,越来越多程序员发现使用Claude的体验非常接近“一个懂工程的搭档”,而不是简单的代码生成器。 但
    的头像 发表于 01-23 14:09 6084次阅读
    Claude Code在国内怎么使用?AI<b class='flag-5'>编程</b>人员必看的完整指南!

    芯盾时代SDP助力企业应对核心机密泄露危机

    无论你是程序员、文案、财务,无论你想撸代码、出海报、做报表,各式各样的AI总能满足你的需求,让你的工作更加轻松。
    的头像 发表于 12-26 11:49 868次阅读

    大理的AI野心藏不住了——风花雪月中千名程序员探讨人工智能

    2025 12月4日至6日第二届CCF程序员大会暨大理人工智能与应用国际开发者大会在大理圆满落幕。
    的头像 发表于 12-24 17:45 913次阅读
    大理的AI野心藏不住了——风花雪月中千名<b class='flag-5'>程序员</b>探讨人工智能

    VISA读取时报错:传输时设备提交一个输入协议错误

    请问应该如何解决?老工程师传下来的软件,使用时出现这个错误,我想改一下程序但是之前不会用labview,请求指导一下方向
    发表于 12-16 17:39

    程序员最常见谎言

    我基本都说过他说过的那些谎言,我又想了想自己日常写代码过程中也会说的一些话,然后就是下面这些汇总了。 1这只是个临时方案,不会用在实际版本中。 2我以后再给代码写注释和文档,这个版本比较急,以后
    发表于 12-10 08:24

    Unix的相关知识

    1 Unix哲学 Unix 哲学注重实效,立足于丰富的经验,并不会在正规方法学和标准中找到它,它更接近于隐性的半本能的知识。Unix程序员在探索开发的过程中积累的经验,非Unix的程序员也能够从这
    发表于 12-10 07:13

    编程序段的定义介绍

    已经由操作系统自动设置为代码段的段基址,数据段的段基址则需要程序员手动装入DS中; ASSUME伪指令用于指定每一个数据段所对应的段基址寄存器。如上面的代码中CODE段的段基址寄存器为CS,DATA段
    发表于 11-21 08:19

    奔赴热AI,码力全开!Talkweb House@1024程序员日系列活动圆满收官

    1024程序员日”系列活动至此划上了一个圆满句号。本届1024程序员节以“AI构建世界,智能引领未来”为主题,广邀技术大咖、产业领袖、企业代表与全球开发者齐聚星城
    的头像 发表于 10-27 18:59 979次阅读
    奔赴热AI,码力全开!Talkweb House@1024<b class='flag-5'>程序员</b>日系列活动圆满收官

    改造小萝卜机器人第二天——Visual Studio Code 解决ESP-IDF报错问题

    : Blockly-Vscode Version: 0.0.1 成功但不会用 Name: VscodeBlocklyPython Version: 0.0.1 成功但不会用 感觉两个块块拖拽编程可用,做不了复杂
    发表于 10-24 04:23

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    :AI模型在MCU/NPU部署的文章互动量增长超300%;嵌入式AI相关问答数量翻倍;PCB+AI+自动控制领域投稿创历史新高。这不是巧合,是时代趋势的反映。四、工程师的“黄金十”,正在AI+硬件中开启
    发表于 07-30 16:15

    无法在调试中连接到PSOC4怎么解决?

    您好,我有一块使用 PSOC4 CY8C4013SXI-410 制作的小板。非常简单的设备,它只有三个 GPIO 引脚并通过 5 引脚 SWD 进行编程。我遇到的问题是程序员能够看到该设备但无法对其进行
    发表于 07-22 06:02

    跟老齐学Python:从入门到精通

    础的学习者介绍一门时下比较流行、并且用途比较广泛的编程语言,所以,本书读起来不晦涩,并且在其中穿插了很多貌似与Python 编程无关,但与学习者未来程序员职业生涯有关的内容。 获
    发表于 06-03 16:10