0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型,教培机构要过窄门

脑极体 来源:脑极体 作者:脑极体 2023-09-14 21:09 次阅读

一度“元气大伤”的教培机构,也开始加入大模型的热潮了。

教育+大模型,并不稀奇,自从AI大模型火爆之后,教育就被认为是大语言模型最容易落地的领域。稀奇的是,和其他场内玩家相比,教培机构的优势确实称不上明显。

目前,市面上在做教育大模型的厂商,大概可以分为三类:一类是大模型厂商,如百度“文心一言”大模型被接入旗下品牌的学习手机,科大讯飞推出了星火大模型及学习机产品;第二类是教育科技公司,如网易有道打造了“子曰”大模型,作业帮自研了银河大模型,可汗学院、多邻国、Coursera、猿辅导等也都纷纷将产品与大模型结合,推出了AI助手型口语教练。

另一类,就是受“双减”影响的教培机构了,如新东方、好未来、学而思,也都披露了自家的大模型成果。

大模型在教培市场大有可为,与教培机构在大模型竞争中拔得头筹,这两个结论显然是不能划等号的。

毕竟三类玩家中,教培机构可能是离教育最近的一个,但也是离大模型最远的一个。技术、算力、资金、人才、互联网产品营销……教培机构都不可能比科技巨头、互联网企业玩的更溜。

那么,教培机构做大模型,是不是一场必输的游戏呢?我们认为不是。

正像《马太福音》中所说,“你们要进窄门。因为引到灭亡,那门是宽的,路是大的,进去的人也多;引到永生,那门是窄的,路是小的,找着的人也少”。

教培机构做大模型,应该换一个思考方向——钻入“场景”的窄门,走巨头大厂不愿意投入的“小路”,建立核心竞争力。

理解这件事,我们从教培机构究竟为什么要出发,开始说起。

原点,为什么出发

你可能会问,有钱、有技术、有实力的公司有壁垒,搞大模型顺理成章。开源大模型泛滥,普通公司搞大模型,简直就是往红海里跳,教培机构刚刚从“双减”阵痛中恢复了一点元气,怎么这么想不开?

说句公道话,教培机构做大模型,逻辑是能够自洽的。

第一个合理之处:大模型时代的教育,也需要教培。

有人说,大模型可以取代人类助教,智能导师比人类教师成本更低,这是确实存在的。但是,大模型仅仅是一个工具,并不能替代教师和教培机构的服务内容。

短期内,大模型还有很多技术难题没有解决,比如幻觉,大模型“一本正经地胡说八道”,输出的都是错误的信息,很可能培养出“学渣”;比如黑箱,大模型生成的内容可解释性不高,思考过程不清晰的话,答案的可信度不高,让AI“无人驾驶”来辅导孩子,学习效果不一定好。

长期来看,即使大模型进化到极高理解力、极高自动化程度、极低错误率,但教育产品和服务的本质还是学生,还是需要教培服务来更好地满足“千人千面”的具体需求。

正如同济大学校长、教授郑庆华所说,过去是老师和学生的二元结构。今天,机器在很多领域比老师干得还好。因此,未来的教学模式,可能会拓展为老师、机器、学生三元结构。所以,教培机构与AI结合,还是有很多的可能性的。

第二个合理之处:教育领域的大模型,精调少不了。

大模型自身的学习能力很强,GPT-4在SAT 等考试中都超过了88%以上的人类应试者。但就像高考状元不一定都是好老师,大模型学得好不代表一定能教得好。教育大模型,需要在通用大模型的基础上,加上自身数据进行精调,针对具体场景进行迭代优化,才可能(注意是可能)解决很多教育环节的具体问题。

举个例子,实际应用中,教育大模型非常重要的一点就是合规,用于教学、备课等场景的大模型,对语言组织能力、逻辑推理能力要求更高,且容错率低,一旦爆出不适当的内容就是教学事故,要提升大模型在此类任务中的安全可控,除了依靠高质量的标注数据,还需要专业教师的反馈、知识经验,而拥有大量教师人才和教学经验、数据的教培机构,显然是更具备行业优势。

第三个合理之处:短板不是真的短,长板却是真的长。

大家都学过田忌赛马的故事,在竞赛中获胜要用自己的长处去对付对手的短处。一眼看去,似乎教培机构在技术、人才、算力、资金等各方面,都比不上科技巨头或互联网公司,但有没有可能,这些短板在实际中,都不算是什么短板呢?

比如技术,教培机构确实在基础模型上的积累不多,但作为垂直行业,教培机构其实也没有必要全力投入自建底层模型,通过API云端调用、与头部厂商合作等方式,用相对较少的数据、算力资源和开发人员,就能建设出垂类的教育大模型。

多邻国的生成式AI应用,都是基于OpenAI的大模型来研发的,其报告中也强调,要做好功能而非做大模型,专注于应用场景。由此可见,教培机构如果不在基础模型赛道上跟科技巨头正面硬扛,那么所谓“短板”,其实对于做垂类大模型,影响并没有想象的大。

反而教培机构所拥有的数据、场景、行业know-how等“长板”,在大模型具体落地应用时,能发挥非常关键,甚至关乎生死的作用。

举个例子,教育和AI大模型,本质都是先苦后甜、漫长回报的慢生意,中间要经历很长的摸索、研发、客户积累的过程,习惯了“大水漫灌”、烧钱式增长的科技创业公司,反而可能因为太过激进、导致亏损,反倒是习惯了做慢生意的教培机构,有更多的耐心和教育大模型一同长跑,更有可能等到盈利的那一天。

所以,往深了看,教培机构做大模型的底层逻辑,其实是有其合理性的,也是有希望在激烈竞争中获得一席之地的。

终点,彼岸的风景

第二个问题,更贴近教学场景的教培机构,能给教育大模型带来哪些不一样的选择呢?区别于其它教育大模型的差异化竞争力,究竟在哪里?

这就要来说说,目前教育领域都在用大模型干什么。

软件层面,大模型+教育的新应用可以说是“乱花渐欲迷人眼”,不过可以统称为“AI助教”。就是让大语言模型来完成大量人类教师的重复性工作,比如撰写讲课大纲、口语陪练、作业助手、互动式讲题、课堂对话助手、知识点查询、智能评卷等,减轻家长和教师的辅导压力。

硬件层面,将上述软件能力集成到学习机、学生手表、学生手机、平板电脑等产品上,结合拍摄、OCR、姿态传感器等硬件能力,对终端算力、配置、交互等进行优化,比如要将大模型的规模压缩,以便在端侧部署。

目前来看,随着入局玩家的增多,无论是“AI老师”还是AI智能教育硬件,产品功能开始趋于同质化,逐渐呈现出白热化的竞争态势。这时候,教培机构做大模型,或许可以从既有优势中提取出一些差异化能力:

更专精。目前,“AI老师”的同质化功能,主要集中在一些容错率较高的场景,比如口语对话,开放式聊天对大模型的理解能力、逻辑能力等要求,是没有那么高的,而一些容错率较低的场景,比如数学解题、结构分析等,就比较难了。这恰好是教培机构的强项,通过精调、人工标注等方法,可以与同类产品拉开差距。我们注意到,学而思就重点研发MathGPT数学大模型,聚焦在数学领域的解题和讲题算法。单学科的精准辅导,可以成为教培机构做大模型的突破方向。

更个性。大模型好不好用,关键还是要看学生学的好不好。有一项1984年的研究发现,接受一对一辅导的学生表现,比接受传统课堂教学的学生高出两个标准差。我们毫不怀疑,未来接受人类优秀老师辅导的学生表现,也会比接受AI老师教学的学生高。因为,学生在人类老师的注意和评价下,更有学习动力。所以,对于教培机构来说,未来可以用大模型来赋能线上课堂,给老师找个AI助教,让人类教师有更多的时间和精力,去深入了解和指导每一个学生,洞悉学生的兴趣,制定个性化的学习规划,这或许是让人类教师更有职业成就感,让学生学习效果更好的方式。通过人机协作,也能减少教育者在适应新工具时的抗拒心理。

其实说白了,教培机构以前在整个教育体系中所提供的差异化价值,有了大模型之后,依然没变,只不过用更高生产力的工具去实现。

两点之间,过窄门

说了这么多,感觉教培机构做大模型,好像是有理有据,既有前途又有钱途,是不是开足马力、全力投入,就能成功呢?

别忘了,在原点和终点之间,还有许多岔路口,而每一道都可能将教培机构引向歧途。

比如说,教培机构选基座模型,开源还是闭源?

很多人可能会说,当然是开源了,大厂开源的大模型性能高、成本近乎免费,fine-tune微调一下就能上线,简直不要太爽。可是问题来了,开源的free代表自由,也代表着开源人可以“不负责任”,毕竟又没找你收钱,后续出现了代码问题或者漏洞,没人维护就成了大麻烦。遇到新的勒索软件/病毒,开源人撒手不管,企业也没招。而且,开源的open并不是没有约束,是要有许可证的,如果开发者不愿意授权,或者滥用开源项目,很可能导致系统后续不可用。所以,用开源大模型来开发自己的垂类大模型,风险是客观存在的,一定要注意合规,防范失控的风险。

那有人可能会说,那我直接选闭源大模型作为基座,总没问题了吧?

值得注意的是,大厂的闭源的基座模型,能力上各有差异,很多排行榜所测试的能力,未必适配教育场景的需求。比如参数规模大的模型,性能表现比较好,但没办法部署到算力有限的端侧教育平板上,教培机构又不可能雇一个科学家团队来进行蒸馏、剪枝之类的压缩处理,是不可用的。所以,要找到最为理想的解决方案,需要教培机构有懂大模型的人才,开展专业的评测和选型。

此外,选择闭源大模型,给基础模型厂商付费,这也是一笔真金白银的开支,对于“元气大伤”的教培机构来说,也会带来一定的压力。

而且基础模型背靠大厂,在消费者和用户之间有较高的知名度,选择这类闭源模型确实可以很快说服消费者,快速做出购买决策,但也将自己与基础模型厂商捆绑在一起,一旦基础模型出现误差,就会影响消费者对品牌的观感。教育无小事,所以教培机构在选择闭源模型合作方时,也需要慎重考虑,最好是选择有“国家队”背书的大模型厂商,才是长久经营之道。

除了模型选型,在落地、迭代、营销等多个环节,教培机构要真正转型成为一个大模型能力的科技公司,需要补的课还比较多。

比如应用开发,教培机构要成为“产品经理”。教培机构直接调用基础模型API,可以短平快地打造出AI应用,但很容易陷入同质化竞争,无法发挥其优势,利润空间也会非常有限,而打造一款爆款AI原生应用,将大模型、AI跟业务结合起来,甄别用户的真伪需求,解决刚需问题,做到工程化的可用程度,需要深入到产品级思考。

几年前,俞敏洪在《在线教育到底有没有未来?》的一次发言中,说了一句话:是否有持续的接近刚需的需求,是判断一个教育公司的商业模式是否可以持续的关键。

大模型+教育刚刚开始,老师、家长、学生、学校、机构……都还在一点点探寻需求。其中哪些是恐惧错过的FOMO情绪驱动下的无效产物,哪些是真正的持续的刚需,或许只能交给时间。而在这个窗口期内,传统教培机构能否生长出AI产品能力,还是未知数。

总结一下,做大模型的路上会有无数岔路,是否有过窄门、走小路的勇气,能否做对选择,或许比技术本身更加重要。

无论是为了教育,还是为了生意,教培机构都需要新的故事,大模型是必然之选。

教育,将是大模型所孕育的无数新产业里,更早出发、更晚抵达的一个。对于教培机构来说,未尝不是一件好事,教育大模型的风口吹得更久、更长,留给教培机构的转型窗口和成功概率,也就更大一点。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26472

    浏览量

    264106
  • 大模型
    +关注

    关注

    2

    文章

    1543

    浏览量

    1139
收藏 人收藏

    评论

    相关推荐

    使用CUBEAI部署tflite模型到STM32F0中,模型创建失败怎么解决?

    看到CUBE_AI已经支持到STM32F0系列芯片,就想拿来入门嵌入式AI。 生成的模型很小,是可以部署到F0上的,但是一直无法创建成功。 查阅CUBE AI文档说在调用create函数前,启用
    发表于 03-15 08:10

    FPGA靠谱培训机构

    各位大佬好,想问下是否靠谱的FPGA的培训机构推荐的?
    发表于 02-28 15:02

    大华股份:大模型大幅缩短开发周期

    近日,大华股份有限公司在接受机构调研时表示,星汉大模型具有5种优势,全面构建好用可用的行业大型模型,支持大模型全场景落地。
    的头像 发表于 11-14 14:47 400次阅读

    请问LTspice怎么导入模型

    LTspice怎么导入模型? 我下载了如图的模型怎么导入到LTspice中,去使用它完成电路图的绘制? LTspice里的模型太少太少了,我刚刚安装的最新版软件,搜索的第一个芯片A
    发表于 11-14 08:24

    无钻机钻探机器人推靠支撑机构设计与分析

    基于新型无钻机钻探机器人,设计一种推靠支撑机构,对其进行结构设计和工作模型分析。该机构结构上采用两对轴向交错排布的液压缸,既增加了推靠支撑的行程,又增强了径向支撑强度;同时前后支撑机构
    的头像 发表于 11-10 14:14 385次阅读

    金融业需要的大模型,是一个系统化工程

    面向未来,金融机构应用大模型的能力,将成为关键竞争力
    的头像 发表于 09-21 09:14 790次阅读
    金融业需要的大<b class='flag-5'>模型</b>,是一个系统化工程

    金融和大模型的“两层皮”问题

    金融机构也会成为更早挖掘到金矿的第一批大模型淘金者
    的头像 发表于 09-20 09:05 870次阅读

    AscendCL快速入门——模型推理篇(上)

    腾CANN平台专用的离线模型,既然调用模型进行推理,首先当然是要把模型加载进来,最简单的场景就是从磁盘加载一个离线模型文件进内存,接口如下
    发表于 08-24 11:04

    keras顺序模型与函数式模型

    keras提供两种搭建模型的方式: 1. 顺序模型(也可看做是函数式模型的一种特殊情况) 2. 函数式模型 两种方式优点缺点顺序模型
    发表于 08-18 06:01

    AI大模型和小模型是什么?AI大模型和小模型的区别

      随着人工智能的不断发展和应用,机器学习模型的大小越来越成为一个重要的问题。在机器学习中,我们通常将模型分为两类:大模型和小模型。本文将介绍AI大
    发表于 08-08 16:55 5626次阅读

    模型Transformer工作原理

    模型
    恬静简朴1
    发布于 :2023年07月18日 17:14:58

    将Pytorch模型转换为DeepViewRT模型时出错怎么解决?

    我正在寻求您的帮助以解决以下问题.. 我在 Windows 10 上安装了 eIQ Toolkit 1.7.3,我想将我的 Pytorch 模型转换为 DeepViewRT (.rtm) 模型,这样
    发表于 06-09 06:42

    最新、最强大的模型GPT-4将向美国政府机构开放

    最新、最强大的模型GPT-4将向美国政府机构开放 此前微软已向其商业客户提供了OpenAI模型,现在微软宣布将向azure government云计算客户开放openai的人工智能模型
    的头像 发表于 06-08 20:15 1221次阅读

    大家觉得示器好不好用?

    器怎么设计最好用? 机器人编程,看是一种程序设计,实际上更多的是建模数据设计。 所以, 示器更接近3d建模最好,例如,一定要有sin,cos等三角形和圆形计算按钮。 我的三角形学得很烂,就不多说了。 要说编程功能的话,一定要有api表,可以一键调用。 我没有上过机,
    发表于 05-24 15:32

    制定

    作为一名本科院校物联网工程的教师,正在修订最新的,正在认真考虑鸿蒙系统的嵌入,希望此书能有好的思路提示。
    发表于 05-09 08:32