0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯的大模型价值观:实用主义

甲子光年 来源:甲子光年 2023-09-11 17:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

落地方能检验技术真章。

9月7日,在一年一度的腾讯全球数字生态大会上,腾讯自研的通用大语言模型混元大模型正式亮相,并宣布正式通过腾讯云对外开放。企业用户可以直接在腾讯云上调用混元API,或者将混元作为基底模型构建上层应用。

与市场上很多厂商都在争先恐后的优先推进对话式大语言模型不同,腾讯在大模型落地探索上有着明显不一样的节奏和坚持。

最直接的节奏体感是腾讯的“不着急”——在厂商纷纷抢占今年三、四月份的第一波大模型时间卡位时,马化腾直言“腾讯不急于做半成品”。所以直到6月,大众才第一次正式看到腾讯的行业大模型,彼时,市场上已经在风风火火的上演着“百模大战”。

细究这种“不着急”背后,也许并非是因为腾讯在战略上“轻视”大模型的机会,而是他们认为大模型的价值核心不在时间窗口上,而在落地实践中。毕竟,在马化腾看来“大模型是互联网百年不遇的机会,是类似发明电的工业革命一样的机遇。”

这种更倡导落地的价值观在当下正逐步成为行业共识——随着更多大语言模型对外开放,科技公司除了在不断打磨模型能力之外,也相继走进了各行各业,踏上了场景落地探索的新征程。目前,云厂商在大模型的产业落地思路上基本已达成共识:MaaS(Model-as-a-Service)模式,落地行业,走在场景中,和客户一起合作做垂类大模型。

如果大模型的价值核心在场景落地上,腾讯的解题思路是什么?

1.腾讯的选择:实用主义

不同公司在发展大模型技术上思路不同,选择的优先级也不同。有的公司更关心技术、参数,把追赶ChatGPT定为首要目标。有的公司更关心场景闭环,在早期阶段就选择把场景验证纳入技术探索的必经之路上。

腾讯的答案明显是后者。从6月19日发布行业大模型之初,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生就强调了腾讯的大模型价值观:“通用大模型不一定是满足行业场景需求的最优解。企业需要有针对性的行业大模型,结合自己的数据做训练或精调,在合理的成本下,打造实用性更高的智能服务。”

腾讯的这种价值可以用四个字来概括——实用主义。这也是腾讯做大模型贯穿始终的一条暗藏的主线。

一方面,实用主义意味着,腾讯云更关注大模型如何解决场景问题而不仅仅是参数大小。腾讯云副总裁、腾讯云智能负责人吴运声曾直言:“几亿、几十亿、几百亿还是一千多亿,我们并不关心模型参数的那个数字,我们更关注的怎么解决客户的问题,希望用最有效,最低成本的手段去解决客户的问题。”

另一方面,实用主义意味着,要更关心应该用什么技术组合?如何更有效率的解决问题?吴运声提到:“就像举重运动员要举200斤的杠铃,但作为游泳运动员举100斤就够了,作为体育室,我们提供200斤的杠铃,但对于不同类型的运动员或者更多普通人,他们没有必要都要用200斤的杠铃练习。”

在他看来,在一些行业和具体的领域,数据量本身就没那么大,用小参数成本低,效果也会更好。“我们希望以最低的成本,最合适的模型,最好的服务去让客户真正把技术用起来,解决它在场景中的问题。”吴运声说。

他认为这是腾讯云一直在贯彻的技术实用主义:“从大模型整体思路来看,我们并不特别关注形式,而是注重技术产生的实际价值,以及在客户业务中的价值体现。我们的核心出发点都是基于此。”

这种经验和判断来源于腾讯云在to B领域的多年深耕——大模型技术需要基于产业场景,与企业数据融合,才能释放出最大的价值,“智能化的后半场,腾讯云智能在坚持投入AI技术研发的同时,一直专注于产业实践,强调技术的务实可行和产品的安全可靠。”吴运声提到。

对外,所有的技术最终都要面对场景的发问。深度学习之后,上一波AI热潮的归向也是如此。过去几年中,更多AI公司在已经放下“标榜自身有多牛”的身段,转而走向更落地的方向,寻找真正可规模化的场景。

对内,腾讯云也一直在践行落实这种技术实用主义。作为腾讯云承担大量前沿探索工作的关键部门,腾讯优图实验室也一直在坚持“研究和落地并重”的方针:一方面需要站在科技前沿探索更多的可能性,另一方面需要考虑技术能解决的实际问题,而非纯粹的技术至上和论文至上。“研究、落地两条腿走路,这是优图从成立的第一天开始就在强调的重点方向。”吴运声说道。

他认为,关心落地并不意味着不关注前沿研究。“我们的研究恰恰是以解决在落地中遇到的实际问题为前提,每年我们也会发布很多论文,但和其他家不同的地方在于,优图几乎70%、80%论文原点都是我们在实际场景中遇到的问题。基于问题,我们进行探索研究,最终抽象成学术层面的东西。”

技术要更实用也能显现出价值,并不是一句空话。

2.实用主义的源头:一线用户的需求

实用主义并非是腾讯云的一家之言,腾讯依靠的是来自一线企业需求的真实反馈。正如汤道生所言:“企业需要的是在实际场景中真正解决了某个问题,而不是在100个场景中解决了70%-80%的问题。”

今年以来,腾讯云一直泡在一线和用户沟通具体的需求。腾讯云副总裁、腾讯云智能研发负责人吴永坚告诉「甲子光年」,当前,企业客户对于大模型的技术需求正在逐步变得更理性。“客户在张开怀抱拥抱技术的同时提出了更多实用性的需求:有人关心大模型技术能够结合产品上做更定制化;有人希望拓宽大模型更多元的知识来源,也有人希望生成精准的行业知识,准确率要有保障。”他认为,技术需要结合多种因素组合考量:“安全性、部署、成本等多重因素交织下,再去考虑技术的可达性。”

这些多样化的需求意味着,单一模型很难满足所有需求。“我们不会去强调技术有多强,而更侧重于产品如何去解决客户的实际问题。”

基于此,腾讯云打造了支撑实用主义落地的全套MaaS服务体系,并持续根据用户需求进行迭代:基于自研的腾讯混元大模型,同时支持业内主流的开源模型应用,从技术底座、平台能力和智能应用三个维度,助力客户构建专属大模型和智能应用,推动大模型在产业中的落地应用。

6d27fe94-507e-11ee-a25d-92fbcf53809c.png

腾讯云MaaS解决方案,图片来自腾讯

技术底座层包含算力工具和行业模型。算力方面,包含腾讯云今年4月发布的专为大模型训练设计的新一代HCC高性能计算集群;依托自用的向量引擎(OLAMA)腾讯云也已经推出向量数据库(Tencent Cloud VectorDB);以及自研的星脉计算网络架构。“通过存储、计算、网络整体的升级,我们今天实现了训练一轮万亿参数的模型在4天之内就可以完成,并让训练效率得到大幅提升,训练时间得到保障,训练成本下降很多。”腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声提到。

平台方面,腾讯云TI平台是腾讯云大模型能力在行业落地的技术“杀手锏”:不仅包含此前就有的数据标注、训练、评估、测试和部署等工具,还有可以进行更优训练和推理加速“太极Angel”,以及从“业务分析、数据处理、大模型选择”到“模型评测”的一体化完整方法论。吴运声称:“我们对企业在做模型精调过程中的精调、部署等方面的工具做了全栈式打造,可以让每个想做自己模型的企业,基于TI平台,用腾讯云的加速框架、基础算力、开源工具,让构筑行业模型变得更简单。”

在2023年腾讯全球数字生态大会上,腾讯云对这套技术底座进行了新的升级:

平台层,一方面,TI平台也全面接入了Llama 2、Falcon、Dolly等主流开源模型,支持系列模型的直接部署调用、应用流程简单。

工具链层,腾讯云为客户提供了多款即插即用的产品,客户只需加入自己独有的场景数据进行精调训练,就可快速尝试多种大模型,并根据自身业务场景需求,就可以在短时间内精调出专属的模型方案。

加速方面,升级后太极Angel大模型加速框架,通过异步调度优化、显存优化、计算优化等方式,相比行业常用方案性能提升30%以上。

应用层,腾讯企点继续升级了全新一代智能客服,提升了管理端配置能力、知识构建效率,优化C端用户体验;同时腾讯企点分析AI助手,覆盖对话式分析,辅助数据配置、提取智能结论、一键生成报告四大场景,该功能正式在9月向大客户开放内测申请。

这些多样的技术组合支撑着腾讯云将大模型落实到千行百业。

3.践行实用主义,把大模型落地实体经济

对于眼下的腾讯云而言,究竟如何真正将实用主义落地真实的场景中?

从战略优先级上来看,当前腾讯云已经有一套清晰的思考:第一步,锚定标杆客户。第二步,辐射整个上下游产业链的腰部企业。“眼下,我们会挑选若干个关键场景,结合客户需求做深做透,形成标杆,之后就能够往腰部覆盖,开展规模化。”腾讯云副总裁、腾讯云智能研发负责人吴永坚告诉「甲子光年」。

其次是重要行业和领域。这个答案从腾讯云此前的大战略就可以得出——实体经济。

实体经济是大模型必争之地。工信部提出,到2025年,70%的规模以上制造业企业基本实现数字化网络化。腾讯云也在2021年进行了全面的调整来持续开拓实体经济市场。腾讯对自己的角色定位一直是——实体经济的数字化助手。工业、制造、能源、零售等都是腾讯云的核心阵地,目前三一重工、富驰高科、国家电网都是其客户。

腾讯集团副总裁、政企业务总裁李强在分享中称:“腾讯会坚定的推动大模型走入产业全链条。比起聊天、答题、内容生产等,大模型在产业的具体场景应用,对实体经济将带来更大价值。”在他看来,机会巨大:“中国拥有智能化落地的丰沃土壤和场景,我国的制造业规模已经连续13年居世界首位。中国信通院预测,到2030年,中国产业智能化的规模会超过10万亿元,智能化还将推动劳动生产率提升20%。”

目前,腾讯云已经携手政务等行业的头部企业,在二十余个行业探索了超50个行业大模型的应用解决方案。以腾讯云数智人工厂为例,腾讯云MaaS能力可以让数智人分身复刻缩短至24小时,大幅降低成本。在文旅领域推出的文旅大模型,金融领域打造的OCR大模型都是已经在落地的案例。

比如,腾讯云OCR大模型可以提升非结构化内容识别、理解能力,企业可以通过TI平台对OCR大模型进行精调。这是一种极大的能力跃迁。此前传统的OCR深度学习模型需要经过检测、识别、结构化等多个阶段,很难突破监测识别难点,且不具备阅读理解和推理能力,更难以进行标准化,企业的定制成本高昂。新的大模型技术让这些难题不再是障碍,能够让图像到文字直接生成,使得任务间能力互补,泛化性更强,场景更丰富。

OCR大模型提升了很多场景的工作效率,比如工业质检场景下,工厂可以让大模型识别电线规格、零部件规格说明书,物流快递场景下,物流公司可以让大模型识别集装箱规格、电子显示屏读数,这种端到端理解图片的能力,极大的提高了流程效率。

这只是腾讯云推动大模型在实体经济的一小步。

更多关于实用主义的探索正在路上。腾讯正持续推动大模型走入产业全链条。随着技术在千行百业的扎根,从田间到产线,从实验室到便利店,大模型将无处不在。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能化
    +关注

    关注

    15

    文章

    5257

    浏览量

    60314
  • 腾讯
    +关注

    关注

    7

    文章

    1685

    浏览量

    50997
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269

原文标题:腾讯的大模型价值观:实用主义|甲子光年

文章出处:【微信号:jazzyear,微信公众号:甲子光年】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI大模型微调企业项目实战课

    的附加参数,就能达到甚至超越全量微调的效果,让单卡微调百亿参数大模型成为现实。 第三步:对齐与评估——确保输出安全可控 微调后的模型可能会产生价值观偏移或越界回答。因此,实战的最后一步是构建企业专属
    发表于 04-16 18:48

    海康澜大模型助力公共安全领域效率提升

    海康澜大模型再拓新场景,用科技为孩子的上学路筑起一道坚实防线。
    的头像 发表于 03-18 17:35 855次阅读

    PCBA板的颜色密码:选美大赛还是实用主义

    当你拆开手机或电脑,总能看到一块布满元器件的电路板。有人喜欢墨绿底色的沉稳,有人偏爱亮蓝色的科技感,这些不同颜色的PCBA板背后,藏着工程师们心照不宣的秘密。 这些色彩斑斓的\"外衣\"其实是阻焊层涂料,就像电路板的防晒霜,主要作用是保护铜箔不被氧化。常见颜色里,绿色占全球80%的产量,不是因为它最漂亮,而是这种松香树脂材料最便宜——在广东工厂里,绿色涂料每公斤比黑色便宜三分之一,还能让自动光学检测仪(AOI)更轻松发现焊接缺陷。 蓝色电路板常出现在网红路由器上,这种潘通294C色号并非刻意耍酷。某次工程师在调试设备时偶然发现,蓝色背景能让0402封装的贴片电阻像夜空中的星星一样醒目。现在这种颜色成了智能家居设备的标配,毕竟谁不喜欢在朋友圈晒出\"赛博蓝\"的主板呢? 黑色主板总被误认为是高端象征,实际上它可能是最让质检员头疼的存在。某游戏显卡大厂曾坚持使用纯黑配色,结果在回流焊环节,深色基板吸热导致虚焊率飙升0.7%。维修工程师调侃道:\"检查黑色板子就像在煤堆里找黑猫,得用上八倍镜才行。\" 红色主板倒真有点玄学成分。某台系主板厂商做过对比测试:相同配置的红色主板在电商平台点击率高出15%,二手市场溢价5%。不过流水线上的老师傅会告诉你真相——红色涂料流动性更好,能减少0.01mm的厚度偏差,这对高频信号传输确实有点好处。 白色主板堪称电子产品界的\"婚纱\",但保持纯洁要付出代价。某智能手表厂商的白色主板首次量产时,50%的板子被指纹污染报废。后来他们不得不给生产线装上无尘室,工人要戴两层手套操作,硬生生把成本推高20%。 x=4) 下次选购电子产品时,别被主板的\"外衣\"迷惑。绿色板子可能是服务器机房里的劳模,黑色主板或许藏在千元机里装高冷。真正决定性能的是那些你看不见的铜线走位和元器件布局,颜色不过是工程师们留给消费者的视觉彩蛋。
    发表于 03-18 09:23

    Arm率先适配腾讯混元HY-1.8B-2Bit模型

    腾讯混元今日发布了 HY-1.8B-2Bit,这是一款等效参数量仅有 0.3B 的极低比特压缩模型,有助于移动设备厂商和开发者加速实现生成式 AI 的创新落地。作为全球应用最为广泛的高性能、高能效
    的头像 发表于 02-10 17:29 2056次阅读

    海康威视推出基于自研澜工业大模型的包装配件AI质检员

    今天,给大家介绍一位“新同事”,TA就是海康威视新上岗的包装配件“AI质检员”,这位“新同事”来头可不小——“背靠”海康澜工业大模型能力,即使面对海康威视工厂配件包装体量大、规格多变的复杂场景,也能精准识别配件错放、漏放问题并实时拦截风险。
    的头像 发表于 02-02 10:03 939次阅读

    沐曦曦云C500/C550 GPU产品适配腾讯混元开源翻译模型1.5版本

    12月30日,腾讯混元宣布推出并开源翻译模型1.5,共包含两个模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,两个模型均重点支持 33 个
    的头像 发表于 01-06 14:13 529次阅读
    沐曦曦云C500/C550 GPU产品适配<b class='flag-5'>腾讯</b>混元开源翻译<b class='flag-5'>模型</b>1.5版本

    壁仞科技壁砺166M产品适配腾讯混元开源翻译模型1.5版本

    12月30日,腾讯混元正式开源翻译模型1.5版本,该版本共包含两个模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,支持33个语种互译以及5种民汉/方言,除了
    的头像 发表于 01-05 15:39 437次阅读
    壁仞科技壁砺166M产品适配<b class='flag-5'>腾讯</b>混元开源翻译<b class='flag-5'>模型</b>1.5版本

    腾讯地图推出全新时空智能开放平台“盖亚”

    )。 该平台基于腾讯位置服务开放平台与位置大数据平台的底层能力,深度融合腾讯混元大模型与时空动态大模型,面向零售、文旅、出行等多个行业,提供从数据分析、精准洞察、智能决策到落地应用的一
    的头像 发表于 09-18 10:26 2232次阅读

    3万字长文!深度解析大语言模型LLM原理

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持本文转自:腾讯技术工程作者:royceshao大语言模型LLM的精妙之处在于很好地利用数学解决了工业场景的问题,笔者基于过往工程经验
    的头像 发表于 09-02 13:34 3610次阅读
    3万字长文!深度解析大语言<b class='flag-5'>模型</b>LLM原理

    Arm率先适配腾讯混元开源模型,助力端侧AI创新开发

    本周初,腾讯混元宣布开源四款小尺寸模型(参数分别为 0.5B、1.8B、4B、7B),可无缝运行于消费级显卡上。作为全球应用范围最为广泛的计算平台,Arm 在开源首日就已率先实现适配,携手合作伙伴
    的头像 发表于 08-08 09:16 1540次阅读
    Arm率先适配<b class='flag-5'>腾讯</b>混元开源<b class='flag-5'>模型</b>,助力端侧AI创新开发

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得一提的是, 依托
    的头像 发表于 08-07 14:42 1529次阅读
    硬件与应用同频共振,英特尔Day 0适配<b class='flag-5'>腾讯</b>开源混元大<b class='flag-5'>模型</b>

    商汤大装置实现大规模产业化应用

    随着大模型应用步入“实用主义”阶段,企业对AI应用需求愈发多样,既追求效率与成本的优化,又要精准切中场景痛点提供行业级解决方案,并做到“开箱即用”与“深度定制”兼顾。
    的头像 发表于 07-07 15:20 984次阅读

    摩尔线程率先支持腾讯混元-A13B模型

    近日,腾讯正式开源基于专家混合(MoE)架构的大语言模型混元-A13B。同日,摩尔线程团队凭借技术前瞻性,率先完成该模型在全功能GPU的深度适配与高效支持。这一成果充分彰显了MUSA架构在大
    的头像 发表于 07-04 14:10 1003次阅读

    做「长期主义者」的技术人们

    在技术发展的浪潮中,有人辗转风口,有人深耕沉淀。我们邀请到三位京东零售技术专家——他们以年为刻度,诠释了什么是技术的长期主义。 从初入京东时的探索者,到独当一面的领航者,他们在技术攻坚的浪潮中
    的头像 发表于 06-03 17:44 753次阅读
    做「长期<b class='flag-5'>主义</b>者」的技术人们

    如何使用SX3将并行图像传感器切换到USB?

    、0X3C。 通过改变价值观,我始终拥有相同的价值观。 我找到寄存器地址和寄存器值(参见顶部图像和示波器图像中的黄色部分) 所以我不知道需要修改哪些参数才能将数据发送到我的传感器(I2C 地址 0x13、功能 ID 0x03、寄存器地址 0x01 和值 0x01)
    发表于 05-16 06:16