0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

中软国际 来源:未知 2023-09-08 17:15 次阅读


近日,星策开源社区 LLMOps meetup V3直播活动顺利举行,由星策开源和CSDN等多个平台同时播出,共吸引来14000+观众观看。中软国际AIGC研究院执行院长、解放号副总裁韩鹏受邀参加并分享当前业界最为关注的大模型在企业场景中实际落地的案例和实践,还演示了基于JointPilot平台构建AIGC企业应用的典型模式、方法、工具和关键技术,小编整理了一下,为广大开发者带来超实用的AIGC应用落地干货。

















01
企业级AIGC应用导入LLM的典型落地模式和技术路线
大模型落地的技术路线有六种,企业要综合考虑门槛高低、训练周期长短、算力数据成本要求等问题。经过多方研究和验证测试后,中软国际AIGC研究院最终选择了“意图模型+DKG+Plugin”作为企业级AIGC应用导入LLM的典型落地模式和技术路线。这种模式有了能够本地部署的意图理解模型做为应用调度的中枢,通过DKG做模型的前后约束,并集成Plugin的能力,更适合于面向对数据安全、业务逻辑规则要求比较严格的政企行业应用场景。


















02
一起来看看大模型赋能应用的运转机制是怎样的?

韩鹏以销售助手为例介绍了大模型赋能应用的运转机制。在传统工作场景下,销售在拜访客户前需要进行客户背调、项目收集及谈资等准备工作,在拜访客户后还需要详细整理内容形成拜访记录和工作总结,工作繁杂且耗时耗力。

销售助手AI应用通过大语言模型赋能之后,生成一套运转的流程和机制,用大语言模型去完成意图理解,理解了用户的意图之后对用户指令进行任务拆分,分别调用不同的微应用去执行任务。最后输出时,销售助手也做了安全性的矫正,保障输出的结果是准确合规的。

在思维链加持下大模型可以进行意图识别和任务拆解,通过长思维链的技术方式增强大模型的规划和推理能力,根据任务调微应用执行,同时使用内部沉淀及外部抓取的数据,集成各类通用及定制的能力,共同构建了以问答为基本交互形式的销售助手。销售助手帮助销售人员完成了客户拜访前的谈资和话术准备,让工作更高效精准。
















03
怎么利用JointPilot Studio编排一个AI应用呢?
JointPilot平台在应用开发方面提供一款新型增强的开发工具Studio和一种全新的应用组装方法。一个普通的业务人员可以使用开发者工具进行微应用编排。

平台支持多种非结构化数据接入,支持各类文档导入,比如上传文档,通过向量数据库和大模型进行知识重构,构建采购政策、项目方案知识库;还可以调用模型的能力自动生成问答对在平台上预置,便于开发者快速调取;也支持行业专用词典的知识接入,帮助大模型理解专用术语。

当然,在实际场景还会有一些结构化的数据需要接入到知识库,比如CRM系统的客户拜访记录数据,本地数据集、数据表的导入,各种Excel文件导入等等,这些结构化数据让大模型能够更懂企业场景私有的领域知识。大家可以使用JointPilot平台自动化的工具,快速实现百万级条目数据导入,大大减轻了手工导入数据和知识费时费力的烦恼。

在微应用编排过程中,大模型需要访问各类数据库,包括关系数据库查询、数据集查询、文档知识库查询等,比如查询客户历史拜访记录,平台提供NL2SQL生成器等工具,方便用户通过Prompt工程让大模型生成SQL查询语句。



同时还要让大模型会用工具,通过自动化配置请求链接、接口参数等轻松实现API的调用,从而大幅降低用户应用生成的门槛。

在对话场景中,我们需要通过角色设定来让大模型能够更好的理解特定身份的任务,比如销售助手中大模型在拜访前辅助销售人员进行准备工作梳理并提供鼓励,可以通过配置好的Prompt模板,来实现角色扮演的任务。

那么,大模型是怎样像人一样会用大脑去思考用户提出的问题,怎样自动分发应用,自动化编排、自动化组装?这就需要训练出一个意图识别大模型作为应用调度的中枢,通过大模型来识别提取需求要素,作为数据服务参数,传递给要调取的应用。

















04
揭秘怎样“炼制”更符合企业场景需要的模型
想要“炼制”更符合企业场景需要的模型,首先要选择一个基座模型,要准备数据集,还要有一套合适的训练方案。目前用的比较多的是SFT监督微调、LoRA 微调、P-tuning v2 微调方法。最后要对模型优化效果进行评估。整个训练过程会使用工具把很多脚本执行的碎片化过程,通过可视化界面实现全过程管理。数据集的选取、封装,以及具体参数的调整,都通过工具来完成。


解放号总结出了一套训练大模型的心得,分享给各位开发者:

1、鉴于每个模型的表现不太一样,选择一个合适的基座模型最重要。训练command模型最终选用百川大模型,它的优势是基于LLAMA做中文训练,在中文的表现很好。大模型尺寸选择会影响模型推理能力。


2、数据集质量特别关键。尤其是在企业场景里,需要跟大量业务部门和业务人员一起做监督学习和数据标注,也可借用大模型来扩展增强数据集,使用instruction、input、output方式来整理。如果模型泛化能力弱,就需要增强训练数据多样性。


3、精调的方案选择和场景相关度非常高。建议通过做多种方案对比测试看实际效果。可以用5%-20%的数据集作为测试数据来测试精调的任务,建议测试数据和训练数据要分开用,通过测试后再去跑全量的数据。当训练结果大量返回重复字符时,就需要调整数据集和训练参数,再重新做训练。


4、尽可能训练小尺寸模型,这对部署成本控制非常关键。一般情况4-8个节点才能满足真正生产环境中使用的要求,所以在部署前尽可能做量化压缩优化,确保不损失太多性能的技术上降低资源的需求。


这一期干货分享就到这了,相信小伙伴们还会有很多的问题想要交流,敬请继续关注我们。中软国际解放号将在JointPilot平台的加持下,携手广大开发者,加速应用创新,共赢企业级AIGC应用未来!



原文标题:开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

文章出处:【微信公众号:中软国际】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 中软国际
    +关注

    关注

    0

    文章

    389

    浏览量

    7035

原文标题:开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

文章出处:【微信号:CSI00354,微信公众号:中软国际】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    #新开端、新起点,2024一起加油#

    ;2024一起加油\"则表达了大家共同努力,相互支持的决心和信念。 在2024年,无论你的目标是什么,都希望你能保持这种积极的心态,勇敢地面对挑战,不断地学习和进步。同时,也希望大家能够相互鼓励,共同前进,一起创造更美好的未来。
    发表于 02-26 21:01

    江波龙企业级存储正式量产一周年,交出亮眼“成绩单”

    自2023年1月江波龙首次发布企业级存储产品FORESEEORCA4836系列NVMeSSD与FORESEEUNCIA3836系列SATA3.2SSD以来,企业级存储产品于过去的一年中,在技术研发
    的头像 发表于 02-19 12:56 220次阅读
    江波龙<b class='flag-5'>企业级</b>存储正式量产一周年,交出亮眼“成绩单”

    怎么计算前端运的噪声参数对AD7656的影响呢?

    设计了一级比例放大和一级低通滤波,这两电路的噪声是线性叠加到一起的吗? 2、怎么计算前端运的噪声参数对AD7656的影响呢?也就是说前
    发表于 12-20 07:30

    AD8609手册里的Voltage Noise Density数值是指个运还是四个运加在一起这么多?

    AD8609四运,其手册里的Voltage Noise Density的数值是指个运还是四个运加在一起这么多?
    发表于 11-16 06:34

    企业级生成式AI应用,如何克服“幻觉”问题

    然而,企业级 AI 应用与个人 AI 应用需求之间存在巨大差异,对技术本身的要求也不在一个量级。仅拿当下生成式 AI 应用最让人诟病的“AI 幻觉”问题来说,放在企业级生产环境,对此几乎是“零容忍”。
    的头像 发表于 09-21 16:00 450次阅读

    登临科技荣获“2023最值得关注AIGC企业

    近日,由创业邦主办的2023AIGC技术应用大会在深圳举行。本届大会以“元载万物·智启新界”为主题,旨在聚焦AIGC技术的创新应用,打造深入探索AIGC产业落地的交流平台。
    的头像 发表于 09-15 09:54 792次阅读

    一起来学习高速信号

    DIY电子技术
    学习电子知识
    发布于 :2023年09月05日 22:35:48

    一起来欣赏下

    DIY电子技术
    学习电子知识
    发布于 :2023年09月05日 22:35:31

    采集摄像头录制视频,如何保把时间和视频数据一起保存起来

    我想实现采集摄像头数据,在屏幕上显示视频同时存储在sd卡上。此功能已经完成,但是播该视频时想要在画面上显示每帧的时间,应该如何保把时间和视频数据一起保存起来,这样播放视频时就带有时间了。百度上没有找到答案,哪位高手可以指点
    发表于 09-04 07:42

    昆仑芯科技获评2023值得关注的AIGC公司

    近日,由创业邦主办的2023AIGC技术应用大会在深圳成功举办。大会期间,「2023值得关注的AIGC公司」榜单正式发布。源于对AIGC市场算力需求的深刻洞察,凭借在AI芯片领域的领先技术和丰富
    的头像 发表于 08-31 19:00 854次阅读
    昆仑芯科技获评2023值得关注的<b class='flag-5'>AIGC</b>公司

    aigc是什么概念?aigc的应用场景

    的一个新的概念和工具,旨在加速机器学习和深度学习的发展,提高人工智能在各个领域的应用效率和质量。AIGC可以帮助开发人员在从数据到模型的整个过程中,更快、更准确地进行模型选择、测试和优化,将人工智能计算效率提高到前所未有的高度,
    的头像 发表于 08-21 17:16 3613次阅读

    aigc是什么?aigc和chatGPT的区别

    的研究机构、大学、企业和领军企业组成,致力于在不同领域应用人工智能技术,促进世界各地的创新和发展。 AIGC的目标是成为全球领先的人工智能实验室和技术中心,建立一个智能服务的创新生态体系,致力于在医疗、教育、城市规划、交通、能源
    的头像 发表于 08-21 17:16 2985次阅读

    中软国际AIGC业务亮相2023中国算力大会

    服务蓝图,展示中软国际与客户、ISV伙伴联创,围绕业务场景推动AIGC应用落地的实践成果。 中软国际是中国软件和信息服务综合竞争力百强企业,2022年位列Gartner IT服务市场份额全球排行第73位,公司重点打造1+3(云智
    的头像 发表于 08-19 19:15 395次阅读

    PBlaze7 7940系列PCIe 5.0企业级NVMe SSD

    。 PBlaze7 7940系列PCIe 5.0企业级NVMe SSD “AIGC的出现引发了新一轮的算力竞赛,对存储设备也提出了更高要求。PCIe 5.0相
    的头像 发表于 08-09 11:06 733次阅读
    PBlaze7 7940系列PCIe 5.0<b class='flag-5'>企业级</b>NVMe SSD

    燧原科技开启AIGC应用规模化落地时代

    的第一款新产品。   燧原曜图 面向AIGC,规模化落地时代 以燧原科技邃思系列芯片为算力支撑,由首都在线提供计算服务,燧原曜图MaaS(Model-as-a-Service)平台服务产品为用户提供面向AIGC时代的高效易用、安
    的头像 发表于 07-05 10:09 530次阅读