0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

中软国际 来源:未知 2023-09-08 17:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


近日,星策开源社区 LLMOps meetup V3直播活动顺利举行,由星策开源和CSDN等多个平台同时播出,共吸引来14000+观众观看。中软国际AIGC研究院执行院长、解放号副总裁韩鹏受邀参加并分享当前业界最为关注的大模型在企业场景中实际落地的案例和实践,还演示了基于JointPilot平台构建AIGC企业应用的典型模式、方法、工具和关键技术,小编整理了一下,为广大开发者带来超实用的AIGC应用落地干货。

















01
企业级AIGC应用导入LLM的典型落地模式和技术路线
大模型落地的技术路线有六种,企业要综合考虑门槛高低、训练周期长短、算力数据成本要求等问题。经过多方研究和验证测试后,中软国际AIGC研究院最终选择了“意图模型+DKG+Plugin”作为企业级AIGC应用导入LLM的典型落地模式和技术路线。这种模式有了能够本地部署的意图理解模型做为应用调度的中枢,通过DKG做模型的前后约束,并集成Plugin的能力,更适合于面向对数据安全、业务逻辑规则要求比较严格的政企行业应用场景。


















02
一起来看看大模型赋能应用的运转机制是怎样的?

韩鹏以销售助手为例介绍了大模型赋能应用的运转机制。在传统工作场景下,销售在拜访客户前需要进行客户背调、项目收集及谈资等准备工作,在拜访客户后还需要详细整理内容形成拜访记录和工作总结,工作繁杂且耗时耗力。

销售助手AI应用通过大语言模型赋能之后,生成一套运转的流程和机制,用大语言模型去完成意图理解,理解了用户的意图之后对用户指令进行任务拆分,分别调用不同的微应用去执行任务。最后输出时,销售助手也做了安全性的矫正,保障输出的结果是准确合规的。

在思维链加持下大模型可以进行意图识别和任务拆解,通过长思维链的技术方式增强大模型的规划和推理能力,根据任务调微应用执行,同时使用内部沉淀及外部抓取的数据,集成各类通用及定制的能力,共同构建了以问答为基本交互形式的销售助手。销售助手帮助销售人员完成了客户拜访前的谈资和话术准备,让工作更高效精准。
















03
怎么利用JointPilot Studio编排一个AI应用呢?
JointPilot平台在应用开发方面提供一款新型增强的开发工具Studio和一种全新的应用组装方法。一个普通的业务人员可以使用开发者工具进行微应用编排。

平台支持多种非结构化数据接入,支持各类文档导入,比如上传文档,通过向量数据库和大模型进行知识重构,构建采购政策、项目方案知识库;还可以调用模型的能力自动生成问答对在平台上预置,便于开发者快速调取;也支持行业专用词典的知识接入,帮助大模型理解专用术语。

当然,在实际场景还会有一些结构化的数据需要接入到知识库,比如CRM系统的客户拜访记录数据,本地数据集、数据表的导入,各种Excel文件导入等等,这些结构化数据让大模型能够更懂企业场景私有的领域知识。大家可以使用JointPilot平台自动化的工具,快速实现百万级条目数据导入,大大减轻了手工导入数据和知识费时费力的烦恼。

在微应用编排过程中,大模型需要访问各类数据库,包括关系数据库查询、数据集查询、文档知识库查询等,比如查询客户历史拜访记录,平台提供NL2SQL生成器等工具,方便用户通过Prompt工程让大模型生成SQL查询语句。



同时还要让大模型会用工具,通过自动化配置请求链接、接口参数等轻松实现API的调用,从而大幅降低用户应用生成的门槛。

在对话场景中,我们需要通过角色设定来让大模型能够更好的理解特定身份的任务,比如销售助手中大模型在拜访前辅助销售人员进行准备工作梳理并提供鼓励,可以通过配置好的Prompt模板,来实现角色扮演的任务。

那么,大模型是怎样像人一样会用大脑去思考用户提出的问题,怎样自动分发应用,自动化编排、自动化组装?这就需要训练出一个意图识别大模型作为应用调度的中枢,通过大模型来识别提取需求要素,作为数据服务参数,传递给要调取的应用。

















04
揭秘怎样“炼制”更符合企业场景需要的模型
想要“炼制”更符合企业场景需要的模型,首先要选择一个基座模型,要准备数据集,还要有一套合适的训练方案。目前用的比较多的是SFT监督微调、LoRA 微调、P-tuning v2 微调方法。最后要对模型优化效果进行评估。整个训练过程会使用工具把很多脚本执行的碎片化过程,通过可视化界面实现全过程管理。数据集的选取、封装,以及具体参数的调整,都通过工具来完成。


解放号总结出了一套训练大模型的心得,分享给各位开发者:

1、鉴于每个模型的表现不太一样,选择一个合适的基座模型最重要。训练command模型最终选用百川大模型,它的优势是基于LLAMA做中文训练,在中文的表现很好。大模型尺寸选择会影响模型推理能力。


2、数据集质量特别关键。尤其是在企业场景里,需要跟大量业务部门和业务人员一起做监督学习和数据标注,也可借用大模型来扩展增强数据集,使用instruction、input、output方式来整理。如果模型泛化能力弱,就需要增强训练数据多样性。


3、精调的方案选择和场景相关度非常高。建议通过做多种方案对比测试看实际效果。可以用5%-20%的数据集作为测试数据来测试精调的任务,建议测试数据和训练数据要分开用,通过测试后再去跑全量的数据。当训练结果大量返回重复字符时,就需要调整数据集和训练参数,再重新做训练。


4、尽可能训练小尺寸模型,这对部署成本控制非常关键。一般情况4-8个节点才能满足真正生产环境中使用的要求,所以在部署前尽可能做量化压缩优化,确保不损失太多性能的技术上降低资源的需求。


这一期干货分享就到这了,相信小伙伴们还会有很多的问题想要交流,敬请继续关注我们。中软国际解放号将在JointPilot平台的加持下,携手广大开发者,加速应用创新,共赢企业级AIGC应用未来!



原文标题:开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

文章出处:【微信公众号:中软国际】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 中软国际
    +关注

    关注

    0

    文章

    744

    浏览量

    8207

原文标题:开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

文章出处:【微信号:CSI00354,微信公众号:中软国际】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国内企业级SSD厂商加速崛起

      电子发烧友网报道(文/黄晶晶)国际数据公司(IDC)发布最新报告显示,中国企业级固态硬盘市场在2024年得到修复,市场规模达到62.5亿美元,与2023年相比增长187.9%。IDC预计
    的头像 发表于 06-09 07:54 1.3w次阅读
    国内<b class='flag-5'>企业级</b>SSD厂商加速崛起

    汽车ASPICE落地企业高频常见问题深度汇总(下)

    研发流程、开发了新的产品项目,或者整车厂有新的要求,需要重新进行评估;此外,企业需要持续维护体系的落地,确保过程持续符合标准要求。 3.ASPICE和ISO 26262有什么区别?需要一起做吗? 核心区
    发表于 04-15 10:14

    中兴通讯推出企业级桌面智能体Co-Claw

    今日,中兴通讯宣布已正式上线企业级桌面智能体——Co-Claw 企业版。
    的头像 发表于 02-03 09:57 513次阅读

    东芝企业级硬盘创新技术炼就存储基石

    企业数据中心的海量需求遇上日益精进的存储技术,块硬盘的价值早已超越简单的容量数字范畴。今天,与芝迷妹一起聊聊东芝在企业级硬盘采用的关键技术,感受其背后务实而创新的 “技术哲学”。
    的头像 发表于 12-19 14:59 844次阅读

    企业级Agent系统研发公司九科信息用bit-Agent赋能业务升级

    ,九科信息作为专注于企业级Agent系统研发的公司,精准把握行业趋势,打造出bit-Agent产品,从底层技术引擎到上层应用落地,全方位满足企业多元化的智能化需求。
    的头像 发表于 12-13 14:04 784次阅读
    <b class='flag-5'>企业级</b>Agent系统研发公司九科信息用bit-Agent赋能业务升级

    德明利企业级SSD与OpenCloudOS、腾讯云完成技术兼容互认证

    德明利TS3160系列企业级SATA SSD产品与OpenCloudOS、腾讯云相互兼容认证
    的头像 发表于 10-17 15:48 812次阅读
    德明利<b class='flag-5'>企业级</b>SSD与OpenCloudOS、腾讯云完成技术兼容互认证

    2025 IBM中国企业级AI巅峰论坛即将开幕

    随着中国企业加速数智化转型,IBM 始终致力于帮助中国客户、合作伙伴看清方向、打好基础,加速企业级AI应用的落地和投资回报。面向新的 AI 时代,IBM 持续升级其服务于企业高管、技术
    的头像 发表于 08-26 15:30 1289次阅读

    Cognizant加速AI模型企业级开发

    -Cognizant推出AI Training Data Services,助力企业级AI模型加速开发 Cognizant是数据与AI模型训练合作伙伴,长期深受大型数字原生先锋企业信赖,助力其训练
    的头像 发表于 07-31 17:25 806次阅读

    100%开源!行业首个企业级智能体

    近日,京东云正式开源JoyAgent智能体。作为行业首个100%开源的企业级智能体,实现了产品级开源,包括前端、后端、框架、引擎和核心子智能体。开源产品历经京东内部大规模场景锤炼,与平台完全
    的头像 发表于 07-26 09:26 1294次阅读

    企业级Linux磁盘维护的完整流程

    企业级Linux环境中,磁盘故障是导致系统宕机和数据丢失的主要原因之。据统计,超过70%的企业级服务器故障与存储系统相关。作为运维工程师,掌握完整的磁盘维护流程不仅能预防故障,更能在关键时刻拯救整个业务系统。
    的头像 发表于 07-23 16:59 1056次阅读

    企业级智能体是什么?有什么作用?

    在人工智能技术飞速发展的今天,企业级智能体正成为推动组织数字化转型的重要力量。这种新型的企业智能化解决方案,正在重塑企业的运营模式和管理方式,为商业发展注入全新动能。
    的头像 发表于 07-21 15:44 1078次阅读
    <b class='flag-5'>企业级</b>智能体是什么?有什么作用?

    企业级SSD的核心技术与市场趋势

    电子发烧友网综合报道,企业级SSD由固态电子存储芯片阵列制成,核心部件包括主控芯片、固件和存储介质(NAND Flash、DRAM),其中主控芯片和固件直接决定企业级SSD的性能和可靠性等产品表现
    的头像 发表于 07-06 05:34 7499次阅读
    <b class='flag-5'>企业级</b>SSD的核心技术与市场趋势

    ​紫光闪芯新企业级SATA SSD E1200产品系列发布

    2025 年 6 月 25 日,紫光闪芯正式发布新代面向企业级市场的SATA SSD E1200产品系列,凭借性能显著跃升与企业级高可靠性设计,为数据中心、云计算、边缘计算等场景的高性能存储需求
    的头像 发表于 06-26 16:57 1076次阅读

    忆联持续领跑中国企业级固态硬盘市场

    全球权威调研机构IDC最新《2024中国企业级固态硬盘市场跟踪报告》显示,忆联以11.4%的市场份额(覆盖PCIe/SATA/SAS接口类型)问鼎中国企业级固态硬盘市场国产厂商冠军。
    的头像 发表于 06-04 11:21 2311次阅读

    SKW3050:国产化安全可控的企业级无线组网解决方案

    SKW3050:国产化安全可控的企业级无线组网解决方案
    的头像 发表于 05-08 16:13 1044次阅读
    SKW3050:国产化安全可控的<b class='flag-5'>企业级</b>无线组网解决方案