0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从容大模型亮相!云从科技:公司具有系列模型,并具有对模型的剪枝能力

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-05-30 09:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)日前,云从科技在广州南沙发布了其自主研发的AI大模型从容。在发布会现场,云从科技董事长兼总经理周曦及技术人员展示了从容大模型的基础功能,包括模型在趣味问答、中英翻译、编程与阅读理解等方面的应用。

值得一提的是,从容大模型除了能够准确地回答问题,还能够在回答内容下做出参考资料来源的标注,从而解决了目前公众对于生成式人工智能参考内容不明的疑问。

具备大模型理论与实践融合经验

云从科技自成立以来,始终专注于提供高效人机协同操作系统和行业解决方案,致力于助推人工智能产业化进程和各行业智慧化转型升级。

人机协同操作系统从行业属性上属于人工智能平台领域。目前人工智能平台领域形成了丰富的产品形态,如人工智能芯片平台、深度学习框架、AIoT 操作系统、 算法算力平台、知识中台、自动驾驶平台、机器人开发平台等。人工智能企业根据自身技术积累和发展战略选择的人工智能平台发展路径存在差异。

根据人工智能平台领域产品类别和技术特点,云从科技人机协同操作系统属于算力算法平台和知识中台相结合的产品,支持主流的多个深度学习框架。感知智能、认知智能和决策智能相结合,帮助用户系统性的解决更复杂的业务问题,是人工智能行业发展最重要的趋势之一。

自从ChatGPT出圈以来,全球科技公司纷纷加入大模型的研究大军,其中百度、阿里、科大讯飞、商汤科技、第四范式等公司的大模型已经问世。作为人工智能领域的明星企业,云从科技自然也要加速,今年3月,云从科技开始向科创板申请定增计划并获得受理,此次将定向融资36亿元,旨为用于云从“行业精灵”大模型研发项目。

云从科技称,投入大模型的研发对公司来说有利,一是符合国家有关产业政策以及未来公司整体战略发展方向;二是云从科技具备大模型理论与实践融合的经验。

云从科技从2019年开始就在自然语言处理、OCR、视觉语义理解、语音识别等多个领域实践“预训练大模型+下游任务迁移”的技术范式,产出多个百亿参数以内规模的模型。

如金融行业的票据证照识别和服务合规性督查、智慧城市的道路状态监控、机场的航班节点保障等场景中,充分发挥预训练模型的小样本学习能力,凭借少量训练样本可以在以小时计的时间周期内完成具体场景的任务迁移。

具有系列模型,具有对模型的剪枝能力

经过多年积累,云从科技此次创新推出从容大模型。通过实时学习并同步反馈结果,从容大模型可以解决AI应用的痛点,从而有利于快速普及个性化应用。

有了基础大模型,还需要在各领域的行业落地方面努力。云从科技也在全力投入行业大模型的研发,并把其引入到人机协同操作系统之上,希望在to B、to G等方向上发力。

比如针对主播群体,基于大模型云从推出了一个“大麦数字人直播平台”,除了提供背景风格、主播库、音色库及整体视觉风格的选择,大模型还能帮助主播撰写直播文稿,设置互动问答库以应对直播过程中的粉丝提问等,便于主播随时挑选直播话术等。

在金融领域,云从科技基于从容大模型、金融行业模型、智能业务流等核心技术研发的虚拟客户经理,具备智能问答、自动语义、意图判断、多意图理解、动态追问等AI交互能力,可赋能金融机构实现从客户引流、咨询、营销、运营等全流程智能化客户服务能力,创新金融机构服务触达通道,以AI驱动金融机构客户服务智能化转型升级。

在游戏行业,云从科技将联手游族网络共同致力于针对游戏行业的人工智能大模型技术研究及应用实践,以赋能产业发展,全面提升游戏开发和发行等环节的业务效率。游族网络与云从将共同研究游戏垂直领域的LLM大模型。

相比于其他企业的大模型,比如百度的“文心一言”、阿里的“通义千问”、科大讯飞的“星火认知大模型”等,云从科技的从容大模型有何区别?

对此,云从科技表示,首先公司拥有自主的预训练大模型和在预训练层调优模型的能力,这与仅用开源的大模型具有显著地差别;其次,公司提供模型级别的AI赋能服务和过去提供API形式的赋能服务不同,与客户合作更加深度,粘性更强;第三,公司具有系列模型,并具有对模型的剪枝能力,公司可以根据行业场景需求去帮助客户部署模型,实现性价比最优。

小结

如今,已经有多家企业宣布推出大模型,包括百度、阿里、科大讯飞、商汤科技、第四范式等,作为人工智能领域的明星企业,云从科技自然也不会例外,虽然从容大模型在发布时间上稍有落后,不过其深厚技术和经验积累,让它也具备了其他企业所不具有的独特优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云从科技
    +关注

    关注

    1

    文章

    73

    浏览量

    10390
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是AI模型的推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
    的头像 发表于 09-23 15:19 901次阅读

    亚马逊科技现已上线OpenAI开放权重模型

    开放权重模型,向数百万亚马逊科技客户开放。 客户可利用这些全新开放权重模型的先进推理能力,支持Agentic工作流、代码生成、科学分析和数学问题求解等应用。 开放权重
    的头像 发表于 08-06 19:29 693次阅读

    模型推理显存和计算量估计方法研究

    (如全连接层、卷积层等)确定所需的显存大小; (3)将各层显存大小相加,得到模型总的显存需求。 基于神经网络剪枝的显存估计 神经网络剪枝是一种减少模型参数数量的技术,可以降低显存需求。
    发表于 07-03 19:43

    FA模型切换到Stage模型时:module的切换说明

    module的切换 FA模型切换到Stage模型时,开发者需要将config.json文件module标签下的配置迁移到module.json5配置文件module标签下,具体差异
    发表于 06-05 08:16

    KaihongOS操作系统FA模型与Stage模型介绍

    (Feature Ability) FA模型是KaihongOS API 7开始支持的模型,已经不再被主推。在FA模型中,每个应用组件独享一个ArkTS引擎实例,这意味着每个应用组
    发表于 04-24 07:27

    【第二章 模型与设备连接】手把手教你玩转新版正点原子

    到原子平台 11. 因为在前面设置模型时这两个变量都可以进行读写,所以在原子上面也可以下发数据到Modbus Slave软件,也可以modbus slave软件上传数据到原
    发表于 03-12 09:27

    科技从容模型训推一体机成功适配DeepSeek

    近日,国内领先的人工智能企业科技宣布,其从容模型训推一体机已成功适配国产开源大模型DeepSeek。这一成果标志着最新国产大
    的头像 发表于 02-14 15:44 1383次阅读

    腾讯TI平台推出DeepSeek系列模型

    近日,腾讯TI平台宣布重要更新,正式上架DeepSeek系列模型。此次上架的模型包括参数量高达671B的“满血”V3和R1原版模型,以及基
    的头像 发表于 02-06 14:30 886次阅读

    京东正式上线DeepSeek系列模型

    实际需求,在京东官网上轻松实现一键部署。通过进入言犀AI开发计算平台的“AI资产市场”,开发者和企业可以便捷地选用DeepSeek系列模型,进行快速调用和应用。 为了满足不同场景下的数据安全需求,京东
    的头像 发表于 02-06 14:25 819次阅读

    【「基于大模型的RAG应用开发与优化」阅读体验】+大模型微调技术解读

    重复项或使用编辑距离算法比较文本相似度。数据标注:高质量的数据标注直接影响模型的性能。标注过程应遵循明确标注规则、选择合适的标注工具、进行多轮审核和质量控制等原则。数据增强:提高模型泛化能力的有效方法
    发表于 01-14 16:51

    科技报到:模型到云端,“AI+计算”还能讲出什么新故事

    科技报到:模型到云端,“AI+计算”还能讲出什么新故事
    的头像 发表于 01-07 13:27 623次阅读

    【「大模型启示录」阅读体验】营销领域大模型的应用

    效地制定针对不同客户群体的营销策略,提高营销活动的针对性和有效性。 大模型在内容生成方面也具有显著优势。它可以快速、高效地生成高质量的营销文案、广告语、海报、视频等营销素材。这种能力不仅提高了营销内容的制作效率,还增加了内容的创
    发表于 12-24 12:48

    【「大模型启示录」阅读体验】对大模型更深入的认知

    ,大模型的世界远比我想象的要复杂和深刻。 书中不仅详细介绍了大模型的构建过程,还探讨了它们的核心能力和所需的基础设施。我特别喜欢的是,书中用通俗易懂的语言,把大模型的“不可能三角”,即
    发表于 12-20 15:46

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    并非易事,它涉及到选择合适的算法架构到针对特定硬件平台进行优化等一系列复杂的工作。 接下来,我们将详细介绍如何在资源受限的边缘设备上成功部署目标检测模型,探索其背后的原理和技术,
    发表于 12-19 14:33

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    训练模型如BERT、GPT等。这些模型在理解自然语言、生成文本、处理对话等方面具有不同的能力。因此,在选择模型时,需要了解每个
    发表于 12-17 16:53