0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

讯飞星辰MaaS平台完成全新升级

讯飞开放平台 来源:讯飞开放平台 2024-11-22 10:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

高质量数据的助攻,让微调大模型青出于蓝而胜于蓝!

海量数据的预训练,让通用大模型拥有十八般武艺,几乎能够轻松应对所有问题。但面向特定行业与场景,模型效果却难以让人满意,问题同样也是数据。

通过将特定数据“投喂”给通用大模型,在保持“通才”优势的基础上,微调大模型轻松兼容行业“专才”的优势,指哪打哪。但训练专属大模型,看似简单,背后需要从数据、算力到微调工具等一系列支撑。 讯飞星辰MaaS平台已汇集讯飞星火、Llama3、SD-XL等20+行业内知名的优质模型,无需复杂调整或重新训练,甚至零代码也可能完成微调。 围绕数据管理、模型微调、评估、托管、推理服务,讯飞星辰MaaS平台提供了完善大模型全生命周期管理,覆盖内容创作、代码、逻辑推理等多场景。近期,模型与数据集丰富度,以及功能特性再次完成全新升级。

微调模型更丰富:支持星火系列大模型及多个优质开源大模型

数据集构建更轻松:基本支持行业主流数据集,可实现数据批量处理

微调体验显著提升:提供灵活可用的全栈工具链,让大模型效果符合预期

01丰富模型,满足多样业务场景

讯飞星辰MaaS平台已汇集星火、Llama3等行业优质模型,让每一个场景需求都能找到合适的模型搭子。本次升级,新加入了Spark Max、Spark Mini、Spark Tiny等星火自研模型,让模型“队伍”再次壮大。

Spark Max适用于对内容质量和知识专业性要求高的业务场景,如高端内容创作、专业知识服务等。Spark Tiny的部署和精调成本在星火系列模型中最具性价比,在对成本较为敏感但又需要一定性能支持的场景表现良好,比如小型创业公司的在线客服系统,能在满足性能需求的同时节省成本。

同时,平台还引入了书生系列、Qwen2.5系列等多个开源模型的精调,给开发者提供更多选择。

模型学习如何在特定任务中做出正确的判断?首发文本分类的bert模型,可以分析文本特征后进行分类,将数据提供给bert模型进行微调后的分类器效果非常精准,而且能够直接在Spark API中进行应用。

02夯实数据工程,提效加速更易用

数据量的大小和质量高低是大模型产业发展的关键,也是决定大模型是「专家」或是「砖家」的一条分界线。大模型微调过程中,数据集就像老师教课时用的书和资料。这些书和资料里有很多例子和题目,可以帮助学生(也就是大模型)更好地学习和理解新知识。

通过选择合适的数据集构建方法,并遵循关键步骤进行操作,可以显著提升微调效果,使模型更好地适应新任务。但开发者在数据构建中很容易遇到不少难题:只有文本数据、无问答对数据,数据量少,没办法判断数据质量、不知道如何优化数据集、积累数据困难。

基于问答抽取、数据增强、prompt工程等维度出发,讯飞星辰MaaS平台构建了全方位的数据工程能力,帮助用户轻松构建高质量数据。以数据增强为例,支持常见文本生成、语义理解、知识问答数据泛化,扩展数据集数量;支持混合训练(平台自动添加数据集)。

大模型微调过程中,因为不同的任务需求、数据来源和处理方式会导致数据集的结构和内容有所不同。不同的微调框架可能支持不同的数据集格式。

现在,讯飞星辰MaaS平台的数据集格式扩充,已支持ShareGPT、Alpaca格式数据集,实现了对几乎所有行业主流数据集格式的支持。无论你的数据集什么样,在讯飞星辰MaaS平台上都能训。

如果你不想或者来不及准备测试集,也不用慌。讯飞星辰MaaS平台支持从训练集中拆分出一定比例,在训练完成后,平台会自动把拆出来的这部分数据拿去做验证,就可以直观的看到微调效果展示。

当我们有大量数据需要处理时,而不是一次只处理一条数据,可以把很多数据一起“放”进模型中,让模型一次处理多条数据。现在,讯飞星辰MaaS平台最多支持10个模型同时在线批量推理,大大提高了数据处理的效率。

03扩展功能边界,辅助创新更专业

选好了合适模型,数据准备好后,进入到具体的微调环节,如何让模型的功能更强大、效果符合预期?讯飞星辰MaaS平台还提供了多种让人惊喜的功能。

•兼容OpenAI协议,「丝滑」搬家国产大模型

今年6月,OpenAI 停止向中国大陆地区提供 API 服务,对于依赖 OpenAI API 构建产品和服务的企业来说,无疑是一次技术上的挑战。然而国内大模型已经大幅缩小了与 OpenAI 的差距,可以满足大部分日常的场景。10月24日发布的讯飞星火4.0 Turbo七项核心能力在中文领域已全面超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o。

方便开发者进行能力迁移,讯飞星辰MaaS平台现已兼容OpenAI协议,用户之前用OpenAI的能力,可以一键切换成星火的能力,实现「丝滑」搬家。

•支持function_call 精调训练,高效调用独立工具

由于大模型的训练数据有时间期限,无法了解最近发生的事情。因此,当用户询问模型一些它不了解的数据信息时,模型本身就无法给出答案。此时,function_call 就像放大器一样,通过调用外部工具,增强大语言模型的能力。

使用function_call,可以让模型能够理解什么时候需要调用函数、调用哪种函数,以及如何正确地传递参数给函数,从而增强模型在实际应用中的实用性,使其能够更好地与外部工具或系统进行交互。

•支持Loss曲线展示和裁判员模型效果评估对比,模型效果随时评估

大模型的调试评估不能等精调完再检查,要在过程中就把握好。

讯飞星火系列模型已支持Loss曲线展示,在微调模态训练过程中即可通过精细化的数据配比和动态调整,在提升目标领域能力的同时,最大限度避免灾难性遗忘,保持模型的全面性能。

如果你选择了多个大模型进行微调训练,不知道最终该用哪一个。讯飞星辰MaaS平台提供了裁判员打分模型,基于星火最优模型提供的评估报告,评判模型效果的好坏。

面向专业开发者的更多需求,讯飞星辰MaaS平台还支持部分高级参数,支持分词长度、Lora Merge,UnSloth等特性配置。

讯飞星辰MaaS平台之外,讯飞星火还构建了丰富且高性价比API矩阵。目前,Spark Pro版本每百万token仅需5元,并支持128K上下文;Ultra和Max 均提供Batch版本 API。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4425

    浏览量

    46585
  • 讯飞开放平台

    关注

    0

    文章

    21

    浏览量

    11817
  • 大模型
    +关注

    关注

    2

    文章

    3864

    浏览量

    5298

原文标题:大模型人人皆可“炼”,讯飞星辰MaaS平台精调门槛再降低

文章出处:【微信号:讯飞开放平台,微信公众号:讯飞开放平台】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    光庭信息官网完成全维度升级

    在“ALL IN AI”与国际化战略加速推进的关键阶段,光庭信息官网完成全维度升级
    的头像 发表于 05-21 15:47 97次阅读

    星辰Coding Plan全面升级

    “养虾”正在成为许多开发者的新日常。但真正上手之后,很多人会遇到两个很现实的问题:一是“虾粮贵”——每一次调用、每一轮对话、每一次调试,都是成本。二是“虾会卡”——请求一多就被限流,智能体直接摆烂。开发者开始“精打细算地用 AI”,而不是“充分释放 AI”。
    的头像 发表于 04-13 15:01 2699次阅读

    华为云MaaS升级登陆香港 支援GLM-5模型

    华为云宣布,旗下MaaS(Model as a Service,模型即服务)在香港完成全新升级,正式支援GLM-5模型,并预告两款智能体产品———华为云码道(CodeArts)代码智能体及AgentArts智能体
    的头像 发表于 04-05 17:40 2221次阅读

    星辰MaaS平台正式上线Coding Plan

    科技圈目前分成2派,正在玩OpenClaw 和准备玩OpenClaw。这个能够自主操作电脑执行任务、24 小时待命的“电子龙虾”,让无数人第一次真正触摸到了 AI Agent 的终极生产力。
    的头像 发表于 03-11 13:49 2634次阅读

    科大星辰智能体平台升级发布

    当大模型的叙事逻辑从“参数竞赛”转向“应用落地”,智能体从只会纸上谈兵的“赛博玩具”,进化为真正下地干活的“生产工具”。感知、声音、图像、动作——这些被视为“辅助功能”的维度,成为智能体深入业务流程、实现规模化落地的“入场券”。
    的头像 发表于 01-27 15:25 754次阅读

    智文产品完成重磅升级

    2026年伊始,当智能体成为人人可用的数字生产力,智文完成重磅升级全新打造的「智能演练」与「AI演示官」,首次实现“写、练、演”一体化
    的头像 发表于 01-08 16:41 1121次阅读

    星辰Agent平台入选36氪WISE 2025年度焦点产品

    近日,凭借在企业应用落地方面的卓越表现,星辰Agent平台成功入选“36氪 WISE2025年度焦点产品”。
    的头像 发表于 12-17 11:47 947次阅读

    新一代AtomGit平台完成全升级并上线运行

    11月21日,在2025开放原子开发者大会开幕式上,开放原子开源基金会携手CSDN等生态伙伴,正式宣布新一代AtomGit平台完成全升级并上线运行。此次升级将AtomGit与GitC
    的头像 发表于 11-25 17:28 1046次阅读

    科大发布星火X1.5及系列AI产品

    11月6日,第八届世界声博会暨2025科大全球1024开发者节发布会上,科大以《更懂你的AI》为主题发布
    的头像 发表于 11-10 11:49 1274次阅读

    星火电脑版全新升级

    聚焦垂直场景,一口气全新升级了“AI写作、解题答疑、AI阅读、深度研究”等实用功能。同时,全新的简洁流畅界面,搭配丝滑顺手操作体验,为你搭配一个“有颜有才”的AI伙伴。
    的头像 发表于 09-10 15:40 1014次阅读
    <b class='flag-5'>讯</b><b class='flag-5'>飞</b>星火电脑版<b class='flag-5'>全新</b><b class='flag-5'>升级</b>

    曙光存储支持西湖大学高性能计算中心部署完成全新存储系统

    近日,曙光存储支持西湖大学高性能计算中心部署完成全新存储系统,为AI研发、科学计算和信息化平台等提供存力支持。性能实测显示,该系统单节点带宽可达150GB/s,是国际友商的近4倍,充分满足AI科研需求,超额完成交付目标。
    的头像 发表于 08-25 11:48 1559次阅读

    星辰MaaS平台率先上线OpenAI最新开源模型

    8月6日凌晨,OpenAI 时隔六年再次回归开源,发布两款全新的大语言模型:gpt-oss-120b和gpt-oss-20b,性能与o4-mini 水平相当,并且可以在消费级硬件上运行。
    的头像 发表于 08-13 16:43 2059次阅读

    星火X1升级版正式上线

    今天,基于全国产算力训练的深度推理大模型——星火X1升级版正式上线。
    的头像 发表于 07-30 14:12 2295次阅读
    <b class='flag-5'>讯</b><b class='flag-5'>飞</b>星火X1<b class='flag-5'>升级</b>版正式上线

    信捷视觉平台全新升级

    当机器视觉的精准遇上AI的智能,会碰撞出怎样的火花?信捷视觉平台全新升级——XINJE VISION STUDIO 3.7 + Vision AI算法平台双剑合璧,覆盖从规则化检测到复
    的头像 发表于 07-28 15:56 1165次阅读
    信捷视觉<b class='flag-5'>平台</b><b class='flag-5'>全新</b><b class='flag-5'>升级</b>

    星辰MaaS平台实现高性能DeepSeek V3上线

    以DeepSeek模型为代表的MoE技术路线,正不断突破通用大模型的效果上限。其创新的PD优化与大EP推理方案,推动大模型迈向“高性能、低成本、强普惠”的新阶段。
    的头像 发表于 06-04 10:15 1594次阅读