0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“千帆杯”第二期十万大奖花落谁家?TOP10名单出炉!

百度 来源:百度 2024-03-08 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

千帆杯AI原生应用开发挑战赛第二期赛题“贺岁灵感模型”已于2月28日圆满结束。经过严格的自动评估和人工复审后,现已决出TOP10选手!

第二期赛题,结合新春佳节的背景以“贺岁灵感模型”为主题,鼓励开发者使用千帆ModelBuilder,基于ERNIE Speed模型打造一个春节文案创作的精调模型,在通过对模型精调使其保持原有能力的同时,还能准确理解和执行文案创作,帮助用户成为春节档“最强贺岁文案专家”。

本期赛题主要通过千帆ModelBuilder工具链中“模型评估”的部分能力以及人工评估做整体评审,全方位保证评审结果的公平、公正、公开。

第一轮:自动评估(满分1分)

以“内容分”和“字数控制分”为主要考核指标,两项标准分别占据0.6、0.4的权重,通过加权平均后,得出“选手模型”的作品分数。

内容分(占据0.6权重):官方输入包含内容及字数要求的评测数据集,以ERNIE Bot 4.0作为裁判,如果“选手模型”答案比数据集答案更好则得分,反之则不得分。如果ERNIE Bot 4.0没有明确返回评测数据集答案更好,均算作“选手模型”得分。

字数控制分(占据0.4权重):基于官方评测数据集的字数要求,根据“选手模型”的全量回答综合得出最终字数控制评分。

具体规则:根据“选手模型”答案字数与评测数据集中字数要求的diff进行分段打分,具体分段分数如下:

diff ≤ 0.05,得1分

0.05 < diff ≤ 0.1,得0.9分

0.1 < diff ≤ 0.15,得0.8分

0.15 < diff ≤ 0.2,等0.7分

0.2 < diff ≤ 0.25,得0.6分

其余则不得分

举例:如评测数据要求为300字,选手模型返回290字,则diff为:(300-290)/300=0.033,最终得分因0.033 ≤ 0.05,因此在该评测数据下字数控制得1分。

第二轮:人工评估(满分1分)

为了保证自动评估的结果,官方针对自动评估得出的TOP 12“选手模型”安排了第二轮人工评估。(由于选手比分较为接近,因此官方对TOP 12“选手模型”进行人工评估)

人工评估由三位百度专家通过人工查验的方式进行,专家通过对参赛选手所提供的模型微调方案进行投票(一位专家最多可投3票),如选手获得三票,即获得满分。

“千帆杯”第二期

「最强挑战者」出炉

第二期最强挑战者张辉,带来作品“贺岁灵感模型”,张辉使用ModelBuilder的模型SFT精调工具链,基于ERNIE Speed基座模型,精调训练出了一个能准确控制创作字数的春节贺岁文案模型。

ERNIE Speed模型作为百度在2024年最新发布的自研高性能大语言模型,凭借其轻量级、高效的自然语言处理等特点,可以快速地响应用户需求。同时,其在微调场景下优势显著,模型的训练时间更短,成本更低,特定场景下的效果可媲美ERNIE Bot 4.0。

自2月发布上线以来,目前已有超过150家企业采用了ERNIE Speed模型,它除了能做到快速响应外,作为基础通用大模型,在阅读理解、close-book问答、创作与续写等复杂任务上,也能达到甚至超越千亿大模型的效果。每一位开发者,都可以在ERNIE Speed的助力下,快速实现企业级的专属模型训练,探索AI大模型的无限可能。

wKgZomXqdnSACVt3AAUH5O6B5kw425.jpg

更多AI的想象

值得期待

3月21日,百度智能云将在北京举行AI Cloud Day:百度智能云千帆产品发布会。作为2024年AI领域最值得期待的系列产品发布会,诚挚邀请所有技术爱好者共襄盛举。届时,百度智能云千帆ModelBuilder和AppBuilder也将公布最新产品进展,发布系列新模型以及应用开发工具组件等,分享如何助力企业、用户释放模型创新潜能,简单高效打造AI原生应用,推动中国AI原生应用的发展,共同迈入崭新的AI生产力的最新纪元。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度智能云
    +关注

    关注

    0

    文章

    49

    浏览量

    2275
  • AI大模型
    +关注

    关注

    0

    文章

    424

    浏览量

    1066

原文标题:“千帆杯”第二期十万大奖花落谁家?TOP10名单出炉!

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    贞光科技:交24周+!三星电容TOP10紧缺型号曝光,你的BOM还好吗?

    20-24周,部分车规品现货几乎为0。这份5月紧缺清单,建议采购和研发同事收藏对照。一、TOP10紧缺型号:这些料号正在”断档”综合2026年5月市场动态,以下10个型号
    的头像 发表于 05-27 16:45 612次阅读
    贞光科技:交<b class='flag-5'>期</b>24周+!三星电容<b class='flag-5'>TOP10</b>紧缺型号曝光,你的BOM还好吗?

    敏芯股份荣登2026中国IC设计Fabless100排行榜TOP10传感器公司

    3月31日,著名电子行业媒体集团ASPENCORE发布了最新《China Fabless 100》榜单。榜单以中国上市IC设计公司为评选对象,并分列出10大细分技术领域TOP10企业名单。敏芯股份
    的头像 发表于 04-02 14:59 647次阅读
    敏芯股份荣登2026中国IC设计Fabless100排行榜<b class='flag-5'>TOP10</b>传感器公司

    润石科技荣登2026中国IC设计Fabless100排行榜TOP10模拟芯片公司

    、射频与通信网络、传感器、模拟信号链十大技术类别以及Top10上市公司、Top10 EDA公司,Top10 IP公司,展现百家企业的技术探索与实践经验,为产业发展提供观察视角,ChinaFabless100排行榜已经成为中国IC
    的头像 发表于 04-01 14:22 6640次阅读
    润石科技荣登2026中国IC设计Fabless100排行榜<b class='flag-5'>TOP10</b>模拟芯片公司

    思岚科技获评2025中国具身智能创新企业TOP10

    在由中国领先的产业创新服务平台亿欧主办的WIM2025创新者年会上,思岚科技凭借在全栈技术突破、市场占有率及规模化交付能力等方面的综合卓越表现,获评2025中国具身智能创新企业TOP10”。
    的头像 发表于 01-05 10:01 1427次阅读

    网课回放 I “一站式” PCB 设计 · 25.1 第二期:高效高质量原理图设计

    网课回放 I “一站式” PCB 设计 · 25.1 第二期:高效高质量原理图设计
    的头像 发表于 12-05 16:34 834次阅读
    网课回放 I “一站式” PCB 设计 · 25.1 <b class='flag-5'>第二期</b>:高效高质量原理图设计

    汇川技术与宁德时代ME专研班第二期顺利收官

    11月14日,“宁”聚创新动能,共“汇”绿色时代为主题的第二期宁德时代ME专研班在汇川技术顺利收官。这是继今年四月双方首次携手打造专研班后,再度推出的定制化培训项目。
    的头像 发表于 11-21 11:38 1048次阅读

    电压选择晶体管应用电路第二期

    电压选择晶体管应用电路第二期 以前发表过关于电压选择晶体管的结构和原理的文章,这一我将介绍一下电压选择晶体管的用法。如图所示: 当输入电压Vin等于电压选择晶体管QS的栅极控制电压时,三极管Q
    发表于 11-17 07:42

    德赛电池越南二期厂房正式开工

    10月19日,德赛电池(越南)有限公司二期厂房建设项目开工典礼在越隆重举行。公司管理层、员工代表及承建单位负责人共同出席,标志着这一关键战略项目全面启动,进入实质性建设阶段。
    的头像 发表于 11-07 17:24 1775次阅读

    逐梦星闪,未来可期!“星闪” 区域决赛入围名单出炉

    各参赛队伍:2025第二届“星闪”应用挑战赛区域初赛评审工作已圆满结束。本届赛事参与热度高涨,截至10月8日,共吸引824支队伍注册报名,覆盖全国216所高校。区域初赛经过严格的线上初审,坚持公平
    的头像 发表于 10-16 09:03 742次阅读
    逐梦星闪,未来可期!“星闪<b class='flag-5'>杯</b>” 区域决赛入围<b class='flag-5'>名单</b><b class='flag-5'>出炉</b>!

    临港汽车软件之家第二期技术沙龙:生态聚能,汽车产业链协同创新|前沿观点

    临港汽车软件之家第二期技术沙龙:生态聚能,汽车产业链协同创新|前沿观点
    的头像 发表于 09-22 21:25 936次阅读
    临港汽车软件之家<b class='flag-5'>第二期</b>技术沙龙:生态聚能,汽车产业链协同创新|前沿观点

    OpenHarmony论文解读系列直播第二期

     
    的头像 发表于 08-07 11:05 2258次阅读
    OpenHarmony论文解读系列直播<b class='flag-5'>第二期</b>

    2025最新前瞻技术方案揭秘(第二期):逆变器、软件与控制算法、仿真与人工智能

    -关于2025最新前瞻技术方案揭秘·第二期-文字原创,素材来源:解决方案供应商-本篇为知识星球节选,完整版报告与解读在知识星球发布-1500+最新电动汽车前瞻技术报告与解析已上传知识星球目录
    的头像 发表于 08-02 07:02 2239次阅读
    2025最新前瞻技术方案揭秘(<b class='flag-5'>第二期</b>):逆变器、软件与控制算法、仿真与人工智能

    广汽集团启动IPD及数字化变革二期项目

    近日,广汽集团召开IPD及数字化变革二期项目启动会。在一项目“松土育苗”基础上,二期项目将直击核心痛点,贯通IPD主流程,从流程、组织和体制机制三大维度实现转型。
    的头像 发表于 07-31 15:52 1342次阅读

    赣锋锂电荣登全球新能源品牌榜TOP10

    近日,由全球绿色能源理事会(GGIEC)、亚太新能源行业协会(NEIAAP)、亚洲光伏产业协会(APVIA)联合主办的 “全球新能源品牌榜 TOP10” 颁奖典礼在国家会展中心(上海)举行。
    的头像 发表于 07-18 17:56 1366次阅读

    京东方越南智慧终端二期项目提前量产

    近日,BOE(京东方)越南智慧终端二期项目量产暨客户交付仪式在越南巴地头顿省富美市成功举办。作为京东方首个海外自主投建的智慧工厂,越南二期项目比原计划提前两个半月量产,以先进的运营管理经验再次彰显“BOE速度”。
    的头像 发表于 06-17 09:06 1330次阅读