0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“千帆杯”第二期十万大奖花落谁家?TOP10名单出炉!

百度 来源:百度 2024-03-08 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

千帆杯AI原生应用开发挑战赛第二期赛题“贺岁灵感模型”已于2月28日圆满结束。经过严格的自动评估和人工复审后,现已决出TOP10选手!

第二期赛题,结合新春佳节的背景以“贺岁灵感模型”为主题,鼓励开发者使用千帆ModelBuilder,基于ERNIE Speed模型打造一个春节文案创作的精调模型,在通过对模型精调使其保持原有能力的同时,还能准确理解和执行文案创作,帮助用户成为春节档“最强贺岁文案专家”。

本期赛题主要通过千帆ModelBuilder工具链中“模型评估”的部分能力以及人工评估做整体评审,全方位保证评审结果的公平、公正、公开。

第一轮:自动评估(满分1分)

以“内容分”和“字数控制分”为主要考核指标,两项标准分别占据0.6、0.4的权重,通过加权平均后,得出“选手模型”的作品分数。

内容分(占据0.6权重):官方输入包含内容及字数要求的评测数据集,以ERNIE Bot 4.0作为裁判,如果“选手模型”答案比数据集答案更好则得分,反之则不得分。如果ERNIE Bot 4.0没有明确返回评测数据集答案更好,均算作“选手模型”得分。

字数控制分(占据0.4权重):基于官方评测数据集的字数要求,根据“选手模型”的全量回答综合得出最终字数控制评分。

具体规则:根据“选手模型”答案字数与评测数据集中字数要求的diff进行分段打分,具体分段分数如下:

diff ≤ 0.05,得1分

0.05 < diff ≤ 0.1,得0.9分

0.1 < diff ≤ 0.15,得0.8分

0.15 < diff ≤ 0.2,等0.7分

0.2 < diff ≤ 0.25,得0.6分

其余则不得分

举例:如评测数据要求为300字,选手模型返回290字,则diff为:(300-290)/300=0.033,最终得分因0.033 ≤ 0.05,因此在该评测数据下字数控制得1分。

第二轮:人工评估(满分1分)

为了保证自动评估的结果,官方针对自动评估得出的TOP 12“选手模型”安排了第二轮人工评估。(由于选手比分较为接近,因此官方对TOP 12“选手模型”进行人工评估)

人工评估由三位百度专家通过人工查验的方式进行,专家通过对参赛选手所提供的模型微调方案进行投票(一位专家最多可投3票),如选手获得三票,即获得满分。

“千帆杯”第二期

「最强挑战者」出炉

第二期最强挑战者张辉,带来作品“贺岁灵感模型”,张辉使用ModelBuilder的模型SFT精调工具链,基于ERNIE Speed基座模型,精调训练出了一个能准确控制创作字数的春节贺岁文案模型。

ERNIE Speed模型作为百度在2024年最新发布的自研高性能大语言模型,凭借其轻量级、高效的自然语言处理等特点,可以快速地响应用户需求。同时,其在微调场景下优势显著,模型的训练时间更短,成本更低,特定场景下的效果可媲美ERNIE Bot 4.0。

自2月发布上线以来,目前已有超过150家企业采用了ERNIE Speed模型,它除了能做到快速响应外,作为基础通用大模型,在阅读理解、close-book问答、创作与续写等复杂任务上,也能达到甚至超越千亿大模型的效果。每一位开发者,都可以在ERNIE Speed的助力下,快速实现企业级的专属模型训练,探索AI大模型的无限可能。

wKgZomXqdnSACVt3AAUH5O6B5kw425.jpg

更多AI的想象

值得期待

3月21日,百度智能云将在北京举行AI Cloud Day:百度智能云千帆产品发布会。作为2024年AI领域最值得期待的系列产品发布会,诚挚邀请所有技术爱好者共襄盛举。届时,百度智能云千帆ModelBuilder和AppBuilder也将公布最新产品进展,发布系列新模型以及应用开发工具组件等,分享如何助力企业、用户释放模型创新潜能,简单高效打造AI原生应用,推动中国AI原生应用的发展,共同迈入崭新的AI生产力的最新纪元。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度智能云
    +关注

    关注

    0

    文章

    48

    浏览量

    2200
  • AI大模型
    +关注

    关注

    0

    文章

    394

    浏览量

    942

原文标题:“千帆杯”第二期十万大奖花落谁家?TOP10名单出炉!

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    网课回放 I “一站式” PCB 设计 · 25.1 第二期:高效高质量原理图设计

    网课回放 I “一站式” PCB 设计 · 25.1 第二期:高效高质量原理图设计
    的头像 发表于 12-05 16:34 70次阅读
    网课回放 I “一站式” PCB 设计 · 25.1 <b class='flag-5'>第二期</b>:高效高质量原理图设计

    汇川技术与宁德时代ME专研班第二期顺利收官

    11月14日,“宁”聚创新动能,共“汇”绿色时代为主题的第二期宁德时代ME专研班在汇川技术顺利收官。这是继今年四月双方首次携手打造专研班后,再度推出的定制化培训项目。
    的头像 发表于 11-21 11:38 481次阅读

    电压选择晶体管应用电路第二期

    电压选择晶体管应用电路第二期 以前发表过关于电压选择晶体管的结构和原理的文章,这一我将介绍一下电压选择晶体管的用法。如图所示: 当输入电压Vin等于电压选择晶体管QS的栅极控制电压时,三极管Q
    发表于 11-17 07:42

    德赛电池越南二期厂房正式开工

    10月19日,德赛电池(越南)有限公司二期厂房建设项目开工典礼在越隆重举行。公司管理层、员工代表及承建单位负责人共同出席,标志着这一关键战略项目全面启动,进入实质性建设阶段。
    的头像 发表于 11-07 17:24 1138次阅读

    第二批工业机器人行业规范企业名单公布

    近日,国家工信部公示了“符合《工业机器人行业规范条件(2024版)》(以下简称《行业规范》)的企业名单(第二批)”,据公告显示,有21家机器人产业链企业入选第二批符合《行业规范》企业名单
    的头像 发表于 10-16 14:13 774次阅读
    <b class='flag-5'>第二</b>批工业机器人行业规范企业<b class='flag-5'>名单</b>公布

    逐梦星闪,未来可期!“星闪” 区域决赛入围名单出炉

    各参赛队伍:2025第二届“星闪”应用挑战赛区域初赛评审工作已圆满结束。本届赛事参与热度高涨,截至10月8日,共吸引824支队伍注册报名,覆盖全国216所高校。区域初赛经过严格的线上初审,坚持公平
    的头像 发表于 10-16 09:03 379次阅读
    逐梦星闪,未来可期!“星闪<b class='flag-5'>杯</b>” 区域决赛入围<b class='flag-5'>名单</b><b class='flag-5'>出炉</b>!

    临港汽车软件之家第二期技术沙龙:生态聚能,汽车产业链协同创新|前沿观点

    临港汽车软件之家第二期技术沙龙:生态聚能,汽车产业链协同创新|前沿观点
    的头像 发表于 09-22 21:25 513次阅读
    临港汽车软件之家<b class='flag-5'>第二期</b>技术沙龙:生态聚能,汽车产业链协同创新|前沿观点

    2025最新前瞻技术方案揭秘(第二期):逆变器、软件与控制算法、仿真与人工智能

    -关于2025最新前瞻技术方案揭秘·第二期-文字原创,素材来源:解决方案供应商-本篇为知识星球节选,完整版报告与解读在知识星球发布-1500+最新电动汽车前瞻技术报告与解析已上传知识星球目录
    的头像 发表于 08-02 07:02 1672次阅读
    2025最新前瞻技术方案揭秘(<b class='flag-5'>第二期</b>):逆变器、软件与控制算法、仿真与人工智能

    广汽集团启动IPD及数字化变革二期项目

    近日,广汽集团召开IPD及数字化变革二期项目启动会。在一项目“松土育苗”基础上,二期项目将直击核心痛点,贯通IPD主流程,从流程、组织和体制机制三大维度实现转型。
    的头像 发表于 07-31 15:52 909次阅读

    京东方越南智慧终端二期项目提前量产

    近日,BOE(京东方)越南智慧终端二期项目量产暨客户交付仪式在越南巴地头顿省富美市成功举办。作为京东方首个海外自主投建的智慧工厂,越南二期项目比原计划提前两个半月量产,以先进的运营管理经验再次彰显“BOE速度”。
    的头像 发表于 06-17 09:06 907次阅读

    玻色量子完成数千万元A+轮第二期融资 光电融合产业基金领投

    近日,北京玻色量子科技有限公司(以下简称“玻色量子”)完成数千万元A+轮第二期融资,由北京光电融合产业投资基金(有限合伙)(以下简称“光电融合产业基金”)等机构投资。这是玻色量子成立四年多以来完成
    的头像 发表于 05-15 09:23 727次阅读

    AspenCore评选中国Top10传感器公司出炉 豪威科技、格科微、思特威、汇顶科技等上榜(附全名单

    模拟,每个类别挑选出Top  10,外加上市公司和EDA、IP公司这三个类别各自的Top 10,共同组成Fabless100 3+10
    的头像 发表于 04-02 18:54 4474次阅读
    AspenCore评选中国<b class='flag-5'>Top10</b>传感器公司<b class='flag-5'>出炉</b> 豪威科技、格科微、思特威、汇顶科技等上榜(附全<b class='flag-5'>名单</b>)

    渝您共享|第二期2024年重庆市物联网赋能行业发展典型案例专题活动《5G+生物多样性保护物联网集成创新应用

    为加强典型经验总结与优秀案例推广,以典型案例示范应用带动产业发展。3月28日,由重庆市经济和信息化委员会指导,重庆市物联网产业协会/重庆市物联网技术创新战略联盟主办的“渝您共享”——第二期2024年
    的头像 发表于 04-02 16:58 1004次阅读
    渝您共享|<b class='flag-5'>第二期</b>2024年重庆市物联网赋能行业发展典型案例专题活动《5G+生物多样性保护物联网集成创新应用

    燧原技术伙伴培育计划第二期开启

    新的里程碑,第二期ETP培训于昨日在上海正式开课,来自中电金信、恒生电子、清昴智能、超聚变、卡姆派乐、思迹信息、先进编译实验室、亿芯智算、燧弘华创等10家企业的近30位技术专家和工程师参与其中。
    的头像 发表于 01-10 15:25 1062次阅读

    东风奕派eπ008登顶CCRT细分市场榜首

    日前,中汽中心汽车测评管理中心揭晓第二期《CCRT选车指南》中型及中大型新能源SUV推荐名单,东风奕派旗下家庭智能大型SUV eπ008,以综合得分90.1分的优异成绩获15-20万级城市SUV第一
    的头像 发表于 12-17 09:52 866次阅读