0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OPPO登顶CLUE与MUGE,刷新中文自然语言理解与图文多模态双榜记录

荷叶塘 来源:OPPO 作者:厂商供稿 2022-11-10 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2022年11月9日,OPPO语音语义研究部融智团队提出的中文预训练大模型CHAOS ,在中文自然语言理解测评基准CLUE上登顶,以30亿参量同时刷新了CLUE总排行榜、CLUE分类任务排行榜和CLUE阅读理解排行榜的最好成绩。其中在“AFQMC,TNEWS,CSL,CHID1.1”4个赛道的成绩超过了人类识别精确准确度,总成绩距离超越人类表现仅差0.1。

同期,在业界首个大规模中文多模态评测基准MUGE上,该团队自主训练的中文多模态预训练模型也在综合“图文检索、看图说话、文本到图像生成”三个赛道的总成绩上位列总榜第一名。


OPPO 中文预训练大模型CHAOS登顶CLUE


OPPO中文多模态预训练模型登顶MUGE


CLUE (Chinese Language Understanding Evaluation) 是中文自然语言理解最权威测评榜单之一,包含了文本分类、阅读理解、句间关系等众多语义分析和语义理解类子任务,旨在推动NLP(自然语言处理)训练模型技术的不断进步和突破,对学术界和工业界都产生了较大的影响。

MUGE(Multimodal Understanding and Generation Evaluation)是业界首个大规模中文多模态评测基准,由达摩院联合浙江大学、阿里云天池平台联合发布,中国计算机学会计算机视觉专委会(CCF-CV专委)协助推出,旨在帮助中文多模态研究人员全方位评估算法模型。

NLP(自然语言处理)技术是人工智能领域的一个核心研究方向,其目的是使得计算机具备人类的听、说、读、写等能力,并利用知识和常识进行推理和决策。而图文融合的多模态能力的建设,目前工作主要集中在建立图像模态和文本模态的联系,相关能力的构建能够广泛落地到搜索、推荐、服饰设计、智能文案等真实场景中。

“融合多种智能,研发统一的基础模型”是OPPO语音语义研究部融智团队的目标,也是“融智”二字的含义。未来融智团队将在推进感知认知融合,更可控/可编辑的视觉生成,及促进工业化落地转化的模型小型化等方向上继续突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OPPO
    +关注

    关注

    20

    文章

    5291

    浏览量

    84468
  • 人工智能
    +关注

    关注

    1813

    文章

    49784

    浏览量

    261896
  • 自然语言处理

    关注

    1

    文章

    629

    浏览量

    14580
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    云知声论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,云知声提交的《面向门诊病历生成的高质量医患对话合成技术
    的头像 发表于 11-10 17:30 588次阅读
    云知声论文入选<b class='flag-5'>自然语言</b>处理顶会EMNLP 2025

    格灵深瞳模态大模型Glint-ME让图文互搜更精准

    在电商、安防等场景下,图文互搜应用广泛。随着以CLIP为代表的模态表征方法相继提出,过去单一模态搜索(文搜文、图搜图)被突破,模型可以同时理解
    的头像 发表于 11-02 15:56 1283次阅读
    格灵深瞳<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型Glint-ME让<b class='flag-5'>图文</b>互搜更精准

    商汤日日新V6.5模态大模型登顶全球权威榜单

    Pro)模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型。
    的头像 发表于 09-10 09:55 528次阅读

    米尔RK3576部署端侧模态轮对话,6TOPS算力驱动30亿参数LLM

    加载 → 图片预处理 → 用户交互 → 推理输出”的核心流程,支持图文一体的模态对话,适配轮问答、视觉问答等典型场景。 具体运行机制可拆解为以下步骤:1. 模型初始化首先加载大
    发表于 09-05 17:25

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic 在 HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    GPIO 等),并返回结果。 Cangjie Magic 角色 :构建MCP服务器,同时提供自然语言理解能力,将用户输入的文本(如 “查看开发板 IP 地址”“点亮 LED1”)转换为机器可识别的指令(如
    发表于 08-23 13:10

    飞凌嵌入式RK3576模态大模型图像理解助手,让嵌入式设备“看懂”世界

    (LLM)+视觉语言模型(VLM)模态架构,推出模态大模型图像理解助手,为嵌入式设备打造 “
    的头像 发表于 07-25 11:09 1475次阅读
    飞凌嵌入式RK3576<b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型图像<b class='flag-5'>理解</b>助手,让嵌入式设备“看懂”世界

    云知声四篇论文入选自然语言处理顶会ACL 2025

    结果正式公布。云知声在此次国际学术盛会中表现卓越,共有4篇论文被接收,其中包括2篇主会论文(Main Paper)和2篇Findings。入选的4篇论文聚焦大语言模型知识溯源、图文模态
    的头像 发表于 05-26 14:15 1098次阅读
    云知声四篇论文入选<b class='flag-5'>自然语言</b>处理顶会ACL 2025

    基于MindSpeed MM玩转Qwen2.5VL模态理解模型

    模态理解模型是让AI像人类一样,通过整合多维度信息(如视觉、语言、听觉等),理解数据背后的语义、情感、逻辑或场景,从而完成推理、决策等任务
    的头像 发表于 04-18 09:30 2712次阅读
    基于MindSpeed MM玩转Qwen2.5VL<b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>理解</b>模型

    自然语言提示原型在英特尔Vision大会上首次亮相

    在英特尔Vision大会上,Network Optix首次展示了自然语言提示原型,该方案将重新定义视频管理,为各行各业由AI驱动的洞察和效率提速。
    的头像 发表于 04-09 09:30 813次阅读

    商汤“日日新”融合大模型登顶语言模态榜单

    据弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布的《2025年中国大模型年度评测》结果显示:在语言模态核心能力测评中,商汤“日日新”融合大模型斩获国内第一梯队成绩。
    的头像 发表于 03-18 10:35 957次阅读

    ​VLM(视觉语言模型)​详细解析

    视觉语言模型(Visual Language Model, VLM)是一种结合视觉(图像/视频)和语言(文本)处理能力的模态人工智能模型,能够理解
    的头像 发表于 03-17 15:32 7722次阅读
    ​VLM(视觉<b class='flag-5'>语言</b>模型)​详细解析

    模态交互技术解析

    模态交互 模态交互( Multimodal Interaction )是指通过多种感官通道(如视觉、听觉、触觉等)或多种交互方式(如语音、手势、触控、眼动等)与计算机系统进行
    的头像 发表于 03-17 15:12 3636次阅读

    海康威视发布模态大模型文搜存储系列产品

    模态大模型为安防行业带来重大技术革新,基于观澜大模型技术体系,海康威视将大参数量、大样本量的图文模态大模型与嵌入式智能硬件深度融合,发布
    的头像 发表于 02-18 10:33 1046次阅读

    一文详解视觉语言模型

    视觉语言模型(VLM)是一种模态、生成式 AI 模型,能够理解和处理视频、图像和文本。
    的头像 发表于 02-12 11:13 3333次阅读
    一文详解视觉<b class='flag-5'>语言</b>模型

    体验MiniCPM-V 2.6 模态能力

    模态组网
    jf_23871869
    发布于 :2025年01月20日 13:40:48