0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通用大模型评测标准正式发布

CHANBAEK 来源:网络整理 2024-10-14 15:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,在2024中国移动全球合作伙伴大会上,一项关于大模型评测体系建设的新成果——《通用大模型评测标准》正式发布。这一标准由中国移动携手工信部中国电子技术标准化研究院、中国电信、国家电网、中国石油以及科大讯飞等产业各方共同推出。

《通用大模型评测标准》旨在为产业界提供一个重要的参考依据,帮助各方遴选出优质的AI大模型。随着人工智能技术的快速发展,大模型在各个领域的应用日益广泛,因此建立一个统一、权威的评测标准显得尤为重要。

此次发布的评测标准将有力推动AI大模型技术的规范化发展,促进产业界的技术交流与合作,为人工智能技术的进一步创新和应用奠定坚实基础。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 中国移动
    +关注

    关注

    22

    文章

    5700

    浏览量

    77209
  • 人工智能
    +关注

    关注

    1813

    文章

    49736

    浏览量

    261534
  • 科大讯飞
    +关注

    关注

    19

    文章

    852

    浏览量

    63192
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    VESA发布DisplayPort汽车扩展标准合规测试规范模型

    ,VESA重点介绍了其于2025年5月发布的DP AE合规测试规范模型。这一完全可执行的Linux C模型包含500多项功能安全与信息安全合规测试,使芯片制造商能够基于VESA DP AE标准
    的头像 发表于 10-28 13:40 357次阅读

    蚂蚁数科正式发布金融推理大模型

    7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数科正式发布了金融推理大模型Agentar-Fin-R1,金融推理
    的头像 发表于 07-28 16:36 530次阅读

    软通动力助力软件智能化领域标准化建设迈上新台阶

    近日,由人工智能关键技术和应用评测重点实验室牵头编写的《软件智能化成熟度模型 通用能力要求》(AIIA/T 0223-2025 )正式发布。作为核心参编单位,软通动力深度参与
    的头像 发表于 07-21 11:49 850次阅读

    深兰科技医疗大模型荣获MedBench评测第一

    近日,国内权威医疗大模型评测平台MedBench在官网更新了榜单,多个知名医疗AI产品及研究团队入榜,其中深兰DeepBlue-MR-v1医疗大模型以复杂医学推理评测第一的成绩领跑Me
    的头像 发表于 04-30 16:08 707次阅读

    云知声深度参与三项大模型国家标准编写

    在人工智能技术加速落地的当下,标准化建设已成为推动行业高质量发展的关键因素。近日,云知声参与编写的3项人工智能大模型国家标准:20231736-T-469《人工智能 大模型第1部分:
    的头像 发表于 03-18 18:19 767次阅读

    《康养机器人通用技术规范》标准发布实施进展状况

    《康养机器人通用技术规范》标准T/YGAZXH4—2025自发布2025年2月1日正式实施1个多月的时间,据不完全统计:已网上发布电子版本不少于1200次,打印的书面
    的头像 发表于 03-06 22:10 790次阅读
    《康养机器人<b class='flag-5'>通用</b>技术规范》<b class='flag-5'>标准</b><b class='flag-5'>发布</b>实施进展状况

    洛微科技参与起草《机器人用激光雷达通用技术条件》标准正式发布

    近日,由中国国际经济技术合作促进会标准化工作委员会牵头制定的《机器人用激光雷达通用技术条件》(T/CIET879-2024)正式发布。作为全球领先的激光雷达和3D传感器硬件和感知解决方案提供商,洛微
    的头像 发表于 03-06 11:50 881次阅读
    洛微科技参与起草《机器人用激光雷达<b class='flag-5'>通用</b>技术条件》<b class='flag-5'>标准</b>正式<b class='flag-5'>发布</b>

    通用模型在垂直行业的应用

    随着DeepSeek这类通用模型的普及,接下来会迎来更加精细化的垂直行业模型,那么哪些垂直行业会率先受益?以下是DeepSeek的整理预测,供大家参考。
    的头像 发表于 02-10 15:44 1386次阅读

    字节跳动发布豆包大模型1.5 Pro

    字节跳动正式发布了豆包大模型1.5 Pro。 全新的Doubao -1.5 - pro模型综合能力显著增强,在知识、代码、推理、中文等多个测评基准上,综合得分优于GPT - 4o、Claude
    的头像 发表于 01-23 10:24 1119次阅读

    生成式人工智能模型的安全可信评测

    受到关注。但当前大模型仍然面临可信瓶颈,无法开展大规模应用。大模型的安全可信受到高度关注,国内外已经有多项法规与标准快速制定并落地。本文以层次化的结构,构建了生成式人工智能的安全可信评测
    的头像 发表于 01-22 13:55 1550次阅读
    生成式人工智能<b class='flag-5'>模型</b>的安全可信<b class='flag-5'>评测</b>

    首批首家!DataCanvas Alaya NeW智算操作系统通过中国信通院“大模型计算资源调度平台” 标准评测

    1月8日,“大模型工程化成果发布会”在北京圆满召开。会上,中国信息通信研究院(简称“中国信通院”)正式发布6项AIInfra(人工智能基础平台)标准成果,凭借领先的应用效能和灵活的扩展
    的头像 发表于 01-10 11:24 818次阅读
    首批首家!DataCanvas Alaya NeW智算操作系统通过中国信通院“大<b class='flag-5'>模型</b>计算资源调度平台” <b class='flag-5'>标准</b><b class='flag-5'>评测</b>

    智谱推出深度推理模型GLM-Zero预览版

    近日,智谱公司正式发布了其深度推理模型GLM-Zero的预览版——GLM-Zero-Preview。这款模型标志着智谱在扩展强化学习技术训练推理模型方面的重大突破,成为其首个专注于增强
    的头像 发表于 01-03 10:42 765次阅读

    腾讯混元文生图登顶智源FlagEval评测榜首

    近日,北京智源人工智能研究院(BAAI)发布了最新的FlagEval大模型评测排行榜,其中多模态模型评测榜单的文生图
    的头像 发表于 12-25 10:06 1191次阅读

    云知声山海大模型多项评测名列前茅

    近日,智源研究院发布并解读了国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。
    的头像 发表于 12-24 10:29 763次阅读

    商汤日日新多模态大模型权威评测第一

    刚刚,商汤科技日日新SenseNova多模态大模型,在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。
    的头像 发表于 12-20 10:39 1497次阅读