近日,在2024中国移动全球合作伙伴大会上,一项关于大模型评测体系建设的新成果——《通用大模型评测标准》正式发布。这一标准由中国移动携手工信部中国电子技术标准化研究院、中国电信、国家电网、中国石油以及科大讯飞等产业各方共同推出。
《通用大模型评测标准》旨在为产业界提供一个重要的参考依据,帮助各方遴选出优质的AI大模型。随着人工智能技术的快速发展,大模型在各个领域的应用日益广泛,因此建立一个统一、权威的评测标准显得尤为重要。
此次发布的评测标准将有力推动AI大模型技术的规范化发展,促进产业界的技术交流与合作,为人工智能技术的进一步创新和应用奠定坚实基础。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
中国移动
+关注
关注
22文章
5700浏览量
77209 -
人工智能
+关注
关注
1813文章
49736浏览量
261534 -
科大讯飞
+关注
关注
19文章
852浏览量
63192
发布评论请先 登录
相关推荐
热点推荐
VESA发布DisplayPort汽车扩展标准合规测试规范模型
,VESA重点介绍了其于2025年5月发布的DP AE合规测试规范模型。这一完全可执行的Linux C模型包含500多项功能安全与信息安全合规测试,使芯片制造商能够基于VESA DP AE标准
蚂蚁数科正式发布金融推理大模型
7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数科正式发布了金融推理大模型Agentar-Fin-R1,金融推理
软通动力助力软件智能化领域标准化建设迈上新台阶
近日,由人工智能关键技术和应用评测重点实验室牵头编写的《软件智能化成熟度模型 通用能力要求》(AIIA/T 0223-2025 )正式发布。作为核心参编单位,软通动力深度参与
深兰科技医疗大模型荣获MedBench评测第一
近日,国内权威医疗大模型评测平台MedBench在官网更新了榜单,多个知名医疗AI产品及研究团队入榜,其中深兰DeepBlue-MR-v1医疗大模型以复杂医学推理评测第一的成绩领跑Me
云知声深度参与三项大模型国家标准编写
在人工智能技术加速落地的当下,标准化建设已成为推动行业高质量发展的关键因素。近日,云知声参与编写的3项人工智能大模型国家标准:20231736-T-469《人工智能 大模型第1部分:
《康养机器人通用技术规范》标准发布实施进展状况
《康养机器人通用技术规范》标准T/YGAZXH4—2025自发布2025年2月1日正式实施1个多月的时间,据不完全统计:已网上发布电子版本不少于1200次,打印的书面
洛微科技参与起草《机器人用激光雷达通用技术条件》标准正式发布
近日,由中国国际经济技术合作促进会标准化工作委员会牵头制定的《机器人用激光雷达通用技术条件》(T/CIET879-2024)正式发布。作为全球领先的激光雷达和3D传感器硬件和感知解决方案提供商,洛微
通用大模型在垂直行业的应用
随着DeepSeek这类通用大模型的普及,接下来会迎来更加精细化的垂直行业模型,那么哪些垂直行业会率先受益?以下是DeepSeek的整理预测,供大家参考。
字节跳动发布豆包大模型1.5 Pro
字节跳动正式发布了豆包大模型1.5 Pro。 全新的Doubao -1.5 - pro模型综合能力显著增强,在知识、代码、推理、中文等多个测评基准上,综合得分优于GPT - 4o、Claude
生成式人工智能模型的安全可信评测
受到关注。但当前大模型仍然面临可信瓶颈,无法开展大规模应用。大模型的安全可信受到高度关注,国内外已经有多项法规与标准快速制定并落地。本文以层次化的结构,构建了生成式人工智能的安全可信评测
首批首家!DataCanvas Alaya NeW智算操作系统通过中国信通院“大模型计算资源调度平台” 标准评测
1月8日,“大模型工程化成果发布会”在北京圆满召开。会上,中国信息通信研究院(简称“中国信通院”)正式发布6项AIInfra(人工智能基础平台)标准成果,凭借领先的应用效能和灵活的扩展
智谱推出深度推理模型GLM-Zero预览版
近日,智谱公司正式发布了其深度推理模型GLM-Zero的预览版——GLM-Zero-Preview。这款模型标志着智谱在扩展强化学习技术训练推理模型方面的重大突破,成为其首个专注于增强
腾讯混元文生图登顶智源FlagEval评测榜首
近日,北京智源人工智能研究院(BAAI)发布了最新的FlagEval大模型评测排行榜,其中多模态模型评测榜单的文生图
云知声山海大模型多项评测名列前茅
近日,智源研究院发布并解读了国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。
商汤日日新多模态大模型权威评测第一
刚刚,商汤科技日日新SenseNova多模态大模型,在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。

通用大模型评测标准正式发布
评论