0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小米大模型MiLM-6B具有64亿参数,在同参数量级排名第1

jf_35673951 来源:jf_35673951 作者:jf_35673951 2023-08-14 10:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据了解,小米此前并未“官宣”直接加入AI大模型赛道中,但是目前小米的AI大模型 MiLM-6B已经悄然现身C-Eval、CMMLU 大模型评测榜单。并且小米大模型在 C-Eval总榜单排名第 10,同参数量级排名第1。

而从GitHub 项目给出的信息得知,MiLM-6B是由小米公司开发的一个大规模预训练语言模型,参数规模达64 亿。

MiLM-6B模型在具体各科目成绩上,在STEM(科学、技术、工程和数学教育)全部20个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。

MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度,不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中,还有一定进步空间wprbsubsqkd。

并且在10个“社会科学”测试科目中,除“教育学和地理”外,该模型在其他8个科目中都获得了较为理想的准确率。

不仅如此,该模型在人文科学的11个科目中的“历史与法律”基础上有着不错的准确率表现。

以上源自互联网,版权归原作所有

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41141

    浏览量

    302608
  • 小米
    +关注

    关注

    70

    文章

    14547

    浏览量

    152601
  • 大模型
    +关注

    关注

    2

    文章

    3772

    浏览量

    5273
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    壁仞科技光速支持阿里Qwen3.6-35B-A3B模型

    4月16日晚,阿里巴巴通义实验室正式宣布全量开源Qwen3.6-35B-A3B模型。该模型为混合专家(MoE)模型,总参数量为350
    的头像 发表于 04-20 17:50 1508次阅读

    【瑞萨AI挑战赛】手写数字识别模型RA8P1 Titan Board上的部署

    手写数字识别模型RA8P1 Titan Board上的部署 手写数字识别是计算机视觉领域的经典入门任务,而瑞萨RA8P1 Titan Board开发板凭借其搭载的双内核架构与专用NP
    发表于 03-15 20:42

    如何在NVIDIA Jetson AGX Thor上部署1200亿参数模型

    我们将尝试能否 Jetson AGX Thor 上部署并成功运行高达 1,200 亿参数量的 gpt-oss-120b
    的头像 发表于 12-26 17:06 5267次阅读
    如何在NVIDIA Jetson AGX Thor上部署1200<b class='flag-5'>亿</b><b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>

    量级参数的管理框架(C语言)

    64bit的参数类型 COT_PARAM_NAME_MAX_LENGTH参数名字最大定义长度,小于或等于1则禁用参数名功能 COT_PARA
    发表于 12-16 06:24

    浅谈SPICE模型参数自动化提取

    在过去的几十年里,半导体器件紧凑型模型已经从 BJT Gummel-Poon 模型中的几个参数发展到 MOSFET BSIM 模型中的数百个参数
    的头像 发表于 10-16 16:21 1573次阅读

    米尔RK3576部署端侧多模态多轮对话,6TOPS算力驱动30亿参数LLM

    (LLM Core) 模型选择:搭载 qwen2.5-vl-3b-w4a16_level1_rk3576.rkllm 模型,采用 W4A16 量化方案(本文)。 模型规模:
    发表于 09-05 17:25

    请问InDTU IHDMP协议使用的CRC校验使用的什么参数模型

    InDTU IHDMP协议使用的CRC校验使用的什么参数模型
    发表于 08-06 07:57

    TPT如何设置不同参数集执行测试用例#simulink #Siumlink模型测试 #测试用例

    模型
    北汇信息POLELINK
    发布于 :2025年07月29日 12:26:05

    华为宣布开源盘古7B稠密和72B混合专家模型

    电子发烧友网综合报道 2025年6月30日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿
    的头像 发表于 07-06 05:51 7626次阅读

    模型推理显存和计算量估计方法研究

    、显存估计方法 基于模型结构的显存估计 根据深度学习模型的层次结构和参数数量,可以估算模型推理过程中所需的显存大小。具体方法如下: (
    发表于 07-03 19:43

    华为正式开源盘古7B稠密和72B混合专家模型

    [中国,深圳,2025年6月30日] 今日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿
    的头像 发表于 06-30 11:19 1445次阅读

    华为助力中国石油发布3000亿参数昆仑大模型

    5月28日,中国石油发布3000亿参数昆仑大模型,标志着中国石油人工智能领域又迈出关键一步,全力推动“人工智能+”行动走深走实。   中国石油发布3000
    的头像 发表于 05-29 09:19 1206次阅读
    华为助力中国石油发布3000<b class='flag-5'>亿</b><b class='flag-5'>参数</b>昆仑大<b class='flag-5'>模型</b>

    ON Semiconductor RB521S30T1G参数特性与EDA模型 数据手册介绍

    ON Semiconductor RB521S30T1G参数特性与EDA模型 数据手册介绍
    的头像 发表于 05-28 16:45 1.6w次阅读
    ON Semiconductor RB521S30T<b class='flag-5'>1</b>G<b class='flag-5'>参数</b>特性与EDA<b class='flag-5'>模型</b> 数据手册介绍

    Analog Devices LT6654 AMPS6-3.3器件参数特性解读 EDA模型 数据手册免费下载

    Analog Devices LT6654AMPS6-3.3器件参数特性解读 EDA模型 数据手册免费下载
    的头像 发表于 05-27 11:03 1183次阅读
    Analog Devices LT6654 AMPS<b class='flag-5'>6</b>-3.3器件<b class='flag-5'>参数</b>特性解读  EDA<b class='flag-5'>模型</b> 数据手册免费下载

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义千问 Qwen3,此次 Qwen3 开源模型系列包含两款混合专家模型 (MoE),235B-A22B(总
    的头像 发表于 05-08 11:45 3218次阅读
    NVIDIA使用Qwen3系列<b class='flag-5'>模型</b>的最佳实践