0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软发布phi-3AI模型,性能超越GPT-3.5

微云疏影 来源:综合整理 作者:综合整理 2024-04-23 14:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

微软研究院近期公开发布了Phi-3系列AI模型,该系列包括mini版(38亿参数)、small版(70亿参数)以及medium版(140亿参数)。

微软称,带有38亿参数的phi-3-mini经过3.3万亿token的强化学习,其基础表现已经超过Mixtral 8x7B及GPT-3.5;此外,该模型可在手机等移动设备上运行,并在phi-2模型(27亿参数)的基础上,进一步融合了严格筛选的网络数据与合成数据。

尽管phi-3-mini在语言理解和推理方面已能匹敌大参数模型,但在TriviaQA等特定任务中仍受限于模型规模。

值得注意的是,phi-3-small和phi-3-medium两款模型在MMLU测试中的得分分别达到了75.3和78.2。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6723

    浏览量

    107361
  • 移动设备
    +关注

    关注

    0

    文章

    521

    浏览量

    55784
  • 强化学习
    +关注

    关注

    4

    文章

    269

    浏览量

    11905
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GPT-5震撼发布AI领域的重大飞跃

    电子发烧友网报道(文/李弯弯)2025年8月8日凌晨1点,OpenAI以一场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两年的技术猜测,
    的头像 发表于 08-09 07:44 9889次阅读
    <b class='flag-5'>GPT</b>-5震撼<b class='flag-5'>发布</b>:<b class='flag-5'>AI</b>领域的重大飞跃

    GPT-5.1发布 OpenAI开始拼情商

    OpenAI正式上线了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有网友实测发现OpenAI新发布GPT
    的头像 发表于 11-13 15:49 559次阅读

    微软Visual Studio 2026 发布AI 深度融合、性能提升

    “  微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前
    的头像 发表于 09-16 11:17 1312次阅读
    <b class='flag-5'>微软</b>Visual Studio 2026 <b class='flag-5'>发布</b>!<b class='flag-5'>AI</b> 深度融合、<b class='flag-5'>性能</b>提升

    微软企业级应用AI能力全面升级

    微软宣布,已将 OpenAI 迄今为止最具突破性的的 AI 技术系统 GPT-5 全面集成至其产品生态中,全面增强平台的的推理、代码生成与对话体验。最新版 GPT-5 已在 Micro
    的头像 发表于 08-15 11:44 1106次阅读

    日本航空携手微软率先将AI应用引入客舱管理

    日本航空(JAL)携手微软,率先将AI应用引I入客舱管理。通过基于微软Phi-4小型语言模型(SLM)开发的JAL-
    的头像 发表于 07-18 11:12 1136次阅读

    性能到商业,Grok3GPT-4o、DeepSeek如何重塑AI版图?

    2025年2月,AI领域仿佛上演了一场激烈的“诸神之战”,马斯克旗下xAI发布的Grok3、OpenAI推出的GPT-4o以及持续凭借R1模型
    的头像 发表于 02-19 18:14 1566次阅读
    从<b class='flag-5'>性能</b>到商业,Grok<b class='flag-5'>3</b>、<b class='flag-5'>GPT</b>-4o、DeepSeek如何重塑<b class='flag-5'>AI</b>版图?

    马斯克发布Grok 3模型超越GPT-4o

    近日,科技巨头马斯克宣布其最新研发的人工智能大模型——Grok 3正式发布。这一消息引起了业界的广泛关注。 据马斯克介绍,Grok 3在数学推理、科学逻辑推理以及代码写作等多项能力上均
    的头像 发表于 02-19 13:50 721次阅读

    OpenAI即将发布GPT-4.5与GPT-5

    GPT-4.5将在未来几周内率先亮相,它将是OpenAI通用GPT-4模型的继承者。这款新的算法在技术上进行了诸多优化和升级,旨在为用户提供更加精准、高效的AI服务。 而在
    的头像 发表于 02-13 13:43 1034次阅读

    OpenAI即将推出GPT-5模型

    先进技术,其中包括备受瞩目的o3工具。通过整合这些技术,GPT-5模型将实现更加强大的功能和性能。 值得一提的是,GPT-5
    的头像 发表于 02-13 11:21 919次阅读

    OpenAI将发布更智能GPT模型AI智能体工具

    OpenAI近日透露了其未来发展的重要动向。据OpenAI首席产品官凯文·维尔(Kevin Weil)介绍,公司计划推出更智能的GPT o3模型,并首次亮相AI智能体工具,这将使Cha
    的头像 发表于 01-24 13:54 791次阅读

    字节跳动豆包大模型1.5 Pro发布

    近日,字节跳动旗下的豆包大模型迎来了全新的升级——豆包大模型1.5 Pro正式发布。这款全新模型在知识、代码、推理、中文等多个测评基准上表现出色,综合得分优于
    的头像 发表于 01-23 15:24 1114次阅读

    字节跳动发布豆包大模型1.5 Pro

    3.5 Sonnet等模型。 该模型采用大规模稀疏MoE架构,使用较小的激活参数进行预训练,却能等效7倍激活参数的Dense模型性能,远超
    的头像 发表于 01-23 10:24 1133次阅读

    OpenAI报告GPT-4o及4o-mini模型性能下降,正紧急调查

    近日,全球领先的AI研究机构OpenAI发布了一份事故报告,引起了业界的广泛关注。报告中指出,OpenAI目前正面临GPT-4o和4o-mini这两款重要模型
    的头像 发表于 01-23 10:22 1107次阅读

    在算力魔方上本地部署Phi-4模型

    智能水平上的一大飞跃。它不仅达到了之前只有Llama 3.1 405B模型才具备的智能水平,而且还超越了11月发布GPT-4o模型。 本文
    的头像 发表于 01-15 11:05 791次阅读
    在算力魔方上本地部署<b class='flag-5'>Phi</b>-4<b class='flag-5'>模型</b>

    Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

    新的高度。 一,技术突破:开源智能的新高度 Llama 3.3 70B 模型发布,标志着开源AI模型在智能水平上的一大飞跃。它不仅达到了之前只有 Llama 3.1 405B
    的头像 发表于 12-18 16:46 893次阅读
    Meta重磅<b class='flag-5'>发布</b>Llama 3.3 70B:开源<b class='flag-5'>AI</b><b class='flag-5'>模型</b>的新里程碑