微软研究院近期公开发布了Phi-3系列AI模型,该系列包括mini版(38亿参数)、small版(70亿参数)以及medium版(140亿参数)。
微软称,带有38亿参数的phi-3-mini经过3.3万亿token的强化学习,其基础表现已经超过Mixtral 8x7B及GPT-3.5;此外,该模型可在手机等移动设备上运行,并在phi-2模型(27亿参数)的基础上,进一步融合了严格筛选的网络数据与合成数据。
尽管phi-3-mini在语言理解和推理方面已能匹敌大参数模型,但在TriviaQA等特定任务中仍受限于模型规模。
值得注意的是,phi-3-small和phi-3-medium两款模型在MMLU测试中的得分分别达到了75.3和78.2。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
微软
+关注
关注
4文章
6723浏览量
107361 -
移动设备
+关注
关注
0文章
521浏览量
55784 -
强化学习
+关注
关注
4文章
269浏览量
11905
发布评论请先 登录
相关推荐
热点推荐
GPT-5震撼发布:AI领域的重大飞跃
电子发烧友网报道(文/李弯弯)2025年8月8日凌晨1点,OpenAI以一场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两年的技术猜测,
GPT-5.1发布 OpenAI开始拼情商
OpenAI正式上线了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有网友实测发现OpenAI新发布的GPT
微软Visual Studio 2026 发布!AI 深度融合、性能提升
“ 微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前
微软企业级应用AI能力全面升级
微软宣布,已将 OpenAI 迄今为止最具突破性的的 AI 技术系统 GPT-5 全面集成至其产品生态中,全面增强平台的的推理、代码生成与对话体验。最新版 GPT-5 已在 Micro
日本航空携手微软率先将AI应用引入客舱管理
日本航空(JAL)携手微软,率先将AI应用引I入客舱管理。通过基于微软Phi-4小型语言模型(SLM)开发的JAL-
从性能到商业,Grok3、GPT-4o、DeepSeek如何重塑AI版图?
2025年2月,AI领域仿佛上演了一场激烈的“诸神之战”,马斯克旗下xAI发布的Grok3、OpenAI推出的GPT-4o以及持续凭借R1模型
马斯克发布Grok 3大模型,超越GPT-4o
近日,科技巨头马斯克宣布其最新研发的人工智能大模型——Grok 3正式发布。这一消息引起了业界的广泛关注。 据马斯克介绍,Grok 3在数学推理、科学逻辑推理以及代码写作等多项能力上均
OpenAI即将发布GPT-4.5与GPT-5
,GPT-4.5将在未来几周内率先亮相,它将是OpenAI通用GPT-4模型的继承者。这款新的算法在技术上进行了诸多优化和升级,旨在为用户提供更加精准、高效的AI服务。 而在
OpenAI即将推出GPT-5模型
先进技术,其中包括备受瞩目的o3工具。通过整合这些技术,GPT-5模型将实现更加强大的功能和性能。 值得一提的是,GPT-5
OpenAI将发布更智能GPT模型及AI智能体工具
OpenAI近日透露了其未来发展的重要动向。据OpenAI首席产品官凯文·维尔(Kevin Weil)介绍,公司计划推出更智能的GPT o3模型,并首次亮相AI智能体工具,这将使Cha
字节跳动豆包大模型1.5 Pro发布
近日,字节跳动旗下的豆包大模型迎来了全新的升级——豆包大模型1.5 Pro正式发布。这款全新模型在知识、代码、推理、中文等多个测评基准上表现出色,综合得分优于
字节跳动发布豆包大模型1.5 Pro
3.5 Sonnet等模型。 该模型采用大规模稀疏MoE架构,使用较小的激活参数进行预训练,却能等效7倍激活参数的Dense模型性能,远超
OpenAI报告GPT-4o及4o-mini模型性能下降,正紧急调查
近日,全球领先的AI研究机构OpenAI发布了一份事故报告,引起了业界的广泛关注。报告中指出,OpenAI目前正面临GPT-4o和4o-mini这两款重要模型
Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑
新的高度。 一,技术突破:开源智能的新高度 Llama 3.3 70B 模型的发布,标志着开源AI模型在智能水平上的一大飞跃。它不仅达到了之前只有 Llama 3.1 405B

微软发布phi-3AI模型,性能超越GPT-3.5
评论