0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软发布PhI-3-Vision模型,提升视觉AI效率

微云疏影 来源:综合整理 作者:综合整理 2024-05-28 11:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

5 月 28 日,微软在 Build 2024 大会上推出了最新的 Phi-3 系列成员——Phi-3-vision。这一工具主打视觉应用,能有效处理图片文字信息,且在移动设备上也能运行自如。

Phi-3-vision 是一种小型多模式语言模型(SLM),主要适用于本地人工智能场景。其模型参数高达 42 亿,上下文序列包含 128k 个符号,可满足各种视觉推理和其他任务需求。

Microsoft 通过一篇新发表的论文[PDF]展示了 Phi-3-vision 的强大实力。与其他模型如 Claude 3-haiku、Gemini 1.0 Pro 相比,Phi-3-vision 毫不逊色。

此外,Microsoft 还对 Phi-3-vision 进行了多项测试,并将其与其他竞品模型进行了比较,包括字节跳动的 Llama3-Llava-Next(8B)、微软研究院与威斯康星大学、哥伦比亚大学联合开发的 LlaVA-1.6(7B)以及阿里巴巴通义千问 QWEN-VL-Chat 模型等。结果表明,Phi-3-vision 在多个项目中的表现均十分出色。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6723

    浏览量

    107411
  • 人工智能
    +关注

    关注

    1813

    文章

    49794

    浏览量

    262049
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11273
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深兰科技发布AI法务大模型产品

    近日,深兰科技发布面向律所与企业法务部门的AI法务大模型产品——“深兰律师办公自动化系统(AI版)”。通过AI技术赋能法律服务行业,它能够显
    的头像 发表于 10-23 17:58 966次阅读

    微软Visual Studio 2026 发布AI 深度融合、性能提升

    “  微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前
    的头像 发表于 09-16 11:17 1371次阅读
    <b class='flag-5'>微软</b>Visual Studio 2026 <b class='flag-5'>发布</b>!<b class='flag-5'>AI</b> 深度融合、性能<b class='flag-5'>提升</b>

    日本航空携手微软率先将AI应用引入客舱管理

    日本航空(JAL)携手微软,率先将AI应用引I入客舱管理。通过基于微软Phi-4小型语言模型(SLM)开发的JAL-
    的头像 发表于 07-18 11:12 1155次阅读

    DevEco Studio AI辅助开发工具两大升级功能 鸿蒙应用开发效率提升

    带来了前所未有的智能问答体验。 RAG增强型与传统生成式AI的关键差异: 图2:DeepSeek模型增强RAG能力前后效果对比图 升级点2:新增代码解释功能,提升初学者开发效率 针对
    发表于 04-18 14:43

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    的端侧部署,Token产生速度提升了40%,让端侧大模型拥有更高的计算效率和推理性能,使端侧AI交互响应更及时,用户体验更贴心。 联发科还与vivo和全民K歌携手,借助天玑
    发表于 04-13 19:52

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    []() 2025年3月19日——Banana Pi 今日正式发布 BPI-AI2N & BPI-AI2N Carrier,基于瑞萨电子(Renesas)同步
    发表于 03-19 17:54

    IBM发布全新Granite 3.2 AI模型

    Granite 3.2 是小型的 AI 模型,通过对开发人员友好的授权条款,提供推理、视觉和护栏功能。
    的头像 发表于 03-06 16:47 918次阅读

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    AI 处理效率,成为部署各类 AI 模型的关键依托。 凭借这些卓越的硬件性能,RK3588 开发板在保持低功耗的同时,展现出强大的运算能力,无疑是部署 DeepSeek
    发表于 02-14 17:42

    字节跳动发布豆包大模型1.5 Pro

    3.5 Sonnet等模型。 该模型采用大规模稀疏MoE架构,使用较小的激活参数进行预训练,却能等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规
    的头像 发表于 01-23 10:24 1162次阅读

    在算力魔方上本地部署Phi-4模型

    智能水平上的一大飞跃。它不仅达到了之前只有Llama 3.1 405B模型才具备的智能水平,而且还超越了11月发布的GPT-4o模型。 本文我们将分享微软刚刚
    的头像 发表于 01-15 11:05 800次阅读
    在算力魔方上本地部署<b class='flag-5'>Phi</b>-4<b class='flag-5'>模型</b>

    三星发布Vision AI等多项创新

    近日,三星在美国举办的2025 年国际消费电子展(CES 2025)“First Look”活动上,发布了三星Vision AI,旨在为用户的日常生活带来个性化的 AI屏幕体验。
    的头像 发表于 01-14 11:47 1170次阅读

    虹软AI视觉赋能雷鸟V3 AI拍摄眼镜发布

    近日,雷鸟创新正式发布全新一代AI拍摄眼镜——雷鸟V3。该产品搭载多项创新技术,包括融合虹软AI视觉算法的猎鹰影像系统、通义独家定制大
    的头像 发表于 01-08 10:58 2311次阅读

    三星发布Vision AI及Neo QLED旗舰电视

    近日,三星电子在1月6日正式对外发布了其备受瞩目的Samsung Vision AI技术。这一创新技术旨在为用户提供由先进人工智能驱动的个人屏幕体验,开启了智能家居与个性化交互的新篇章
    的头像 发表于 01-07 10:36 1088次阅读

    LabVIEW使用Vision视觉进行硬币分类计数

    LabVIEW使用Vision视觉进行硬币分类计数,有偿,带价加q:3430396759
    发表于 12-29 20:20

    微软寻求在365 Copilot中引入非OpenAI模型

    担心企业用户在使用365 Copilot时面临的成本和速度问题,因此正在寻求更多样化的技术来源。尽管微软与OpenAI之间有着紧密的合作关系,并允许微软定制OpenAI的模型,但微软
    的头像 发表于 12-25 10:41 850次阅读