0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软发布PhI-3-Vision模型,提升视觉AI效率

微云疏影 来源:综合整理 作者:综合整理 2024-05-28 11:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

5 月 28 日,微软在 Build 2024 大会上推出了最新的 Phi-3 系列成员——Phi-3-vision。这一工具主打视觉应用,能有效处理图片文字信息,且在移动设备上也能运行自如。

Phi-3-vision 是一种小型多模式语言模型(SLM),主要适用于本地人工智能场景。其模型参数高达 42 亿,上下文序列包含 128k 个符号,可满足各种视觉推理和其他任务需求。

Microsoft 通过一篇新发表的论文[PDF]展示了 Phi-3-vision 的强大实力。与其他模型如 Claude 3-haiku、Gemini 1.0 Pro 相比,Phi-3-vision 毫不逊色。

此外,Microsoft 还对 Phi-3-vision 进行了多项测试,并将其与其他竞品模型进行了比较,包括字节跳动的 Llama3-Llava-Next(8B)、微软研究院与威斯康星大学、哥伦比亚大学联合开发的 LlaVA-1.6(7B)以及阿里巴巴通义千问 QWEN-VL-Chat 模型等。结果表明,Phi-3-vision 在多个项目中的表现均十分出色。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6752

    浏览量

    108076
  • 人工智能
    +关注

    关注

    1820

    文章

    50316

    浏览量

    266894
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11341
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能多模态与视觉模型开发实战 - 2026必会

    和训练,模型可以逐渐提升对图像的理解能力,实现对各种视觉任务的精准处理。 此外,视觉模型的发展还得益于大规模数据集和强大计算资源的支持。海
    发表于 04-15 16:06

    骏驰新程,视联智造,Vision China 2026(上海)机器视觉展圆满落幕

    2026年3月25日-27日,为期三天的中国(上海)机器视觉展暨机器视觉技术及工业应用研讨会【Vision China 2026(上海)】,在上海新国际博览中心落下帷幕。本次展会由机器
    的头像 发表于 03-30 11:51 539次阅读
    骏驰新程,视联智造,<b class='flag-5'>Vision</b> China 2026(上海)机器<b class='flag-5'>视觉</b>展圆满落幕

    NVIDIA 发布开放物理 AI 数据工厂 Blueprint,加速机器人、视觉 AI 智能体和智能汽车开发

    新闻摘要: 该蓝图支持大规模数据处理与整理、合成数据生成、强化学习以及物理 AI 模型的评估,适用于视觉 AI 智能体、机器人和智能汽车。 包括 Microsoft Azure 和 N
    的头像 发表于 03-17 11:03 315次阅读
    NVIDIA <b class='flag-5'>发布</b>开放物理 <b class='flag-5'>AI</b> 数据工厂 Blueprint,加速机器人、<b class='flag-5'>视觉</b> <b class='flag-5'>AI</b> 智能体和智能汽车开发

    3月赴沪!Vision China 2026(上海)邀你共探机器视觉AI、机器人的融合未来

    2026年3月25-27日,亚洲机器视觉领域风向标——Vision China 2026(上海)机器视觉展,即将于上海新国际博览中心W4&W5馆震撼启幕!本届展会以 “
    的头像 发表于 01-13 15:30 615次阅读
    <b class='flag-5'>3</b>月赴沪!<b class='flag-5'>Vision</b> China 2026(上海)邀你共探机器<b class='flag-5'>视觉</b>与<b class='flag-5'>AI</b>、机器人的融合未来

    更理想的AI视觉芯,RV1126B系列核心板发布

    AI视觉
    飞凌嵌入式
    发布于 :2026年01月09日 14:14:17

    微软最新研发微流体冷却系统助力散热效率提升最高三倍

    AI技术芯片的功耗和热量不断攀升,散热成为技术进步新瓶颈。微软最新研发的微流体冷却系统突破传统冷板限制,将液体冷却剂直接引入芯片内部,散热效率提升最高
    的头像 发表于 11-17 09:39 956次阅读

    AI技术赋能质检,提升效率和精准的双提升

     在元幂境看来,在当今智能化与数字化发展的新时代,传统的巡检模式因为效率低、准确率不高、标准不一等瓶颈已经严重推动自动化、智能化发展。而随着计算机视觉、深度学习、大数据分析为核心的AI质检技术,正
    的头像 发表于 11-12 15:49 737次阅读

    Vision China 2025(深圳)今日开幕,聚焦“VISION+AI 赋能电子制造升级”

    会展中心(宝安)9号馆隆重启幕。展会为期 3天 ,本届展会以 “VISION+AI赋能电子制造升级” 为主题,聚焦人工智能与机器视觉技术在电子制造全产业链中的融合与创新,预计将吸引超过 16.5万名 专业观众参与。 在人工智能加
    的头像 发表于 10-29 14:18 399次阅读

    深兰科技发布AI法务大模型产品

    近日,深兰科技发布面向律所与企业法务部门的AI法务大模型产品——“深兰律师办公自动化系统(AI版)”。通过AI技术赋能法律服务行业,它能够显
    的头像 发表于 10-23 17:58 1237次阅读

    工业视觉网关:RK3576赋能多路检测与边缘AI

    IPC+独显的组合。 二、方案核心:多路检测 + 编解码 + 边缘AI + MES对接多路并发采集RK3576 提供 3×4-lane MIPI-CSI,配合视频转换模块可并发接入 12路
    发表于 10-16 17:56

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    微软Visual Studio 2026 发布AI 深度融合、性能提升

    “  微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前
    的头像 发表于 09-16 11:17 2338次阅读
    <b class='flag-5'>微软</b>Visual Studio 2026 <b class='flag-5'>发布</b>!<b class='flag-5'>AI</b> 深度融合、性能<b class='flag-5'>提升</b>

    日本航空携手微软率先将AI应用引入客舱管理

    日本航空(JAL)携手微软,率先将AI应用引I入客舱管理。通过基于微软Phi-4小型语言模型(SLM)开发的JAL-
    的头像 发表于 07-18 11:12 1567次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14

    全球各大品牌利用NVIDIA AI技术提升运营效率

    欧莱雅、LVMH 集团和雀巢利用 NVIDIA 加速的智能体 AI 和物理 AI,大幅提升产品设计、营销及物流等方面的运营效率
    的头像 发表于 06-19 14:36 1351次阅读