5 月 28 日,微软在 Build 2024 大会上推出了最新的 Phi-3 系列成员——Phi-3-vision。这一工具主打视觉应用,能有效处理图片文字信息,且在移动设备上也能运行自如。
Phi-3-vision 是一种小型多模式语言模型(SLM),主要适用于本地人工智能场景。其模型参数高达 42 亿,上下文序列包含 128k 个符号,可满足各种视觉推理和其他任务需求。
Microsoft 通过一篇新发表的论文[PDF]展示了 Phi-3-vision 的强大实力。与其他模型如 Claude 3-haiku、Gemini 1.0 Pro 相比,Phi-3-vision 毫不逊色。
此外,Microsoft 还对 Phi-3-vision 进行了多项测试,并将其与其他竞品模型进行了比较,包括字节跳动的 Llama3-Llava-Next(8B)、微软研究院与威斯康星大学、哥伦比亚大学联合开发的 LlaVA-1.6(7B)以及阿里巴巴通义千问 QWEN-VL-Chat 模型等。结果表明,Phi-3-vision 在多个项目中的表现均十分出色。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
微软
+关注
关注
4文章
6752浏览量
108076 -
人工智能
+关注
关注
1820文章
50316浏览量
266894 -
语言模型
+关注
关注
0文章
575浏览量
11341
发布评论请先 登录
相关推荐
热点推荐
人工智能多模态与视觉大模型开发实战 - 2026必会
和训练,模型可以逐渐提升对图像的理解能力,实现对各种视觉任务的精准处理。
此外,视觉大模型的发展还得益于大规模数据集和强大计算资源的支持。海
发表于 04-15 16:06
骏驰新程,视联智造,Vision China 2026(上海)机器视觉展圆满落幕
2026年3月25日-27日,为期三天的中国(上海)机器视觉展暨机器视觉技术及工业应用研讨会【Vision China 2026(上海)】,在上海新国际博览中心落下帷幕。本次展会由机器
NVIDIA 发布开放物理 AI 数据工厂 Blueprint,加速机器人、视觉 AI 智能体和智能汽车开发
新闻摘要: 该蓝图支持大规模数据处理与整理、合成数据生成、强化学习以及物理 AI 模型的评估,适用于视觉 AI 智能体、机器人和智能汽车。 包括 Microsoft Azure 和 N
3月赴沪!Vision China 2026(上海)邀你共探机器视觉与AI、机器人的融合未来
2026年3月25-27日,亚洲机器视觉领域风向标——Vision China 2026(上海)机器视觉展,即将于上海新国际博览中心W4&W5馆震撼启幕!本届展会以 “
微软最新研发微流体冷却系统助力散热效率提升最高三倍
当AI技术芯片的功耗和热量不断攀升,散热成为技术进步新瓶颈。微软最新研发的微流体冷却系统突破传统冷板限制,将液体冷却剂直接引入芯片内部,散热效率提升最高
AI技术赋能质检,提升效率和精准的双提升
在元幂境看来,在当今智能化与数字化发展的新时代,传统的巡检模式因为效率低、准确率不高、标准不一等瓶颈已经严重推动自动化、智能化发展。而随着计算机视觉、深度学习、大数据分析为核心的AI质检技术,正
Vision China 2025(深圳)今日开幕,聚焦“VISION+AI 赋能电子制造升级”
会展中心(宝安)9号馆隆重启幕。展会为期 3天 ,本届展会以 “VISION+AI赋能电子制造升级” 为主题,聚焦人工智能与机器视觉技术在电子制造全产业链中的融合与创新,预计将吸引超过 16.5万名 专业观众参与。 在人工智能加
深兰科技发布AI法务大模型产品
近日,深兰科技发布面向律所与企业法务部门的AI法务大模型产品——“深兰律师办公自动化系统(AI版)”。通过AI技术赋能法律服务行业,它能够显
工业视觉网关:RK3576赋能多路检测与边缘AI
IPC+独显的组合。
二、方案核心:多路检测 + 编解码 + 边缘AI + MES对接多路并发采集RK3576 提供 3×4-lane MIPI-CSI,配合视频转换模块可并发接入 12路
发表于 10-16 17:56
微软Visual Studio 2026 发布!AI 深度融合、性能提升
“ 微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前
日本航空携手微软率先将AI应用引入客舱管理
日本航空(JAL)携手微软,率先将AI应用引I入客舱管理。通过基于微软Phi-4小型语言模型(SLM)开发的JAL-
最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)
端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
发表于 07-04 11:14
全球各大品牌利用NVIDIA AI技术提升运营效率
欧莱雅、LVMH 集团和雀巢利用 NVIDIA 加速的智能体 AI 和物理 AI,大幅提升产品设计、营销及物流等方面的运营效率。
微软发布PhI-3-Vision模型,提升视觉AI效率
评论