近期,上海人工智能实验室联手多所知名高校及科技公司,共同开发出全新的基础版本书生·视觉大模型——InternVL。该模型搭载了高达60亿的视觉编码器参数(InternVL-6B),创新性引入对比-生成融合的渐进式对齐技术,有效实现了互联网规模下视觉大模型与语言大模型的精准匹配。
InternVL-6B不仅能高效处理复杂图像中细腻的视觉元素,实现图像到文本的转换功能,而且能够自动解析和理解复杂网页内容,包括解决其中可能存在的数学问题。
此外,自成立以来,上海AI实验室在视觉大模型领域持续推陈出新。2021年,实验室推出了首款具有广泛适用性的巨型视觉模型书生1.0,凭借其单个基本模型便可覆盖分类、目标检测、语义分割、深度估计四大部分;2022年,又发布了升级版视觉大模型InternImage,创新采用动态稀疏卷积作为主要操作手段,开创了非Transformer结构的巨型模型设计新思路,这使得它在包含12种视觉任务在内的多个领域表现优异。
-
编码器
+关注
关注
45文章
3903浏览量
141417 -
人工智能
+关注
关注
1813文章
49734浏览量
261453 -
大模型
+关注
关注
2文章
3440浏览量
4962
发布评论请先 登录
西部数据扩建系统集成测试实验室,以加速客户在持续增长的 AI 和云时代取得成功
【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦!
AI看点:OpenAI启动员工百亿美元售股 上海人工智能实验室开源新模型 济南大数据局与华为签署合作协议
CTI华测检测与戴纳科技签署战略合作,共建AI驱动黑灯实验室
上海贝岭跻身国家认可实验室行列
谷歌新一代生成式AI媒体模型登陆Vertex AI平台
广和通发布新一代AI语音智能体FiboVista
中星微发布最新一代AI芯片“星光智能五号”
实验室安全管理成焦点,汉威科技赋能实验室安全升级
"大模型+智能体"双驱动!中控技术×大华股份成立视觉AI联合实验室

上海AI实验室发布新一代书生·视觉大模型
评论