0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NaVILA:加州大学与英伟达联合发布新型视觉语言模型

科技绿洲 来源:网络整理 作者:网络整理 2024-12-13 10:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日前,加州大学的研究人员携手英伟达,共同推出了一款创新的视觉语言模型——NaVILA。该模型在机器人导航领域展现出了独特的应用潜力,为智能机器人的自主导航提供了一种全新的解决方案。

视觉语言模型(VLM)是一种具备多模态生成能力的先进AI模型。它能够智能地处理文本、图像以及视频等多种提示,并通过复杂的推理过程,实现对这些信息的准确理解和应用。NaVILA正是基于这一原理,通过将大型语言模型(LLM)与视觉编码器进行巧妙的结合,从而赋予了LLM“视觉感知”的神奇能力。

这一创新性的结合,使得NaVILA在机器人导航领域展现出了卓越的性能。它能够根据环境中的视觉信息,结合文本指令或描述,为机器人提供精确的定位和导航服务。这一特性不仅提高了机器人的自主性和智能化水平,还为机器人在复杂环境中的应用提供了更加广阔的空间。

NaVILA的发布,标志着视觉语言模型在机器人导航领域取得了重要的突破。未来,随着技术的不断发展和完善,相信NaVILA将在更多领域展现出其独特的价值和潜力,为人工智能技术的发展和应用贡献更多的力量。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30580

    浏览量

    219566
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11255
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97669
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伟发布专注于自动驾驶的视觉语言动作模型

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年12月02日 13:54:15

    今日看点:象帝先推出首款量产Imagination DXD GPU显卡;小米汽车累计交付突破 50 万台

    英伟发布专注于自动驾驶的视觉语言动作模型 近日,英伟
    发表于 12-02 10:24 685次阅读

    英伟发布 NVQLink 开放系统架构;国内首个汽车芯片标准验证平台投入使用

    英伟发布 NVQLink 开放系统架构 在华盛顿特区举行的英伟全球技术大会上,英伟
    发表于 10-29 10:33 994次阅读

    天合储能联合发布大规模储能技术应用及产业发展白皮书

    9月26日,2025 年大规模储能技术创新与应用研讨会在华北电力大学成功举办。会上,天合储能与华北电力大学联合发布《大规模储能技术应用及产业发展白皮书》(以下简称《白皮书》), 聚焦储能技术在能源转型中的关键作用与发展机遇,为推动行业高质量发展提供前瞻洞察。
    的头像 发表于 09-30 16:36 1551次阅读

    中科创与吉利汽车、NVIDIA联合发布创新产品AIBOX

    2025年9月9日,在2025德国国际汽车及智慧出行博览会(IAA MOBILITY)上,中科创(ThunderSoft,股票代码:300496)携手吉利汽车集团联合发布基于NVIDIA的创新
    的头像 发表于 09-10 09:05 833次阅读

    特朗普要叫停英伟对华特供版 英伟H20出口限制 或损失55亿美元

    据外媒报道,英伟公司发布了一项通知称,美国政府于9日告知英伟公司;特供版的H20芯片出口到中国需要许可证,紧接着在14日又告知
    的头像 发表于 04-16 16:59 1889次阅读

    英伟Cosmos-Reason1 模型深度解读

    英伟近期发布的 Cosmos-Reason1 模型在物理常识推理领域引发广泛关注。作为专为物理世界交互设计的多模态大语言
    的头像 发表于 03-29 23:29 2615次阅读

    英伟GROOT N1 全球首个开源人形机器人基础模型

    英伟GROOT N1 全球首个开源人形机器人基础大模型
    的头像 发表于 03-20 11:05 1692次阅读

    ​VLM(视觉语言模型)​详细解析

    视觉语言模型(Visual Language Model, VLM)是一种结合视觉(图像/视频)和语言(文本)处理能力的多模态人工智能
    的头像 发表于 03-17 15:32 7577次阅读
    ​VLM(<b class='flag-5'>视觉</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>)​详细解析

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    在美东时间周一,美股三大指数集体收跌,截至收盘,英伟股价下跌超8%,英伟市值一夜蒸发2650亿美元(换算下来约合人民币19345亿元);目前英伟
    的头像 发表于 03-04 10:19 988次阅读

    英伟开发新型内存模组SOCAMM,或年底量产

    据韩媒近日报道,英伟已在内部成功研发出一种新型内存模组,命名为SOCAMM。这一创新成果不仅标志着英伟在内存技术领域的又一次突破,也预示
    的头像 发表于 02-19 11:41 1195次阅读

    一文详解视觉语言模型

    视觉语言模型(VLM)是一种多模态、生成式 AI 模型,能够理解和处理视频、图像和文本。
    的头像 发表于 02-12 11:13 3241次阅读
    一文详解<b class='flag-5'>视觉</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    英伟发布DeepSeek R1于NIM平台

    网站上发布。 据悉,DeepSeek R1 NIM微服务是英伟在人工智能领域的一项重要创新,旨在为用户提供高效、精准的推理服务。在单个英伟
    的头像 发表于 02-05 14:48 914次阅读

    英伟发布Nemotron-CC大型AI训练数据库

    近日,英伟在其官方博客上宣布了一项重大进展,推出了一款名为Nemotron-CC的大型英文AI训练数据库。这一数据库的发布,标志着英伟
    的头像 发表于 01-14 14:14 792次阅读

    英伟发布Cosmos世界基础模型

    近日,在2025年1月6日于拉斯维加斯拉开帷幕的国际消费类电子产品展览会(CES)上,英伟宣布了一项重大创新——Cosmos世界基础模型平台。该平台集成了先进的生成世界基础模型,旨在
    的头像 发表于 01-09 10:23 941次阅读