0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Seeing AI帮助盲人和弱视用户“看”世界

NVIDIA英伟达企业解决方案 来源:未知 作者:胡薇 2018-05-15 10:44 次阅读

导盲犬可以很好地帮助盲人或视障人士出行,但是如果想辨别出前面路口的标识,或者想知道钱包里还有多少钱,导盲犬可就办不到了。

由微软AI研究小组开发的应用程序Seeing AI为这个问题给出了解决方案。该应用程序可为盲人和弱视用户描述这个世界,使他们可以使用自己的智能手机来识别一切:包括单个物体、颜色、钞票、文档等。

自去年问世以来,这一应用程序的下载量已突破15万次,执行任务500万次,其中一些任务的服务对象还是全球知名的盲人。

“Stevie Wonder(美国知名艺人)每天都会用,这确实很令人振奋。”微软高级数据科学家Anirudh Koul在3月于圣何塞举行的GPU技术大会上发表演讲时说道。

该应用程序的现场演示就已展现出了其强大的功能。和Koul一同上台的还有他的一位同事,当他在自己的智能手机上运行应用程序,并将手机朝向他的同事时,应用程序描述他看到的是“一位31岁、有着黑头发、戴着眼镜且看起来很开心的男士”。

如果这位同事在他的联系人列表中,则有更佳的使用效果,因为Seeing AI可以与用户的联系人进行整合,并能识别出朋友的名字。

Koul还分享了几个令人叹服的使用案例:一位盲人教师将运行该应用的手机面朝教室门口,这样孩子们就不会因她是盲人而趁机偷偷进出教室;另一位用户在飓风肆虐的地区穿行时,利用这款应用程序避开了倒落的电线和其他障碍物。

Seeing AI的开发始于2014年2月,开发人员曾试图创建一个能发现并识别周围物体的卷积神经网络。但是其延迟时间达10秒,这样的速度不能及时帮助人们快速作出决策。

第二年,微软赞助了一场为期一周的黑客马拉松,活动共吸引了13000人参与,并由此引发了第二次尝试:在用户的头上配备手机。

在使用智能眼镜进行试验后,Koul的团队开始着手于应用程序本身的开发工作。网络本地训练过程在NVIDIA GPU上进行,而较为繁重的工作则交给了基于NVIDIA Tesla P100 GPU运行的Azure云实例。通过逐帧分析确定每一部分训练的发生位置。

AI调优

应用程序需要辨别不同图像,而图像属性具有不确定性,所以开发人员针对此特性对模型进行了训练。例如,如果训练应用程序识别货币,则需要向训练网络内输入不清晰和无背景的货币图片,以及货币某一极小部分放大后的图片,再让其识别出图片的真实内容。

该团队向志愿者征集,最终得到了各种类型的图片,其中包括一张猫咪玩纸币的图片,以及纸币被封在冰块中的照片。通过这些变量对模型进行训练,最终就能够计算出识别图片所需的最小参数。

Koul的团队对网络进行了调整,使其倾向于得出否定性分类或不分类的结果,而不是猜测结果(这样可能将5元钞票识别成10元),因为猜测很显然会给盲人用户造成麻烦。

随着用户人数的增多,这款应用程序也将变得越好、越准确。AI将会成为盲人和视障用户的福音。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18053

    浏览量

    177046
  • AI
    AI
    +关注

    关注

    87

    文章

    26413

    浏览量

    264021

原文标题:重见光明:深度学习帮助盲人“看”到世界

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI芯片未来会控制这个世界吗?

    AI芯片行业资讯
    芯广场
    发布于 :2024年03月27日 18:21:28

    谷歌发布全新AI基础世界模型Genie

    谷歌近日宣布推出其最新研发的AI基础世界模型——Genie。这款模型拥有惊人的110亿参数,其独特之处在于,仅需一张图片,便能生成一个充满活力和交互性的虚拟世界用户可以在这个
    的头像 发表于 03-04 14:02 258次阅读

    谷歌发布AI基础世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基础世界模型Genie。这一创新技术允许用户通过单张图像提示,生成一个可玩的、交互式的虚拟环境,从而开启了一个全新的数字体验时代。
    的头像 发表于 02-28 17:41 389次阅读

    Vitis AI用户指南

    电子发烧友网站提供《Vitis AI用户指南.pdf》资料免费下载
    发表于 01-03 10:51 0次下载
    Vitis <b class='flag-5'>AI</b><b class='flag-5'>用户</b>指南

    人类认知如何帮助我们制造更好的AI系统?

    我们重点关注“一致性”问题,即AI系统思考和表征世界的方式与人类相比,有多大的一致性?我们需要做的是进行更多的研究,找出AI系统擅长的事情,并帮助人们了解在哪些情况下可以与这些
    的头像 发表于 11-15 16:34 218次阅读

    #芯片 #AI 世界最强AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    发布于 :2023年11月15日 15:54:37

    对大家玩机器人和STM32有一些帮助

    电子发烧友网站提供《对大家玩机器人和STM32有一些帮助.rar》资料免费下载
    发表于 11-10 16:11 0次下载
    对大家玩机器<b class='flag-5'>人和</b>STM32有一些<b class='flag-5'>帮助</b>

    AMD将AI技术引入笔记本电脑 为用户开启更广阔的数字世界

    引擎三合一处理器。 自此,AMD 将 AI 技术引入笔记本电脑,成为了使工智能技术赋能Windows 设备的引领者。借助AMD Ryzen AI,笔记本将变得比以往更智能、更高效、更易操作,为用户开启更广阔的数字
    的头像 发表于 10-18 11:30 1091次阅读

    AI智能呼叫中心

    可以自动识别和响应来电,通过分析用户的语音、文字和情绪等信息,并给出针对性的应答,与传统的人工处理相比,AI智能呼叫中心能够实现24/7不间断的服务,大幅提高了处理效率和用户满意度。二、个性化服务
    发表于 09-20 17:53

    AMD Ryzen AI帮助用户加速多任务处理

      在过去的几年里,人工智能已经从科幻小说走向了现实,在人类世界中,AI 正在定义下一个计算时代,而且才刚刚开始。 在IDC《AI笔记本电脑引发场景变革》报告中显示,中国人工智能领域市场规模将在未来
    的头像 发表于 09-15 10:05 484次阅读

    重新定义AI性能,为您的机器人和自动驾驶解决方案带来巨大变革

    ROScube 是一个高度通用的模块化机器人控制器系列产品,作为嵌入式边缘 AI 平台的一部分,专为以 AI 为中心的机器人和自动驾驶应用而设计,并由 NVIDIA Jetson 模块提供强大的算力支持。
    的头像 发表于 08-04 15:07 375次阅读
    重新定义<b class='flag-5'>AI</b>性能,为您的机器<b class='flag-5'>人和</b>自动驾驶解决方案带来巨大变革

    Auracast广播音频如何帮助世界听得更清楚

    了一股热潮。 Auracast广播音频所带来的一起聆听、沉浸式聆听和清晰聆听体验将改善您与他人和身边世界的互动。在巴塞罗那和台北Auracast体验活动上,参加者已亲身体验了Auracast广播音频如何帮助
    的头像 发表于 07-04 11:36 941次阅读

    AI 人工智能的未来在哪?

    人工智能、AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI对人类是一种威胁;谷歌前CEO施密特认为AI和机器学习对人类有很大益处。 每个国家
    发表于 06-27 10:48

    视障人士和盲人的图像说明

    电子发烧友网站提供《视障人士和盲人的图像说明.zip》资料免费下载
    发表于 06-12 14:55 0次下载
    视障人士和<b class='flag-5'>盲人</b>的图像说明

    盲人听书机BGA芯片底部填充胶应用

    盲人听书机BGA芯片底部填充胶应用由汉思新材料提供客户产品是盲人听书机。盲人听书机是一款听读产品,符合人体工程学的外形设计,让盲人朋友触摸时手感舒适,能听各种影视语音文件,语音朗读效果
    的头像 发表于 05-30 10:57 339次阅读
    <b class='flag-5'>盲人</b>听书机BGA芯片底部填充胶应用