0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook通过AI改善视障人士的体验

如意 来源:cnBeta.COM 作者:cnBeta.COM 2021-01-21 14:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在Facebook和其他社交媒体平台上最常见的分享内容之一是照片。虽然大多数社交媒体用户都能看懂一张图片,并了解它所代表的内容,但对于那些盲人或视障人士来说就不那么容易了。Facebook表示,屏幕阅读器可以使用合成语音描述这些图片的内容,让盲人或视障用户能够理解Facebook feed中的图片。

然而,许多照片在发布时没有alt文字,导致Facebook在2016年推出了自动替代文本(AAT)。该技术利用对象识别技术为盲人或视障用户按需生成照片的描述。自2016年以来,Facebook一直致力于改进AAT,并在最近推出了下一代技术。Facebook在AAT上的进步改善了用户的照片体验,AAT可以可靠地检测和识别照片中的概念数量扩大了十倍以上。这意味着没有描述的照片减少了,提供的描述也更加详细。AAT可以识别活动、地标、动物类型等等。

AAT现在会给出这样的描述:“可能是两个人的自拍,户外,比萨斜塔”。Facebook还表示,能够在照片中加入有关元素的潜在位置和相对大小的信息是行业首创。它不是简单地描述 “可能是五人的合影”,而是描述成“两个人在照片的中心,另外三个人向边缘分散。”

Facebook表示,这一进步可以帮助盲人或视力受损的用户更好地理解家人和朋友发布照片中的内容。最新版本的AAT使用了一个在数十亿张Instagram公开图片和标签数据上训练出来的模型。训练后产生的模型更加准确,并且在文化和人口统计方面更具包容性。改进后的AAT可以可靠地识别1200多个概念。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38135

    浏览量

    296735
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    58356
  • 照片
    +关注

    关注

    0

    文章

    15

    浏览量

    9795
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国内首款AI助盲眼镜发布,1700万人士的新眼睛

    在国际残疾人日(12 月 3 日)这一天,杭州瞳行科技公司正式发布国内首款 AI 助盲眼镜。该眼镜由眼镜主体、手机、遥控指环、盲杖四部分组成,目前已正式面市。
    的头像 发表于 12-05 20:19 1985次阅读
    国内首款<b class='flag-5'>AI</b>助盲眼镜发布,1700万<b class='flag-5'>视</b><b class='flag-5'>障</b><b class='flag-5'>人士</b>的新眼睛

    国内首款AI助盲眼镜发布,1700万人士的新眼睛#人工智能

    行业资讯
    jf_15747056
    发布于 :2025年12月05日 18:45:09

    中国电信携手华为与鼎桥成功试点机械导盲犬解决方案

    近日,中国电信携手华为与鼎桥在上海成功试点了基于网络内生智能与5G大上行的机械导盲犬解决方案,为人士打造全新的智能出行模式。依托中国电信云网融合能力,结合边缘云与高性能机器人技术,该试点有效验证了方案在辅助
    的头像 发表于 11-25 14:56 341次阅读

    什么是AI算力模组?

    未来,腾科技将继续深耕AI算力模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾科技的
    的头像 发表于 09-19 15:26 1155次阅读
    什么是<b class='flag-5'>AI</b>算力模组?

    什么是AI算力模组?

    未来,腾科技将继续深耕AI算力模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾科技的
    的头像 发表于 09-19 15:25 432次阅读
    什么是<b class='flag-5'>AI</b>算力模组?

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    是一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说 这可能吗? 用机器来生成假说: 1、直接生成 生成式
    发表于 09-17 11:45

    科技AI大模型应用:提效、破局与落地,重塑智能新生态

    在这场数字化转型的浪潮中,腾科技AI大模型凭借其强大的提效能力、破局的创新思维以及切实的落地实践,已然成为重塑智能新生态的重要力量。从企业办公中的高效决策支持,到教育科研里的学术探索助力;从工业物
    的头像 发表于 08-18 14:06 1503次阅读
    腾<b class='flag-5'>视</b>科技<b class='flag-5'>AI</b>大模型应用:提效、破局与落地,重塑智能新生态

    INDEMIND三目AI-脏污检测模组,扫地机器人的“全能副手”

    新一代视觉避模组
    的头像 发表于 08-08 15:54 614次阅读

    360环技术推荐的硬件平台:支持多摄像头与三屏异显的理想选择

    在智能硬件不断升级的今天,360环技术早已不只是豪华车型的专属。通过布置多路摄像头,并将其图像进行融合处理,360环可以为系统提供车辆或设备周围的完整视野。 它不仅能够消除盲区,还能通过
    发表于 07-30 17:32

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    前的精准预警,大幅缩短响应时间。l 自动化根因定位:颠覆传统人工逐层排(物理层→协议层→应用层)模式。AI推理引擎通过关联分析设备日志、拓扑关系、历史故障库等多维度数据,在极短时间内精准定位故障根源
    发表于 07-16 15:29

    Gemini Vision + Raspberry Pi 化身“数字导盲犬”?

    。关键要点包括:1.项目灵感:程序员因眼睛疲劳引发思考,结合AutoBerryPi项目,想为人士创造了解周围环境的设备。2.项目功能:能进行图像描述,将图片和
    的头像 发表于 03-25 09:20 1707次阅读
    Gemini Vision + Raspberry Pi 化身“数字导盲犬”?

    RDK加持的导盲眼镜:人士的“眼睛外挂”

    我国有超1700万人士,如何让他们更安全、自主地出行?别担心,智能瞳行来啦!这是一款“自带外挂”的导航神器,集成了高精度视觉传感和YOLO算法,实时识别障碍物、行人、交通标志,并通过
    的头像 发表于 03-14 19:43 1116次阅读
    RDK加持的导盲眼镜:<b class='flag-5'>视</b><b class='flag-5'>障</b><b class='flag-5'>人士</b>的“眼睛外挂”

    百度AI手语数字人助力听人士“听见”声音

    近几年,百度先后与天津理工大学、鲸言科技合作,共同研发出百度智能云曦灵AI手语平台与双向手语翻译机,让手语的“声音”,被更多人听见。
    的头像 发表于 02-21 11:29 1300次阅读

    海康威通过IEC 62443-4-1认证

    近日,海康威通过IEC 62443-4-1认证。IEC 62443-4-1标准是工业自动化和控制系统网络安全标准的重要组成部分,这一认证标志着海康威在工业领域能够为全球客户设计、生产和交付安全可靠的产品和服务。
    的头像 发表于 02-13 10:27 882次阅读
    海康威<b class='flag-5'>视</b><b class='flag-5'>通过</b>IEC 62443-4-1认证

    AI赋能锐测控平台

    与微软开发工具(Visual Studio)的紧密连接,锐测控平台在AI技术的快速演进中展现出独特优势,可以使国内工程师能够率先在测试领域应用AI技术,走在国际前列。 锐测控平台目
    的头像 发表于 02-10 09:23 872次阅读
    <b class='flag-5'>AI</b>赋能锐<b class='flag-5'>视</b>测控平台