在Facebook和其他社交媒体平台上最常见的分享内容之一是照片。虽然大多数社交媒体用户都能看懂一张图片,并了解它所代表的内容,但对于那些盲人或视障人士来说就不那么容易了。Facebook表示,屏幕阅读器可以使用合成语音描述这些图片的内容,让盲人或视障用户能够理解Facebook feed中的图片。
然而,许多照片在发布时没有alt文字,导致Facebook在2016年推出了自动替代文本(AAT)。该技术利用对象识别技术为盲人或视障用户按需生成照片的描述。自2016年以来,Facebook一直致力于改进AAT,并在最近推出了下一代技术。Facebook在AAT上的进步改善了用户的照片体验,AAT可以可靠地检测和识别照片中的概念数量扩大了十倍以上。这意味着没有描述的照片减少了,提供的描述也更加详细。AAT可以识别活动、地标、动物类型等等。
AAT现在会给出这样的描述:“可能是两个人的自拍,户外,比萨斜塔”。Facebook还表示,能够在照片中加入有关元素的潜在位置和相对大小的信息是行业首创。它不是简单地描述 “可能是五人的合影”,而是描述成“两个人在照片的中心,另外三个人向边缘分散。”
Facebook表示,这一进步可以帮助盲人或视力受损的用户更好地理解家人和朋友发布照片中的内容。最新版本的AAT使用了一个在数十亿张Instagram公开图片和标签数据上训练出来的模型。训练后产生的模型更加准确,并且在文化和人口统计方面更具包容性。改进后的AAT可以可靠地识别1200多个概念。
责编AJX
-
AI
+关注
关注
89文章
38135浏览量
296735 -
Facebook
+关注
关注
3文章
1432浏览量
58356 -
照片
+关注
关注
0文章
15浏览量
9795
发布评论请先 登录
国内首款AI助盲眼镜发布,1700万视障人士的新眼睛
中国电信携手华为与鼎桥成功试点机械导盲犬解决方案
【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用
腾视科技AI大模型应用:提效、破局与落地,重塑智能新生态
360环视技术推荐的硬件平台:支持多摄像头与三屏异显的理想选择
信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代
Gemini Vision + Raspberry Pi 化身“数字导盲犬”?
RDK加持的导盲眼镜:视障人士的“眼睛外挂”
百度AI手语数字人助力听障人士“听见”声音
海康威视通过IEC 62443-4-1认证
AI赋能锐视测控平台

Facebook通过AI改善视障人士的体验
评论