0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌I/O在音视频领域中有哪些技术值得被关注?

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-05-26 10:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

时隔两年Google I/O大会再次与大家见面。虽然去年的大会因新冠疫情被迫取消,但技术的迭代发展却未被打断,反而因疫情的影响促使了技术的创新变得愈加以人们的需求为首要考量,从而变得更具人性化也更具智能化。

“在重要的时刻提供帮助”——是此次谷歌 I/O 2021大会的主题。从充满人情味的主题开场,并围绕AI在视频聊天、地图、医疗诊断、数据安全等方面发布了一系列最新的技术进展。而在音视频领域中最值得关注的是:全息视频聊天技术——Project Starline,谷歌AI芯片的最新版本——TPU v4,以及基于AI模型的皮肤病问诊应用程序。

Project Starline 3D视频聊天新体验

Project Starline 3D视频聊天互动 演示

该项技术可以说是本次大会的绝对黑科技了,使一些无法进行线下见面的人们(如:疫情影响)能够在同一空间中进行实时的3D互动聊天。据悉,Project Starline利用全息影像技术打破人们身处不同空间的隔阂,并与传统的视频聊天的区别在于,让你想见到的人就“坐”在你对面,感觉像是真的在你身边一样。

而为了实现这一技术,在硬件部分谷歌采用了65英寸的光场显示器,并配备了定制高分辨率传感器和数十个景深扫描传感器,从多个角度捕捉用户的外貌和动作,然后进行融合,并在联合驱动下生成流畅细致的实时3D模型。由于其所产生的数据每秒高达数千兆字节,因此,对于在现有网络上发送如此之大的图像,谷歌研发了新的压缩和流算法,可将数据减少100倍以上。

而在软件部分则是通过在计算机视觉机器学习、空间音频和数据压缩技术等方面数年之久的开发,通过硬件与软件的整合才得以实现今天的Project Starline。除此之外,突破性的光场系统也是支持这一技术的亮点,让人们可以免去佩戴眼镜、耳机就能体验到逼真的体积和深度感。

目前Project Starline仅在谷歌的几个办公室中被应用,由于它依赖于定制的硬件和高度专业化的设备,还未在市场中进行推广。

新定制AI芯片TPU v4:性能提升10倍

在谷歌 I/O大会中还推出了谷歌最新定制的AI芯片——TPU v4。这类定制芯片对其所要处理的AI任务有着数量级的性能优势,如图像识别、语音助手、视频、视觉计算处理等。而TPU v4的动力来源于v4芯片,其速度是v3(上一个TPU版本)的两倍以上。TPU v4:一个Pods里面有4069个v4芯片,可以提供每秒 10^18 次浮点运算;并提供一个exaflop以上的容量,相当于一千万台笔记本电脑的计算能力之和,性能比上一代提升了10倍。Sundar Pichai表示:“这是我们部署过的最快的系统,对我们来说是一个历史性的里程碑”。而全球超算TOP 500排行榜第一名的日本富岳的最高性能也只有它的一半。

TPU v4芯片托盘

谷歌TPU之所以能够做到效率提高是在于:它可将看似相互独立的数百块芯片转为密切互联的单个系统来使用。Sundar Pichai谈到:“每块芯片的互连带宽是其他网络技术的10倍”。并透露会在年底对开发者开放使用。

另外,TPU v4在提高效率的同时,其数据中心也将以90%(或接近)的无碳能源运行。

AI“问诊”:针对皮肤病的诊断新功能

本次谷歌 I/O大会的另一个亮点便是AI“问诊”。这是一个由AI驱动的皮肤病学辅助工具的预览,能够帮助人们了解自身皮肤、头发和指甲等有关的问题。并使用很多与CT扫描相同的技术来检测一些眼部疾病或肺癌。可通过手机的摄像头来识别皮肤病,如手臂上的皮疹。

其具体工作原理是基于Web应用程序,通过上传拍摄的图片,利用AI模型来分析图片中所出现的症状信息,从而为用户提供与之匹配的条件列表。对于条件列表中的每个匹配条件,都源自于皮肤科医生审核过的信息和常见问题的答案,以及来自网络中的类似匹配图像。

然而,值得注意的是该应用程序所得出的匹配结果并不能作为诊断依据,也不能替代医学建议,因为许多情况还是需要在医院中进行专业的检查。因此,该应用的意义在于希望用户在此访问到权威信息,为下一步做出更为明智的决定。

该款应用工具已经过3年的机器学习研究和产品开发,并发表了多篇同行评审的论文,以验证其AI模型。除此之外,谷歌的深度学习方法对皮肤病的评估还曾发表于《自然医学》杂志中,并表明其AI系统可以达到与美国董事会认证的皮肤科医生相同的准确性。目前,为该款应用程序所提供的AI模型已成功通过了临床认证,其应用程序在欧盟也获得了CE标记为I类医疗设备。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54644

    浏览量

    471041
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303098
  • 计算机视觉
    +关注

    关注

    9

    文章

    1716

    浏览量

    47763
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137425
  • TPU
    TPU
    +关注

    关注

    0

    文章

    176

    浏览量

    21734

原文标题:谷歌 I/O 2021 在音视频领域中有哪些技术值得被关注?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    C++实战FFmpeg音视频编码实战屏幕录像机视频课程-基于QT5和ffmpeg sdk

    技术已从单纯的“播放与录制”进化为连接物理世界与数字智能的核心纽带。尽管Qt框架已迭代至Qt6,且各类高级封装库层出不穷,但QT5与FFmpeg的组合,依然是音视频开发领域不可撼动的“黄金搭档”。这
    的头像 发表于 04-21 15:27 689次阅读

    MAX4079:完整的音视频后端解决方案

    解决方案。Maxim 公司的 MAX4079 芯片就是这样一款优秀的产品,它为音视频处理提供了完整的解决方案。本文将详细介绍 MAX4079 的特点、应用、电气特性等方面的内容,希望能为电子工程师设计相关产品时提供参考。 文件下载: MAX4079CUG+.pdf 二、
    的头像 发表于 04-03 12:50 367次阅读

    车载音视频系统环境试验方法全解析:从高温到EMC测试

    车载音视频系统环境试验是指通过模拟车辆实际使用过程中可能遇到的各种极端环境条件(如温度、湿度、振动、电磁干扰等),对车载信息娱乐系统(IVI)、显示屏、音响、摄像头等音视频设备进行可靠性、安全性
    的头像 发表于 03-25 16:49 493次阅读
    车载<b class='flag-5'>音视频</b>系统环境试验方法全解析:从高温到EMC测试

    从 “卡脖子” 到 “自主可控”,音视频分布式系统国产化实践之路

    持续升级,导致国内音视频领域面临核心器件供应不稳定、技术迭代受限、信息安全存在隐患等多重挑战。在此背景下,国内领先的音视频技术企业主动突破,
    的头像 发表于 03-02 11:18 435次阅读
    从 “卡脖子” 到 “自主可控”,<b class='flag-5'>音视频</b>分布式系统国产化实践之路

    高清混合转换器:模块化技术重塑音视频信号转换行业格局

    近日,一款全新的高清混合转换器成都某产品发布中心正式亮相。作为国内首款采用模块化、插卡式设计的高清数模混合转换器,该产品的推出在音视频行业引发广泛关注,其创新设计打破了传统信号转换器的固有模式,为
    的头像 发表于 02-11 11:09 488次阅读
    高清混合转换器:模块化<b class='flag-5'>技术</b>重塑<b class='flag-5'>音视频</b>信号转换行业格局

    洲明科技荣获2025年度音视频行业品牌评选九项大奖

    2025年12月20日,由DAV数字音视工程网与《数字音视工程》杂志联合主办的第17届音视频行业品牌评选结果正式揭晓。
    的头像 发表于 12-28 11:45 902次阅读

    打破国外垄断!自主分布式音视频方案筑牢行业安全根基

    在当前的全球音视频芯片市场中,国外公司一直占据着主导地位,然而,近年来国外对中国芯片行业的打压让国内音视频行业的发展面临了巨大的挑战。在这样的背景下,国内领先的音视频技术企业挺身而出,
    的头像 发表于 12-19 11:28 530次阅读
    打破国外垄断!自主分布式<b class='flag-5'>音视频</b>方案筑牢行业安全根基

    三款PXIe板卡科普:解锁专业音视频处理的核心力量

    一、KS-PXIe638:8通道音视频采集的“数据捕捉能手” 航空航天测控、工业自动化等对数据采集精度要求极高的领域,一款稳定高效的音视频采集板卡至关重要,KS-PXIe638型8通
    的头像 发表于 12-04 17:04 1123次阅读
    三款PXIe板卡科普:解锁专业<b class='flag-5'>音视频</b>处理的核心力量

    KS-PXIe638 型 8 通道音视频采集板:高清同步采集,专业场景 “性能标杆”

    航空航天的数据记录、工业测控的实时监测、交通控制的画面留存等专业场景中,多通道、高保真的音视频采集是核心诉求 ——KS-PXIe638 型 8 通道音视频采集板,依托高速 FPGA 架构,以 8
    的头像 发表于 11-26 13:24 658次阅读
    KS-PXIe638 型 8 通道<b class='flag-5'>音视频</b>采集板:高清同步采集,专业场景 “性能标杆”

    音视频编解码封装解封装部件介绍

    是否有探索开源鸿蒙音视频编解码技术的欲望?是否对开源鸿蒙音视频编解码格式支持有诉求?别急——今天这份开源鸿蒙AVCodec Kit介绍文章,就是解答疑惑的指南!参考这份指南,可以使用开源鸿蒙的
    的头像 发表于 10-31 09:15 737次阅读
    <b class='flag-5'>音视频</b>编解码封装解封装部件介绍

    2025 湾芯展精彩落幕,时擎科技分享AI音视频芯片领域最新成果

    AI音视频芯片领域技术前瞻与市场洞察,吸引了众多与会者与行业伙伴的关注。研发副总裁深度解读行业趋势展会期间,时擎科技研发副总裁仇健乐先
    的头像 发表于 10-20 17:36 1575次阅读
    2025 湾芯展精彩落幕,时擎科技分享AI<b class='flag-5'>音视频</b>芯片<b class='flag-5'>领域</b>最新成果

    音视频开发全栈解析

    Media Kit 让开发者可以调用系统的音视频能力,涵盖播放、录制、录屏、元数据提取与转码六大核心功能模块,支撑系统应用与第三方应用在视频播放、内容创作、教学录屏、直播互动等典型场景下的音视频处理需求。
    的头像 发表于 09-18 14:42 1149次阅读
    <b class='flag-5'>音视频</b>开发全栈解析

    千视电子受邀亮相2025音视频产业链研讨会,引领全链路音视频IP化新趋势

    2025年8月22日,由中国电子音响行业协会和湖南省工业和信息化厅联合主办的“2025音视频产业链发展研讨暨对接会”长沙举行。活动汇聚音视频产业链上下游企业,以及长沙市相关政府领导与行业
    的头像 发表于 08-27 11:33 1641次阅读
    千视电子受邀亮相2025<b class='flag-5'>音视频</b>产业链研讨会,引领全链路<b class='flag-5'>音视频</b>IP化新趋势

    雷曼光电COB超高清显示屏落地马栏山音视频实验室

    雷曼光电凭借Micro LED领域的深厚技术积累和雷曼COB超高清显示产品的卓越性能,为湖南长沙马栏山音视频实验室打造了核心显示方案。
    的头像 发表于 07-09 17:05 1386次阅读

    泰芯半导体推出星闪音视频无线SOC芯片TXW828

    短距离无线通信技术加速迭代的浪潮中,珠海泰芯半导体有限公司全球首先发布支持星闪(NearLink)标准的音视频无线SOC芯片——TXW828。这款集WiFi/蓝牙BLE/星闪三模融合音视频
    的头像 发表于 06-20 15:51 3244次阅读