0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Eros Now利用Google Cloud实现AI驱动的字幕功能

倩倩 来源:慧译讲视频,风尚网,互 作者:慧译讲视频,风尚 2021-03-15 13:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google 用三个项目:Live Transcribe、Live Caption、Live Relay,来帮助听障人群融入正常社会,实现无障碍沟通。

1 Live Transcribe(实时转录):打开应用软件后,手机设备可以实时监听周围环境中的语音,并实时显示出对应的文字。

2 Live Caption(实时字幕):使用自动语音识别,为视频添加字幕。适用于播放音频的任何媒体,包括视频,音频等消息,尤其是无字幕的直播,甚至和家人视频聊天,都可以实时添加字幕。

3 Live Relay(实时语音)基于Live Transcribe的实时的文字转语音的产品,以便聋哑人在打电话需求场景下,能打字转换成语音播放达到沟通目的。

Eros Now周二表示,它已与Google Cloud合作,使用后者的AI技术,以自动字幕的形式流式传输其全部电影和原著。

AI驱动的字幕功能将首先以阿拉伯语提供。该公司表示,语言支持将迎合喜欢印度电影和其他消费印度娱乐内容市场的“大量阿拉伯观众”。

Eros Now还详细说明了其如何在其流媒体平台上使用尖端技术。

“通过使用AI框架和大量预先存在的数据,Eros Now的内部数据科学团队模拟,培训和开发了一种先进的模型,该模型的性能相当于人类,并且能够生成所需的字幕电影和原著中使用的语言”,该公司在一份新闻稿中说。

该公司表示,该部署将有助于推动更高的消费者参与度,并为“文本到语音”自动化打开新的机会窗口。该公司指出,该模型可用于不同类型和语言。

“应对性别非中立语言以及各种使用不同语言的标点符号只是最大的挑战中的几个。自动化过程花了六个月的时间才能使数据科学家完善。”该公司补充说。

Eros Now由Eros STX Global Corporation拥有。OTT平台拥有使用印地语和当地语言发行的12,000多部电影的权利。截至2020年9月,该平台拥有超过2.11亿注册用户和3,620万付费用户。

过去,爱神(Eros)也尝试了其他新时代的技术。去年,它与美国视频游戏和软件公司Epic Games合作,将“虚幻引擎”技术引入了印度电影。以Fortnite之类的游戏而闻名的Epic Games表示,它将提供实时渲染,更好的VFX和虚拟制作等技术。

在2019年,Eros Now与Microsoft合作,利用Azure云平台托管和流传输其数字视频产品。

利用Google Assistant 中由AI驱动的新功能非常方便

在Google助手首次为家庭采用解释器模式大约一年后,该功能终于在移动设备上发布。这是根据最近的报道援引Google自己的话说的,该模式即将到来。

为清楚起见,解释器模式是一种实时翻译器,可以进行对话。因此,使用后,用户将能够阅读和听到某人对他们说的另一种语言的翻译。他们还可以进行交谈或点击智能回复并键入回复。

Google助理会以相应的语言大声朗读所有内容。用户不必为外国的发音和语法上的细微差别而苦恼。目前,一长串可用的语言总共有44种。明显的内容包括德语,法语和类似的通用语言。但是Google也包含了一些在世界许多地方都不太常用的东西。

例如,用于移动设备的新解释器模式可以帮助用户说泰语或其他常用但使用较少的语言。

利用Google Assistant 中由AI驱动的新功能非常方便。实际上,通常只需在“ Okay”或“ Hey Google”之后加上几个字即可使事情向前发展。关键短语也很简单。因此,整个过程和小程序的使用应非常直观,而不是要求口头体操来完成。

例如,用户可以说“嘿Google,帮我说西班牙语”。正如所暗示的那样,该短语将在西班牙语的解释器模式下启动。“好吧,谷歌,当我的泰语翻译者”同样可以很好地工作。

从那里开始,Google的解释器模式将按预期工作。口语单词会在屏幕上翻译并大声说出来。智能答复似乎可以从中选择,当然,还会显示一个键盘图标来键入响应。语音响应也会被捕获,并以其他语言大声朗读。

Google似乎并未提供太多有关哪些移动设备将能够使用由Assistant AI支持的新解释器模式的确切信息。但是,它确实说它正在同时出现在iOSAndroid上。该模式将通过更新到达。可以从App Store或Google Play商店中找到专门用于Google Assistant应用程序的内容。

这意味着,尽管它现在正在推出,但要花一些时间才能敲打那里的所有设备。部署通常需要几个星期才能完成。

(慧译讲视频,风尚网,互联网分析沙龙网综合整理 )

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1819

    浏览量

    60697
  • 流媒体
    +关注

    关注

    1

    文章

    200

    浏览量

    17248
  • 解释器
    +关注

    关注

    0

    文章

    103

    浏览量

    7032
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm携手Google Cloud推进代理式AI基础设施规模化落地

    Google Cloud 正通过多项升级举措,稳步推进代理式人工智能 (Agentic AI) 的规模化落地。此次更新包含全新 TPU 8t 和 TPU 8i 系统,同时在 Google
    的头像 发表于 05-06 09:41 439次阅读
    Arm携手<b class='flag-5'>Google</b> <b class='flag-5'>Cloud</b>推进代理式<b class='flag-5'>AI</b>基础设施规模化落地

    NVIDIA与Google Cloud携手推进代理式与物理AI发展

    企业可以使用 NVIDIA Vera Rubin 驱动的 A5X 实例 (可扩展至近 100 万个 Rubin GPU)、Google Distributed Cloud 上的 Gemini、机密
    的头像 发表于 04-27 15:35 605次阅读

    NetApp与Google Cloud深化合作:重构分布式云数据基础设施的“安全主权”新范式

    NetApp与Google Cloud签署四年期企业级协议,通过NetApp存储解决方案与Google Distributed Cloud(GDC)的深度集成,为全球企业构建“全栈物理
    的头像 发表于 04-27 11:04 1368次阅读

    Cadence 与 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 上扩展 AI 驱动的芯片设计

    Cadence ChipStack AI Super Agent 集成 Google Gemini 模型,加速新一代代理驱动型设计自动化 Cadence近日宣布与 Google
    的头像 发表于 04-24 13:22 230次阅读

    Cadence与Google合作,利用ChipStack AI Super Agent在Google Cloud上扩展AI驱动的芯片设计

    设计 AI 计算软件领域的行业领导者楷登电子(美国 Cadence 公司,NASDAQ:CDNS)近日宣布与 Google Cloud 达成战略合作 ,利用
    的头像 发表于 04-24 10:36 2468次阅读

    昆仑天工Skywork与Google Cloud深度合作发布桌面级Agent

    天工 Skywork 如何通过 Google 的 Gemini 3 模型家族,并结合 Google Distributed Cloud (GDC) 混合云架构,成功构建面向 Windows 生态的桌面级
    的头像 发表于 02-25 10:17 873次阅读

    由Memfault赋能的Nordic-nRF Cloud云服务将硬核加持物联网通信应用

    全球低功耗无线通信半导体解决方案领导者 Nordic Semiconductor (以下简称 “Nordic”) 宣布,通过Memfault技术驱动的nRF Cloud平台在 2025 年移动突破奖
    发表于 11-27 22:30

    Google Cloud AI Lakehouse如何构建企业数据未来

    AI 时代,数据是引擎,但对大多数企业而言,这个引擎正被数据孤岛、复杂的工具链和缓慢的洞察周期所拖累。数据工程师在繁琐的 ETL 中筋疲力尽,数据科学家因数据准备不足而束手无策,业务团队则因报表
    的头像 发表于 11-06 10:41 911次阅读
    <b class='flag-5'>Google</b> <b class='flag-5'>Cloud</b> <b class='flag-5'>AI</b> Lakehouse如何构建企业数据未来

    Anthill Cloud:以AI、模块化内容与全渠道互动重塑医药营销

      丹麦哥本哈根2025年11月3日 /美通社/ -- 生命科学行业领先的卓越内容与技术合作伙伴Anthill宣布推出Anthill Cloud™,这一创新平台将AI、模块化内容与个性化互动融合
    的头像 发表于 11-03 20:14 846次阅读
    Anthill <b class='flag-5'>Cloud</b>:以<b class='flag-5'>AI</b>、模块化内容与全渠道互动重塑医药营销

    在HarmonyOS中使用AVPlayer实现外挂字幕

    在视频播放场景中,用户常需要外挂字幕(如 SRT、VTT 等格式)来提升观看体验,尤其是在外语教学、影视解说、直播回放等场景中。
    的头像 发表于 10-15 11:50 1424次阅读

    如何利用Trace机制实现LLCP预览功能

    在蓝牙协议栈开发过程中,有时需要预先知道 LLCP。本文将介绍如何利用 Trace 机制实现 LLCP 预览功能
    的头像 发表于 10-09 17:55 2167次阅读

    vivo携手Google Cloud推动智能手机迈入AI新时代

    在人们期待更智能、更前瞻手机的时代,vivo 携手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速创新,推动智能手机迈入智能、无缝、以人为本的
    的头像 发表于 09-23 16:54 1850次阅读

    Google Cloud展示一系列前沿技术更新

    在 2025 Google 谷歌开发者大会上,Google Cloud 展示了一系列前沿技术更新——不仅是模型升级,更是智能体、创意、行业应用的全面进化。这些前沿技术,正为出海开发者提供强大的技术支撑,助力他们打造面向全球用户的
    的头像 发表于 08-29 09:38 1399次阅读

    Google Fast Pair服务简介

    Google Fast Pair 是一项利用低功耗蓝牙(Bluetooth LE)技术,实现设备间快速安全配对及提供多种服务的协议。其主要功能包括: 设备处于配对模式时,显示半页通知,
    发表于 06-29 19:28

    2025 Google I/O大会演讲亮点回顾

    在今年的 Google I/O 大会上,我们展示了如何在 Google 的各个平台进行应用构建,并利用 Google DeepMind 的卓越 AI
    的头像 发表于 05-28 09:34 1125次阅读