0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google I/O 2023: 让AI更好地助力每个人

谷歌开发者 来源:谷歌开发者 2023-05-11 16:25 次阅读

编者语:以下是我们在 2023 年 Google I/O 大会上公布的内容摘要。

Google 已经走过了七年“AI 为先” 的旅程,现在正处于一个激动人心的转折点。我们有机会让 AI 为人类、企业、社区,甚至我们每个人带来更多帮助。

在过去的一段时间里,我们一直在利用 AI 让我们的产品更加有用。伴随生成式 AI 的出现,我们迈出了下一步,以一种大胆而负责任的方式,重新构想我们所有的核心产品,包括 Search。

将 AI 融入产品

Gmail 的 “Help me write” 功能

有一些很好的例子可以说明生成式 AI 如何帮助我们提升产品,首先谈一谈 Gmail。2017 年,我们推出了 Smart Reply 这一功能,只需轻击鼠标,即可选择简短的回复。接下来是 Smart Compose 功能,可以在用户输入时提供写作建议。Smart Compose 不断完善,实现了由 AI 驱动的更先进的写作功能,并且仅在过去一年中,在 Workspace 中就被使用了超过 1800 亿次。现在,通过更强大的生成式模型,我们在 Gmail 中推出了更先进的功能 “Help me write”。

假设你收到一封电子邮件,提示你的航班被取消了。航空公司已经发送了一张代金券,但你真正想要的是全额退款。你可以使用“Help me write”来回复。

只需输入你想要的提示信息:“一封要求全额退款的电子邮件”,然后点击“创建”,一份完整的草稿就会出现。它直接从上一封电子邮件中提取到了航班详情,看起来非常接近你想要发送的内容,或许你想再修改一下。在这种情况下,一封内容更详细的电子邮件可能会增加获得退款的几率。“Help me write” 将作为我们 Workspace 更新的一部分推出。就像 Smart Compose 一样,随着时间的推移,它会变得越来越好。

Google Maps 中新沉浸式路线视图

自推出 Street View 以来,AI 已经将数十亿张全景图片拼接在一起,让人们可以在自己的设备上探索世界。在去年的 I/O 大会上,我们又推出了沉浸式视图,即利用 AI 创建一个地方的高保真地图,让用户可以在到达之前就先获得身临其境般的体验。

现在,我们正在将同样的技术扩展到 Maps 最擅长的领域:帮助用户到达目的地。Google Maps 每天提供 200 亿公里的路线指引——这是一个非常大的量。想象一下,如果你能提前看到整个旅程……现在,通过沉浸式路线视图 (Immersive View for routes),无论你是步行、骑车还是驾车,都可以实现这一点。

假设你在纽约市,想骑自行车出去玩,Maps 给了你离你很近的地方作为选择。海滨的那个看起来风景很优美,你想先感受一下。点击“沉浸式路线视图”,用一种全新的方式来感受你的旅行,放大地图你可以获得一个令人难以置信骑行路线的鸟瞰视图。

它还可以提供更多的信息。你可以查看今天的空气质量、交通和天气情况,并了解它们未来可能的变化。

沉浸式路线视图将在夏季推出,并在今年年底前在 15 个城市上线,包括伦敦、纽约、东京和旧金山等。

34cbd4f8-efc6-11ed-90ce-dac502259ad0.gif

在新沉浸式路线视图下骑行纽约

Photos 中全新的 Magic Editor 体验

另一个通过 AI 得以提升的产品是 Google Photos。我们在 2015 年的 I/O 大会上介绍了该产品,它也是我们首批 AI 原生产品之一。得益于机器学习的突破,它可能在照片中搜索人物、日落或瀑布等元素。

当然,我们希望用户做的不仅仅是搜索照片——还希望帮助用户把照片变得更好。事实上,每个月有 17 亿张图片在 Google Photos 中被编辑。AI 的进步为我们提供了更多强大的方法来实现这一点。例如,率先在 Pixel 上推出的 Magic Eraser 可使用 AI 驱动的计算摄影来消除不必要的干扰。今年晚些时候,我们将推出结合语义理解和生成式 AI 的Magic Editor,用户将会获得更多新的体验。

例如,这是一张很精彩的抓拍照片,但作为父母,你可能希望孩子的位置更居中一些,并且照片中,气球看起来像是被切掉一部分,所以你可以去重新调整孩子的位置。Magic Editor 会自动重现原始照片中没有捕捉到的长凳和气球的部分。作为点睛之笔,你甚至可以把天空调高,同时照片其他部分的光线也会随之改变,所有的编辑都是连贯一致的。这确实很神奇!我们很高兴能在今年晚些时候在 Google Photos 中推出 Magic Editor。

353000d6-efc6-11ed-90ce-dac502259ad0.gif

一张使用 Magic Editor 编辑的照片

让 AI 更好地助力每个人

从 Gmail 和 Photos 到 Maps,这些只是 AI 如何在重要时刻提供帮助的几个例子。我们还可以做更多的事情,在你熟悉和喜爱的产品中充分挖掘 AI 的潜力。

今天,我们有 15 个为个人和企业提供帮助的产品用户数都超过了 5 亿,其中 6 个产品的用户数已超过了 20 亿。这给了我们很多机会来践行我们的使命——整合全球信息,供大众使用,使人人受益。

这是一个永恒的使命,随着时间的推移,它变得越来越重要。展望未来,让 AI 助力每一个人是我们推进这一使命最深入的方式。我们正通过四个重要方法来实现这一目标:

首先,通过提升用户的知识和学识,加深他们对世界的理解。

第二,通过提高创造力和生产力,帮助用户表达自己并把事情做好。

第三,通过赋能开发者和企业,帮助他们打造具有变革性的产品和服务。

最后,通过负责任地创建和部署 AI,使每个人都能平等受益。

PaLM 2 和 Gemini

我们对未来的机会感到非常兴奋。让 AI 助力每一个人的能力在于不断推进我们的基础模型。因此,我想用一点时间来分享我们是如何去实现的。

去年,你们都了解到了 PaLM,它给我们的产品带来了许多改进。今天,我们已准备好宣布最新的 PaLM 模型并已投入使用:PaLM 2。

PaLM 2 建立在我们的基础研究和最新的基础设施之上, 在各种任务中都具有很强的能力,并且易于部署。我们今天将宣布超过 25 种由 PaLM 2 支持的产品和功能。

PaLM 2 模型在各种规模的情况下都能提供出色的基础功能。我们亲切地将它们命名为 Gecko、Otter、Bison 和 Unicorn。Gecko 非常轻巧,可以在移动设备上工作,其速度快到足以在设备上运行出色的交互式应用程序,即使在离线的状态下。由于对科学和数学课题进行了广泛的训练,PaLM 2 模型的逻辑和推理能力更强。它还接受了逾百种的多语言文本训练,因此它能够理解并生成精确的结果。

结合强大的编码能力,PaLM 2 还可以帮助世界各地的开发人员进行合作。假设你正在与首尔的一位同事一起工作,并且正在调试代码。你可以要求它修复错误,并通过在代码中添加韩文注释来帮助你的同事。它首先识别代码是递归的,然后建议修复。它会解释修复背后的原因,并按照你的要求添加韩文注释。

3a344966-efc6-11ed-90ce-dac502259ad0.png

尽管 PaLM 2 的功能已经非常强大,但当用特定领域的知识对它进行微调后,它的表现会更加出色。我们最近发布了针对安全用例进行了微调的 Sec-PaLM。它通过 AI 来更好地检测恶意脚本,并能够帮助安全专家理解和解决威胁。

另一个例子是根据医学知识进行了微调的 Med-PaLM 2。与基础的模型相对比,这种微调使不准确的推理减少了 9 倍,接近于回答同一组问题的临床医生专家的表现。事实上,Med-PaLM 2 是第一个在医学执照考试上展现出 "专家 "水平的语言模型,展现出目前的最高技术水平。

我们还在努力增加 Med-PaLM 2 的功能,使其能够结合医学影像信息,如平片和乳房 X 光检查。你可以想像一个 AI 协作者帮助放射科医生解释图像和交流结果。这些是 PaLM 2 被用于专业领域的一些例子。我们迫不及待地想看到它被用于更多的领域。我很高兴地宣布 PaLM 2 现在已经有了预览版。

PaLM 2 是我们十年以来,用负责任的方式将 AI 带给数十亿人的旅程中的最新进展。它建立在 Google Brain 和 DeepMind 两个世界顶级研究团队所取得的进展之上。

回顾过去十年 AI 的重大突破,上述团队做出了相当数量的贡献,包括 AlphaGo,Transformers 和序列对序列模型等。所有这些都为我们今天所处的转折点奠定了基础。

我们最近将这两个团队合并为 Google DeepMind,利用 Google 的计算资源,让他们专注于创建安全和负责任的更强大系统。

这其中有我们在训练中的下一代基础模型 Gemini。它从一开始就被创建为多模态、高效的工具和 API 集成,以支持未来的创新,如内存和规划。尽管它还处于早期阶段,但我们已经看到在以往模型中没有出现的多模态能力,这让人印象深刻。

经过微调和严格的安全测试后,Gemini 将像 PaLM 2 一样适应多重体量模式和功能。

AI 的责任:识别生成式内容的工具

随着我们不断投入能力越来越强大的模型,我们也在深入研究 AI 应当肩负的责任,这包括让用户拥有可识别出合成的生成式内容工具。

水印和元数据是两个重要方式。水印将信息直接嵌入到内容中,即使经过适度编辑的图像,水印也能保存其中。展望未来,我们正在建立自己的模型,让水印从开始就融入其中。如果你看到一张合成图片,发现它如此真实,令人印象深刻,这也是为什么这项责任如此重要。

元数据允许内容创作者将额外的背景信息与原始文件关联,每当你看到一张图片时,元数据就会提供其背景信息。我们将确保,每一张由 AI 生成的图像都会绑定这种元数据。

Bard 和 Workspace 的更新

随着模型变得更好、更强大,最令人兴奋的机会之一是人们可以直接参与其中。

这就是 Bard 带给我们的机会——对话式 AI 实验。我们正在迅速提升 Bard, 目前它已支持广泛的编程功能,并在推理和数学提示方面更加智能。并且,从今天起,它将完全运行在 PaLM 2之上。

3a4b557a-efc6-11ed-90ce-dac502259ad0.png

我们还为 Google Workspace 带来了新功能。除了在 Docs 和 Gmail 中的“Help me write”功能外,Google Workspace 的 Duet AI 提供了一些工具,可以在 Slides 和 Meet 中从文本描述中生成图像,在 Sheet 中创建自定义计划等等。

3a5f46de-efc6-11ed-90ce-dac502259ad0.png

介绍 Labs 和 Search 的新生成式体验

随着 AI 不断的快速升级,我们专注于为用户带来更有用的功能。从今天开始,我们为用户提供了一种新的方式,来预览 Workspace 和其他产品中的部分体验。这就是 Labs。虽然我说这是一种新方式,但是 Google 使用 Labs 作为一种早期访问和获得反馈的方式已经有很长的历史了,用户可以在今天晚些时候开始注册。

除了你们刚才看到的 Workspace 功能外,能够在 Labs 测试的首批体验之一是我们的创始产品——Google Search 。多年前,我们之所以开始深入投资 AI,就是因为我们看到了让 Search 变得更好的机会。随着每一次的突破,我们都让它变得更加便利和直观。

语言理解能力的提高让我们可以更自然地提出问题,并在网络上找到最相关的内容。计算机视觉的进步引入了新的视觉搜索方式。现在,即使用户没有用语言来描述要搜索的内容,也可以用 Google Lens 搜索任何看到的东西。事实上,Lens 每个月完成的视觉搜索超过 120 亿次,短短两年就增长了 4 倍。结合了多模式的 Lens 可以实现多模式搜索,即让用户使用图像和文本同时进行搜索。

展望未来,Google对信息的深刻理解与生成式 AI 强大能力的结合,将会再次改变 Search 的工作方式,解锁 Search 可以回答的全新问题,并带来越来越多更有帮助的体验,将用户与网络世界的丰富内容相连接。

当然,将生成式AI用于搜索仍处于早期阶段。世界各地的人们在重要时刻都依赖于Search,我们知道,做好这一点并继续赢得他们的信任是多么重要。这始终是我们一直不变的努力方向。

因此,我们一直以负责任的态度来推进创新,一如既往地为追求最高的信息质量而努力。这就是为什么我们在Labs最先为用户带来 Search 新生成式体验(new Search Generative Experience)的原因。

3a780782-efc6-11ed-90ce-dac502259ad0.png

帮助他人创新更加便捷

AI 不仅仅是一个强大的赋能工具,它也代表着平台的大转变。所有企业和组织都在思考如何推动转型。因为,我们一直专注于帮助他人能更便捷地利用 AI 进行创新,并使其具有可拓展性。

这意味着我们要提供最先进的计算基础设施,并扩大对 Google 最新基础模型的访问,包括最先进的 TPU 和 GPU。这些模型已经通过严格的测试,并已集成到我们自己的产品之中。我们还在努力提供世界一流的工具,以便客户能够训练、调整和运行他们自己的模型,助力其具备企业级的安全、保密和隐私保护。

3aa84f32-efc6-11ed-90ce-dac502259ad0.png

Android 推动进步

我们对 AI 大胆和负责任的做法可以释放人们的创造力和潜力。我们也想确保这种帮助能够尽可能助力更多人。通过像 Android 这样的计算平台,我们做到了这一点,今天我们将分享 AI 的进步如何让手机更加个性化,包括 Magic Compose (魔法撰写)、Cinematic Wallpapers(电影壁纸)和Generative AI Wallpapers (生成式 AI 壁纸)。

3abd9086-efc6-11ed-90ce-dac502259ad0.png

介绍适合您口袋和家庭的新Pixel设备

今天,我们还将推出 Pixel 7a、Pixel Fold 和 Pixel Tablet,打造了 Google 完整的 AI 设备生态系统。Pixel 7a 从今天起开始发售,Pixel Fold 和 Pixel Tablet 的预售也已开放。

3ad6a990-efc6-11ed-90ce-dac502259ad0.png

共建未来

我一直在思考我们都曾经历过的重大技术变革。AI 带来的变革将与它们一样剧烈,这就是为什么我们要让 AI 能够助力每一个人,这一点非常重要。我们用激情和勇气大胆地去接近这一目标。同时,我们也非常负责任地进行探索,以保证我们的努力能够取得方向正确的成果。

没有任何一家公司能够独立完成这一切。我们的开发者社区将是解锁未来巨大机遇的关键。我们期待与大家共同合作,一起构建未来。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1714

    浏览量

    56797
  • AI
    AI
    +关注

    关注

    87

    文章

    26485

    浏览量

    264119
  • 模型
    +关注

    关注

    1

    文章

    2709

    浏览量

    47716

原文标题:在 I/O 看未来 | Google I/O 2023: 让 AI 更好地助力每个人

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Arm通过Neoverse更新加倍发力AI和Chiplet

    AI市场被视为顶级经济增长驱动力,每个人都想分得一杯羹。
    的头像 发表于 02-29 09:12 378次阅读
    Arm通过Neoverse更新加倍发力<b class='flag-5'>AI</b>和Chiplet

    谷歌发布最先进的开放模型Gemma

    Google,我们致力于让 AI 助力每个人。长期以来,我们对开放社区的创新贡献了许多成果,如 Transformers、TensorFlow、BERT、T5、JAX、AlphaF
    的头像 发表于 02-23 10:12 270次阅读
    谷歌发布最先进的开放模型Gemma

    AI跟人类抢工作?微软小科普消除对AI的四大误解

    随着AI的普及和快速发展,对其能力、影响和未来发展的误解也随之增多。AI是否会抢走每个人的工作?
    的头像 发表于 01-10 16:05 531次阅读
    <b class='flag-5'>AI</b>跟人类抢工作?微软小科普消除对<b class='flag-5'>AI</b>的四大误解

    基于紫光同创FPGA的多路视频采集与AI轻量化加速的实时目标检测系统

    基于紫光同创FPGA的多路视频采集与AI轻量化加速的实时目标检测系统#2023集创赛#紫光同创#小眼睛科技助力紫光同创高校生态建设@小眼睛科技 获奖作品展示:华南理工大学+CR8_Pro队
    发表于 11-02 17:51

    精彩预告 | OpenHarmony Meetup 2023 成都站抢先剧透

    点击蓝字 ╳ 关注我们 开源项目 OpenHarmony 是每个人的 OpenHarmony 原文标题:精彩预告 | OpenHarmony Meetup 2023 成都站抢先剧透 文章出处:【微信公众号:OpenAtom OpenHarmony】欢迎添加关注!文章转载请
    的头像 发表于 10-25 15:55 162次阅读
    精彩预告 | OpenHarmony Meetup <b class='flag-5'>2023</b> 成都站抢先剧透

    2024 年最重要的10个人工智能趋势,每个人都必须做好准备

    年最重要的10个人工智能趋势,每个人都必须为它们做好准备。希望到2024年,我们能在解决围绕这项技术的一些棘手问题上取得进展。虽然近年来,由于成本和易用性而导致的
    的头像 发表于 10-10 10:08 506次阅读
    2024 年最重要的10<b class='flag-5'>个人</b>工智能趋势,<b class='flag-5'>每个人</b>都必须做好准备

    多元共进|2023 Google 谷歌开发者大会现场全回顾

    ! 持续关注大会官网 回看更多大会精彩专题演讲 2023 Google 开发者大会在激动人心的 主旨演讲 中拉开帷幕。主舞台场内座无虚席,在这精彩的一小时内,中外嘉宾轮番登场,分享了过去一年中谷歌在 开发提效 、 共建社区 上的举措,与开发者们一同将精彩的应用、产品带给全
    的头像 发表于 09-07 22:10 690次阅读

    边缘AI普及的关键是软件吗?

    每个人都喜欢谈论边缘AI,但却不提AI与嵌入式世界之间长期存在的鸿沟。
    的头像 发表于 08-31 14:51 589次阅读
    边缘<b class='flag-5'>AI</b>普及的关键是软件吗?

    【直播合集】HDC.Together 2023 精彩回顾!收藏勿错过~

    突破,您的应用在鸿蒙生态中得到更好的发展。 ​​观看直播回放​​ HDC.Together 2023技术论坛 更多技术分论坛直播回看,请查看以下楼层↓↓↓ HDC.Together 202
    发表于 08-17 17:21

    OpenHarmony社区运营报告(2023年7月)

    点击蓝字 ╳ 关注我们 开源项目 OpenHarmony 是每个人的 OpenHarmony 本月快讯 • 2023年7月28日-29日,全球软件质量效能大会(简称“QECon”)圆满举行
    的头像 发表于 08-10 21:15 456次阅读

    OpenHarmony亮相QECon2023助力北向应用生态赋能

    点击蓝字 ╳ 关注我们 开源项目 OpenHarmony 是每个人的 OpenHarmony 2023年7月28日-29日,全球软件质量效能大会(以下简称“QECon”)圆满举行,OpenAtom
    的头像 发表于 07-31 21:05 293次阅读

    人脸识别系统每个人都能学会

    人脸识别
    学习电子知识
    发布于 :2023年07月17日 20:03:49

    今日看点丨联发科传夺 Google AI 大单;华为扩大专利收入:向 30 家日本公司收取专利使用费

    芯片领域。对于相关消息,联发科不回应市场传言。消息人士透露,这次Google与联发科的跨国合作,由联发科提供串行器及解串器(SerDes)方案,协助整合Google自行开发的张量处理器(TPU),助力
    发表于 06-19 11:00 2996次阅读
    今日看点丨联发科传夺 <b class='flag-5'>Google</b> <b class='flag-5'>AI</b> 大单;华为扩大专利收入:向 30 家日本公司收取专利使用费

    黄仁勋:“AI每个人都能成为程序员”

    黄仁勋当天在计算机论坛现场,除了发表ai相关的新产品外,还亲自展示了生成型ai的强力功能。黄委员让ai制作主题演讲的主题曲之后,带领听众跟着节拍唱歌。接着他演示了ai声音生成器。
    的头像 发表于 06-02 09:33 1139次阅读

    [新邮件] Google I/O 2023 大会精彩视频回顾合集 | 在 I/O 看未来

    秉承大胆而负责任的态度 Google 持续构建和发展 生成式 AI  的应用 在今年 I/O 大会上推出丰富应用案例 充分展示用 AI 塑造未来的多种可能 对大会新发布跃跃欲试 想和更多
    的头像 发表于 05-19 13:40 529次阅读
    [新邮件] <b class='flag-5'>Google</b> I/O <b class='flag-5'>2023</b> 大会精彩视频回顾合集 | 在 I/O 看未来