0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

截杀ChatGPT-4o,谷歌系AI产品迎来全面升级

E4Life 来源:电子发烧友 作者:周凯扬 2024-05-16 01:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友报道(文/周凯扬)作为算法巨头的谷歌,在AI时代发布了一系列AI产品,比如Gemini、Bard等。在AI行业日新月异快速迭代的局面下,即便是谷歌也需要加快开发速度,不断更新其AI模型和应用。近日举办的谷歌I/O大会上,谷歌宣布全面进入Gemini时代,并发布了一系列与AI相关的更新。

对标ChatGPT-4o谷歌发布Project Astra

相信本周ChatGPT-4o的演示,已经令不少人期待起这个支持视听输入的实时AI助手,谷歌也不甘示弱,发布了Project Astra的演示,展示了他们对于未来AI助手的构想。Project Astra基于Gemini模型打造,支持视频和语音的输入,通过连续的视频帧编码和先进的语音模型,谷歌得以更快地处理输入信息。

相较其ChatGPT-4o更先进的是,谷歌的Project Astra还支持实时交互,比如在手机上圈选出实时视频画面中的一部分,让AI助手提供描述等。不仅如此,Project Astra将视频与语音输入转换成一连串的时间线事件,并缓存这些信息用于未来的高效回溯。

谷歌也对该项目未来的应用场景进行了构想,这些功能不仅可以用于手机端,更是可以用于AR眼镜,为用户提供交互式的AI助手体验。谷歌在外媒的采访中也证实,他们正在考虑为Project Astra打造新的AR眼镜的构想。他们认为对于AR设备来说,Project Astra很有可能成为新一轮的杀手级应用。

安卓迎来新一轮AI功能更新

在这个AI重塑手机体验的世代,而安卓作为全球用户技术最大的智能手机系统,谷歌也希望能用AI带去全新的设备交互方式。

wKgaomZEiJiAQaZNAADN-oFe2tg299.png
圈选搜索解题 / 谷歌


自从在三星Unpacked大会上公布圈选搜索功能,谷歌已经为更多Pixel和三星设备加入了全屏翻译等功能。在I/O大会上,谷歌宣布为圈选搜索加入作业辅助的功能,比如面对某些物理和数学应用题,圈选搜索不仅可以给出答案,还可以列出具体的解题过程。

安卓上的Gemini已经成为新一代的助手应用,借助生成式人工智能来提供创造力和效率,而未来几个月内,谷歌将为其推送更新,可以在使用中的应用程序中唤醒,并将生成的图片、文字等拖拽到其他应用上。

wKgZomZEiOWAZB8JAADkmdTjAk0881.png
Gemini Nano / 谷歌


至于端侧的Gemini Nano,同样将在今年年末迎来升级,引入多模态支持。为了做到离线使用和保证用户隐私,谷歌于去年底推出了Gemini Nano,而多模态的加入将引入对文本之外的视觉声音支持。以语音反馈功能为例,对于盲人或弱视群体,在面对无标签的图片时,Gemini Nano赋能的语音反馈功能将提供更多细节的描述。

谷歌同样借助Gemini Nano对语音的支持,引入了可选的防诈骗功能。通过在通话过程中检测到与诈骗相关的对话模式,手机就会自动发出实时警报,比如要求紧急转账、提供银行卡密码等。因为这些保护措施都是在端侧完成的,所以此类对话都是完全保密的,用户无需担心隐私泄露问题。

第六代TPU Trillium性能与能效双提升

在本届I/O大会上,谷歌也宣布了AI基础设施的升级,其TPU将迎来第六代产品,Trillium。相较TPU v5e,谷歌扩大了MXU(矩阵乘法单元)的大小,并提高了时钟速度,使得Trillium单芯片的峰值计算性能实现了4.7倍的提升,能效提升67%。

同时谷歌还加倍了HBM内存的容量和带宽,更大的内存容量和带宽允许Trillium可以跑更多权重、更大KV缓存和更大规模的模型。谷歌称下一代的HBM带来了带宽提升和能效提升,改善了大模型的训练时间以及服务时延。

同样加倍的还有片间互联带宽,这使得Trillium的扩展性大大加强,单个服务器Pod内可借助定制的光学ICI做到256个芯片互联,再借助谷歌的Jupiter网络扩展至数百个Pod互联。

从第一代TPU开始,谷歌已经将这一加速硬件集成到其提供的各种软件服务中,比如实时语音搜索、照片物体识别以及交互式语言翻译等等,当然也包括了最新的Gemini、Imagen和Gemma等模型。除此之外,一些行业模型也将从TPU中受益,比如自动驾驶模型、药物开发模型等。据谷歌预告,Trillium将于今年年末开放给谷歌云客户。

GeminiGemma迎来全面迭代升级

除了上面提到的安卓端Gemini新功能外,Gemini模型本身也将迎来新一轮升级。在Gemini 1.5 Pro发布后不到半年,谷歌就再次对其进行了升级,如今的Gemini 1.5 Pro将支持两百万Token的上下文窗口。

除此之外,谷歌还加强了Gemini 1.5 Pro的代码生成、逻辑推理和多轮对话交互能力。不仅音频和图像的理解能力也得到了进一步加强,不少特殊用例的模型响应控制也得到了提升,比如不同的对话角色和响应风格。无论是使用API的开发者还是谷歌云用户,现在都可以申请这一升级。

为了响应用户对低时延和低成本模型的要求,谷歌还推出了轻量版的Gemini 1.5 Pro:Gemini 1.5 Flash。Gemini 1.5 Flash专门针对高流量、高频率的任务进行了优化,支持100万的Token上下文窗口,而且支持文本、图片、语音和视频的混合输入。

开放模型Gemma同样迎来了升级,首先是新推出的视觉语言模型PaliGemma,其灵感来源自PaLI-3,支持图片和文本作为输入,可以回答有关图片的问题,并提供详细信息和上下文,可以用于对图片或短视频添加说明、对象检测等。其主要优势在于支持多模态理解,而且可以针对各种视觉语言任务进行微调,也有专门面向研究的版本PaliGemma-FT,可对特定的研究数据集进行微调。

wKgaomZEiNSAPgoeAAGooyKmAgo448.png
Gemma 2性能测试对比 / 谷歌


此外还有下一代Gemma模型的更新,Gemma 2。Gemma 2是一个270亿参数的大模型,得益于全新的架构,在性能和效率上均实现了突破。相较于Meta的Llama 3 70B模型,其规模只有一半不到,却可以实现与之相近的性能。从预训练阶段的测试成绩来看,Gemma 2仅仅略微逊色于Llama 3,快于Grok-1。除了针对英伟达GPU做了优化外,Gemma 2还可以高效地运行在单个TPU主机上,进一步降低了用户的部署成本。目前Gemma 2依然还在预训练阶段,预计将于今年六月推出。

写在最后

谷歌通常会将年度I/O开发者大会的舞台用于发布Android系统,以及Pixel智能手机的下一代更新。但从今年的发布内容来看,谷歌已经全面转向了AI产品的开发。无论是Android 15的下一个Beta版本,还是Pixel 8a,都只是被短短提及而已。由此可以看出,谷歌已经将下一轮软硬件的革新全面押注在了AI上,未来我们将见证一个围绕AI开发产品矩阵的新谷歌崛起。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110263
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296680
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10074
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为AI-Centric星河AI网络解决方案全面升级

    在华为全联接大会2025“AI时代,星河AI网络智联新启航”峰会上,华为数据通信产品线总裁王雷正式发布全面升级
    的头像 发表于 09-20 09:41 1030次阅读

    AI赋能谷歌Chrome与Web工具全面升级

    2025 Google 谷歌开发者大会带来了最新 Web 工具,包括全面升级的 Chrome 开发体验、极大简化的 UI 开发,到云端两侧的 AI 部署。这些强大的工具为出海开发者提供
    的头像 发表于 08-29 09:33 829次阅读

    芯盾时代以AI战略赋能全线产品智能化升级

    ChatGPT掀起的智能革命席卷全球,DeepSeek等大模型持续刷新性能边界,人工智能从实验走向产业深处,成为重塑经济格局、重构安全范式的核心力量。从国家战略到企业实践,从技术突破到场景落地,智能化浪潮以前所未有的速度推动着社会变革。芯盾时代紧跟AI前沿技术,以
    的头像 发表于 07-14 15:47 1362次阅读

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    谷歌I/O 2025大会前透露:Android 16接入Gemini,智能手机、XR设备升级

    电子发烧友网报道(文/莫婷婷)2025 Google Android I/O将5 月 20 日至 21 日举行,在这场活动之前,谷歌召开了“The Android Show: I/O Edition
    的头像 发表于 05-18 00:03 7204次阅读
    <b class='flag-5'>谷歌</b>I/<b class='flag-5'>O</b> 2025大会前透露:Android 16接入Gemini,智能手机、XR设备<b class='flag-5'>升级</b>

    AI智能眼镜影像处理单元全面升级,摄像模组将成竞争核心

    电子发烧友网报道(文/莫婷婷)随着应用领域的拓展,AI智能眼镜的影像单元系统正迎来升级,最明显的是摄像头的使用。以多摄像头模组和AI算法融合为标志的技术创新,正成为关注点。     影
    的头像 发表于 05-12 09:20 7989次阅读
    <b class='flag-5'>AI</b>智能眼镜影像处理单元<b class='flag-5'>全面</b><b class='flag-5'>升级</b>,摄像模组将成竞争核心

    华为全面升级星河AI广域网解决方案

    MWC25巴塞罗那期间,华为面向全球全面升级发布星河AI广域网解决方案及全新百G万兆极致高密融合路由器NetEngine 8000E F2D产品,通过构筑智能融合IP网络底座,助力客户
    的头像 发表于 03-07 15:56 862次阅读

    华为面向海外全面升级星河AI网络

    MWC25巴塞罗那期间,在“星河AI网络,全面跃升行业智能化”IPClub技术菁英汇峰会上,华为面向海外全面升级星河AI网络,助力客户加速企
    的头像 发表于 03-06 11:18 1273次阅读

    OpenAI宣布GPT 4o升智计划

    透露,GPT 4o的智力水平将得到显著提升,目标直指o3 pro的水平。这一升级不仅意味着GPT 4o在理解和生成文本方面的能力将得到质的飞跃,更将使其在处理复杂问题、进行逻辑推理等方
    的头像 发表于 02-17 14:24 870次阅读

    从文心一言与ChatGPT同时免费,读懂全球AI新周期

    2025全球AI迎来降本升级浪潮
    的头像 发表于 02-14 10:13 1.3w次阅读
    从文心一言与<b class='flag-5'>ChatGPT</b>同时免费,读懂全球<b class='flag-5'>AI</b>新周期

    OpenAI报告GPT-4o4o-mini模型性能下降,正紧急调查

    ,自发现这一问题以来,公司已经迅速启动了内部调查机制,以尽快查明导致模型性能下降的具体原因。OpenAI强调,他们对此次事件高度重视,并将全力以赴解决这一问题,以确保用户能够继续享受到高质量的AI服务。 GPT-4o4o-mi
    的头像 发表于 01-23 10:22 1105次阅读

    大疆发布DJI O4 Air Unit系列:图传性能再升级

    近期,大疆正式发布了DJI O4 Air Unit Pro和DJI O4 Air Unit两款数字图传解决方案,再次实现了图传性能的飞跃。这两款产品为用户带来了更高清、更低延时、更远距离的影像传输
    的头像 发表于 01-15 15:03 2598次阅读

    AI眼镜形态席卷可穿戴市场!谷歌眼镜几次“流产”,将靠AI翻盘

      电子发烧友网报道(文/莫婷婷)在ChatGPT进化史上,绕不开的一家厂商是谷歌。2024年12月,谷歌发布 Gemini 2.0,该产品被称为登顶
    的头像 发表于 12-26 00:12 4121次阅读

    虹软ArcMuse计算技术引擎全面升级

    经过半年多的潜心研发和技术攻关,虹软ArcMuse计算技术引擎迎来全面升级,实现多项关键技术突破。升级内容涵盖高清视频生成、AI模特图高精度
    的头像 发表于 12-11 17:34 1298次阅读

    大联大推出基于MediaTek Genio 130与ChatGPTAI语音助理方案

    大联大控股,作为亚太地区市场领先的半导体元器件分销商,近日宣布了一项重要创新。其旗下子公司品佳,成功推出了基于联发科技(MediaTek)Genio 130芯片与ChatGPT功能的AI语音助理方案
    的头像 发表于 12-11 11:07 1122次阅读