0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌发布Imagen 3,提升图像文本生成技术

微云疏影 来源:综合整理 作者:综合整理 2024-05-15 11:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据报道,在今日召开的I/O 2024开发者大会上,谷歌全面升级Image 3,大幅度提高了文字转图像功能的精确度和精细程度。

已为谷歌人工智能研究所DeepMind掌门人的德米斯·哈萨比斯指出,相比于前款Imagen 2,Image 3能够更加精准地解码文字提示信息,并据此创建出更有创造力、细节丰富且出错率较低的图像。

针对公众对深度伪造技术可能带来的安全隐患的忧虑,谷歌承诺,Image 3将运用DeepMind研发的SynthID技术,在媒体内容中添加隐形加密水印,以确保内容真实性。

此外,用户可通过谷歌的ImageFX工具申请试用Image 3的私人版本,而谷歌方面则表示,该模型将很快向使用谷歌企业级生成式人工智能开发平台Vertex AI的开发者及企业客户开放。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6271

    浏览量

    112307
  • 人工智能
    +关注

    关注

    1822

    文章

    50599

    浏览量

    268158
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    12477
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    《多模态大模型 前沿算法与实战应用 第一季》精品课程简介

    调整语调匹配用户情绪。 2. 医疗影像诊断:图像+文本的多模态分析 图像编码 :用ResNet提取CT影像的病灶特征,生成1024维视觉向量。 文本
    发表于 05-01 17:46

    融合多场耦合效应:生成式人工智能技术演进及其在航空发动机复杂工程系统中的赋能机制研究

    人工智能技术正经历着从感知智能向生成智能、再向代理智能与物理智能演进的深刻变革。在这一进程中,生成式AI技术的突破性发展尤为引人瞩目,其不仅能够在自然语言处理和计算机视觉领域
    的头像 发表于 02-26 10:07 797次阅读
    融合多场耦合效应:<b class='flag-5'>生成</b>式人工智能<b class='flag-5'>技术</b>演进及其在航空发动机复杂工程系统中的赋能机制研究

    如何在Arm Neoverse N2平台上提升llama.cpp扩展性能

    跨 NUMA 内存访问可能会限制 llama.cpp 在 Arm Neoverse 平台上的扩展能力。本文将为你详细分析这一问题,并通过引入原型验证补丁来加以解决。测试结果表明,在基于 Neoverse N2 平台的系统上运行 llama3_Q4_0 模型时,该补丁可使文本生成
    的头像 发表于 02-11 10:06 415次阅读

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    使用Firebase AI Logic生成图像模型的两种新功能

    为您的应用添加自定义图像,能够显著改善和个性化用户体验,有效提高用户参与度。本文将探讨使用 Firebase AI Logic 生成图像的两种新功能: 其一是 Imagen 专属编辑功
    的头像 发表于 11-30 09:28 639次阅读

    万里红文本生成算法通过国家网信办备案

    近日,国家互联网信息办公室发布了第十四批深度合成服务算法备案信息,北京万里红科技有限公司(以下简称:万里红)自主研发的“万里红文本生成算法”正式通过备案。该算法致力于通过自动化的方式,提升知识问答、RAG分类、预测、文档
    的头像 发表于 11-14 09:06 919次阅读

    看点:谷歌Veo 3.1迎来重大更新硬刚Sora 2 12英寸硅片国产龙头西安奕材今日申购

    Veo 3 的基础上,Veo 3.1 进一步提升了提示词遵循度,并在以图生视频时提供更高的视听质量。谷歌这是要硬刚Sora 2的节奏吗? 我们看到谷歌引入了对多种输入类型的支持,可接
    的头像 发表于 10-16 16:00 1255次阅读

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    图像的快速鉴别,满足实时或准实时的应用需求。 3. 数据采集 AI图片数据集,本项目使用gemini生成图片,使用的是gem来实现的。 提示词如下 你是一个能够生成美术绘本风格插画的智
    发表于 08-21 13:59

    谷歌DeepMind重磅发布Genie 3,首次实现世界模型实时交互

    电子发烧友网综合报道 当地时间2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。这款被英伟达科学家Jim Fan誉为“游戏引擎2.0”的模型,通过单文本提示即可
    的头像 发表于 08-13 08:27 7316次阅读

    红帽OpenShift Lightspeed正式发布生成式AI助力混合云生产力提升

    中国北京   – 2025 年 6 月 6 日   – 全球领先的开源解决方案提供商红帽公司近日宣布正式发布红帽OpenShift Lightspeed。该产品是一款基于生成式AI(gen AI
    发表于 07-01 15:04 1250次阅读

    关于鸿蒙App上架中“AI文本生成模块的资质证明文件”的情况说明

    的应用缺少AI文本生成模块的资质证明文件,不符合相关法律法规要求。 修改建议:AI文本生成模块需补充提供《安全评估报告》并加手写签名、《安全评估报告》在全国互联网安全服务管理平台的提交结果截图,且现场
    发表于 06-30 18:37

    边缘生成式AI面临哪些工程挑战?

    本文由TechSugar编译自electronicdesign当大多数人想到人工智能(AI)时,他们通常能想到的是能够生成文本图像或语音内容的应用。像ChatGPT这样流行的文本
    的头像 发表于 06-25 10:44 1396次阅读
    边缘<b class='flag-5'>生成</b>式AI面临哪些工程挑战?

    无法使用OpenVINO™在 GPU 设备上运行稳定扩散文本图像的原因?

    在OpenVINO™ GPU 设备上使用图像大小 (1024X576) 运行稳定扩散文本图像,并收到错误消息: RuntimeError: Exception from
    发表于 06-25 06:36

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1405次阅读

    利用NVIDIA 3D引导生成式AI Blueprint控制图像生成

    AI 赋能的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在能创造出令人惊叹的逼真视觉效果。即使取得了如此飞跃,仍然存在一个
    的头像 发表于 06-05 09:24 1084次阅读