0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Gemini API集成Google图像生成模型Imagen 3

谷歌开发者 来源:Android 开发者 2025-05-14 16:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 产品经理 Ivan Solovyev

开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户推出。

Imagen 3 擅长生成具有视觉吸引力、无伪影且风格多样的图像,从超现实主义图像到印象派风景,从抽象构图到动漫角色等应有尽有。改进后的提示遵循能力使其能够轻松地将绝佳创意转化为高质量图像。总体而言,Imagen 3 在各种基准测试中展现出了最先进的性能。通过 Gemini API 使用 Imagen 3 的价格为每张图像 0.03 美元,并且用户可以控制宽高比、生成选项数量等更多参数。

为了帮助遏制错误信息和错误归因,所有由 Imagen 3 生成的图像都包含一个不可见的数字SynthID水印,用于识别它们为 AI 生成的图像。

了解 Imagen 3 的实际效果

下方图库展示了Imagen 3在多种风格图像上的卓越表现。

开始使用 Gemini API 中的 Imagen 3

Python 代码段展示了如何使用 Gemini API 和 Imagen 3 生成图像。

fromgoogleimportgenai
fromgoogle.genaiimporttypes
fromPILimportImage
fromioimportBytesIO


client = genai.Client(api_key='GEMINI_API_KEY')


response = client.models.generate_images(
  model='imagen-3.0-generate-002',
  prompt='a portrait of a sheepadoodle wearing cape',
  config=types.GenerateImagesConfig(
    number_of_images=1,
  )
)
forgenerated_imageinresponse.generated_images:
 image = Image.open(BytesIO(generated_image.image.image_bytes))
 image.show()
图像已生成

您可以在 Gemini API 开发者文档中探索更多关于提示技巧和图像风格的内容,有关评分、方法论及性能提升的更多详情,请参阅我们更新后的技术报告附录 D。

我们非常高兴能够迈出第一步,将我们的生成式媒体模型扩展至 Gemini API。我们还计划在不久的将来推出更多模型,以便开发者能够将生成式媒体与语言模型结合起来使用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60279
  • Gemini
    +关注

    关注

    0

    文章

    73

    浏览量

    8113
  • 图像生成
    +关注

    关注

    0

    文章

    25

    浏览量

    7133

原文标题:Gemini API 集成 Imagen 3,带来更强大的图像生成功能

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌AI霸主归来!多线反击OpenAI,开启安卓Gemini时代

    Pro、扩散语言模型Gemini Diffusion、视频生成模型Veo 3+ Flow应用、图像
    的头像 发表于 05-22 09:01 6388次阅读
    谷歌AI霸主归来!多线反击OpenAI,开启安卓<b class='flag-5'>Gemini</b>时代

    使用Firebase AI Logic生成图像模型的两种新功能

    为您的应用添加自定义图像,能够显著改善和个性化用户体验,有效提高用户参与度。本文将探讨使用 Firebase AI Logic 生成图像的两种新功能: 其一是 Imagen 专属编辑功
    的头像 发表于 11-30 09:28 224次阅读

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,
    的头像 发表于 11-24 11:10 854次阅读
    谷歌正式推出最新<b class='flag-5'>Gemini</b> <b class='flag-5'>3</b> AI<b class='flag-5'>模型</b>

    谷歌Gemini 3模型开启智能新纪元

    Overviews)。Gemini app 的月用户量已突破 6.5 亿,超过 70% 的 Cloud 客户使用我们的 AI,1300 万开发者在使用我们的生成模型进行构建——而这只是我们所看到的巨大影响的一个缩影。
    的头像 发表于 11-24 11:07 511次阅读
    谷歌<b class='flag-5'>Gemini</b> <b class='flag-5'>3</b><b class='flag-5'>模型</b>开启智能新纪元

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    图像的快速鉴别,满足实时或准实时的应用需求。 3. 数据采集 AI图片数据集,本项目使用gemini生成图片,使用的是gem来实现的。 提示词如下 你是一个能够
    发表于 08-21 13:59

    Firebase Studio现已集成Gemini 2.5

    。近期,我们通过增强其内置的 App Prototyping 智能体,使其采用 Google 强大的 AI 模型 Gemini 2.5。所有 Firebase Studio 预览版用户现在都可以使用升级后
    的头像 发表于 07-10 18:13 786次阅读

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 907次阅读

    谷歌Gemini 2.5模型系列更新

    今年 3 月,我们发布了迄今为止最智能的模型 Gemini 2.5 Pro,两周前,我们提前为您带来了 I/O 更新,以便开发者构建出色的网络应用。
    的头像 发表于 05-23 14:56 1014次阅读

    AlphaEvolve:一款基于Gemini的编程Agent,用于设计高级算法

    “  Google 最新的 AI Agent 通过融合大语言模型创造力与自动评估器 推动数学与计算领域算法进化。 ”   大语言模型(LLMs)具有惊人的多功能性。它们能够总结文档、生成
    的头像 发表于 05-19 11:19 1491次阅读
    AlphaEvolve:一款基于<b class='flag-5'>Gemini</b>的编程Agent,用于设计高级算法

    谷歌Gemini API最新进展

    体验的 Live API 的最新进展,以及正式面向开发者开放的高质量视频生成工具 Veo 2。近期,我们面向在 Google AI Studio 中使用 Gemini
    的头像 发表于 04-12 16:10 1480次阅读

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗舰大
    的头像 发表于 02-07 15:07 1098次阅读

    谷歌推出Gemini 2.0 Flash体验版

    我们正赋予开发者构建 AI 未来的能力,包括尖端模型、智能代码编写工具以及跨平台和设备的无缝集成。自 2023 年 12 月我们推出 Gemini 1.0 以来,数百万的开发者已经使用 Goo
    的头像 发表于 01-06 09:52 2585次阅读

    借助谷歌GeminiImagen模型生成高质量图像

    在快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌的 Gemini 模型来制作详细且富有创意的提示,然后使用 Ima
    的头像 发表于 01-03 10:38 1360次阅读
    借助谷歌<b class='flag-5'>Gemini</b>和<b class='flag-5'>Imagen</b><b class='flag-5'>模型</b><b class='flag-5'>生成</b>高质量<b class='flag-5'>图像</b>

    Google两款先进生成式AI模型登陆Vertex AI平台

    新的 AI 模型,包括最先进的视频生成模型Veo以及最高品质的图像生成模型
    的头像 发表于 12-30 09:56 991次阅读

    OpenAI暂不推出Sora视频生成模型API

    OpenAI近日宣布,目前暂无推出其视频生成模型Sora的应用程序接口(API)的计划。Sora模型能够基于文本和图像
    的头像 发表于 12-20 14:23 979次阅读