0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Android Studio中的Gemini支持多模态输入功能

谷歌开发者 来源:谷歌开发者 2025-05-14 16:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / Android Studio 开发者产品经理 Paris Hsu

在开发生命周期的每个阶段,Android Studio 中的 Gemini 都已成为您的 AI 助手,助您更轻松地构建高质量的应用。我们很高兴地与您分享一项重大升级:Android Studio 中的 Gemini 现已支持多模态输入,您可在提示中直接添加图像!这为团队协作和界面开发工作流程解锁了更多新的可能性。

您可以下载最新的 Android Studio Canary 版来体验这项新功能。我们列举了一些可以尝试的用例,目前仍在努力将此功能引入未来的稳定版本。在此过程中,我们十分期待了解您的想法与反馈。

图像附件 - 交互新维度

我们在 2024 Google I/O 大会上首次预览了 Gemini 的多模态功能。借助这项技术,Android Studio 中的 Gemini 能够理解简单的线框图,并将其转换为可运行的 Jetpack Compose 代码。

现在,您可以在 Gemini 聊天窗口中找到图像附件图标。只需将 JPEG 或 PNG 文件作为附件添加到提示中,即可静待 Gemini 理解并响应视觉信息。我们观察到,具有强烈色彩对比度的图像效果最佳。

我们建议您尝试各种提示和图像。您可从以下这些引人注目的用例入手:

快速界面原型设计和迭代:将应用界面的简单线框图或高保真原型转换为可运行的代码。

图表说明和文档:让 Gemini 解释复杂架构或数据流程图的组成部分和关系,从而获得更深入的理解。

界面问题排查:捕获界面错误屏幕截图,并向 Gemini 寻求解决方案。

快速界面原型设计和迭代

Gemini 的多模态支持可让您将视觉设计转换为可运行的界面代码。您只需上传图像并使用清晰的提示即可。无论您是提供自己制作的草图还是设计师的模型图,这一功能都可以发挥作用。

以下是一个示例提示:"请根据提供的图像编写 Android Jetpack Compose 代码,生成一个尽可能接近该图像的界面。请确保包括导入语句、使用 Material3 并添加代码注释。" 然后,您可以根据需要添加与图像相关的特定或附加说明。

对于更复杂的界面,请优化您的提示以明确所需的特定功能。例如,在转换计算器原型时,添加 "使交互和计算按预期工作" 的提示,会生成一个功能完备的计算器:

请注意:此功能提供的是一个初始的设计框架。这是一个很好的 "初稿",需要您进行编辑和调整。常见的优化包括确保导入正确的可绘制资源和图标。您可以将生成的代码理解为高效的起点,从而加快您的界面开发工作流程。

图表说明和文档

借助 Gemini 的多模态能力,您还可以尝试上传图表图像,并要求提供解释或生成文档。

提示示例:上传 Now in Android 架构图,并输入 "解释此图中的组件和数据流" 或 "撰写有关此图的文档"。

界面问题排查

利用 Gemini 的视觉分析能力来快速识别和解决 bug。上传有问题的界面屏幕截图,Gemini 将分析图像并提供潜在的解决方案。您还可以添加相关的代码片段,以获得更精确的帮助。

在下面的示例中,我们使用了 Compose 界面检查,发现按钮在平板电脑屏幕上拉伸得太宽,因此我们截取了屏幕截图并要求 Gemini 提供解决方案——它能够利用窗口大小类别 (Window Size Classes) 来提供正确的解决方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Android
    +关注

    关注

    12

    文章

    4041

    浏览量

    134798
  • AI
    AI
    +关注

    关注

    91

    文章

    41967

    浏览量

    303061
  • Studio
    +关注

    关注

    2

    文章

    230

    浏览量

    30840

原文标题:Android Studio 中的 Gemini 现已支持多模态图像附件功能

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    借助任意智能体实现高质量Android开发

    作为 Android 开发者,您在选择用于应用开发的智能体、工具和 LLM 时有丰富的选择。无论是在使用 Android Studio Gem
    的头像 发表于 05-11 11:03 458次阅读
    借助任意智能体实现高质量<b class='flag-5'>Android</b>开发

    模态大模型 前沿算法与实战应用 第一季》精品课程简介

    全栈掌握模态:从算法原理到项目落地的技术实践 在人工智能从单模态模态跨越的进程,全栈开发
    发表于 05-01 17:46

    ADPD4100/ADPD4101模态传感器前端:功能特点与应用解析

    ADPD4100/ADPD4101模态传感器前端:功能特点与应用解析 一、引言 在电子设计领域,传感器前端的性能对整个系统的表现起着至关重要的作用。ADPD4100/ADPD4101作为
    的头像 发表于 03-27 14:50 238次阅读

    ADPD4200 模态传感器前端:功能、应用与设计要点

    前端,具有丰富的特性和广泛的应用场景,下面我们就来详细了解一下。 文件下载: ADPD4200.pdf 一、ADPD4200 概述 ADPD4200 是一款功能强大的模态传感器前端,可刺激多达四个发光二极管(LED),并在多达
    的头像 发表于 03-27 09:35 268次阅读

    ADPD7008 模态传感器前端:特性、应用与设计指南

    ADPD7008 模态传感器前端:特性、应用与设计指南 在当今的电子设备设计,对于高精度、多功能传感器前端的需求日益增长。ADPD7008 作为一款高度集成的模拟前端(AFE),为
    的头像 发表于 03-25 18:40 654次阅读

    Ultrahuman使用Android StudioGemini解决技术障碍并提升性能

    Android Studio Gemini 的上下文感知工具,Ultrahuman 团队得以简化和加速其开发流程。
    的头像 发表于 03-12 09:31 391次阅读

    Gemini CLI 中转站配置使用教程

    gemini-cli gemini > 给我一个昨天所有更改的摘要 ? 主要功能 代码理解与生成 查询和编辑大型代码库 使用模态
    发表于 02-10 17:29

    商汤科技正式开源模态自主推理模型SenseNova-MARS

    今日,商汤正式开源模态自主推理模型 SenseNova-MARS(8B/32B 双版本),其在模态搜索与推理的核心基准测试以 69.7
    的头像 发表于 01-30 10:13 879次阅读
    商汤科技正式开源<b class='flag-5'>多</b><b class='flag-5'>模态</b>自主推理模型SenseNova-MARS

    商汤开源SenseNova-MARS:突破模态搜索推理天花板

    今日,商汤正式开源模态自主推理模型 SenseNova-MARS(8B/32B 双版本),其在模态搜索与推理的核心基准测试以 69.7
    的头像 发表于 01-29 23:53 306次阅读
    商汤开源SenseNova-MARS:突破<b class='flag-5'>多</b><b class='flag-5'>模态</b>搜索推理天花板

    谷歌Android Studio Otter 3功能更新发布

    我们很高兴地宣布,Android Studio Otter 3 功能更新稳定版现已发布!本次更新干货满满,不仅重磅升级了 Android Studi
    的头像 发表于 01-28 14:15 992次阅读
    谷歌<b class='flag-5'>Android</b> <b class='flag-5'>Studio</b> Otter 3<b class='flag-5'>功能</b>更新发布

    亚马逊云科技上线Amazon Nova模态嵌入模型

    Embeddings模态嵌入模型现已在Amazon Bedrock上线,这是一款专为Agentic RAG与语义搜索应用打造的顶尖模态嵌入模型。该模型是首个通过单一模型
    的头像 发表于 10-29 17:15 440次阅读
    亚马逊云科技上线Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模态</b>嵌入模型

    商汤日日新V6.5模态大模型登顶全球权威榜单

    Pro)模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型。
    的头像 发表于 09-10 09:55 1040次阅读

    米尔RK3576部署端侧模态轮对话,6TOPS算力驱动30亿参数LLM

    轮交互机制程序会提供预设问题供用户选择(官方案例也有输入序号,可以快速提问),同时支持用户自定义输入,核心交互逻辑通过以下机制实现:
    发表于 09-05 17:25

    Android StudioGemini全面支持Dart和Flutter开发

    Android Studio 创建 Android 应用的 Flutter 开发者将迎来一次重大的飞跃: Android
    的头像 发表于 08-06 13:52 1612次阅读
    <b class='flag-5'>Android</b> <b class='flag-5'>Studio</b><b class='flag-5'>中</b>的<b class='flag-5'>Gemini</b>全面<b class='flag-5'>支持</b>Dart和Flutter开发

    Firebase Studio现已集成Gemini 2.5

    。近期,我们通过增强其内置的 App Prototyping 智能体,使其采用 Google 强大的 AI 模型 Gemini 2.5。所有 Firebase Studio 预览版用户现在都可以使用升级后集成 Gemini 2.
    的头像 发表于 07-10 18:13 1206次阅读