0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Android Studio中的Gemini支持多模态输入功能

谷歌开发者 来源:谷歌开发者 2025-05-14 16:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / Android Studio 开发者产品经理 Paris Hsu

在开发生命周期的每个阶段,Android Studio 中的 Gemini 都已成为您的 AI 助手,助您更轻松地构建高质量的应用。我们很高兴地与您分享一项重大升级:Android Studio 中的 Gemini 现已支持多模态输入,您可在提示中直接添加图像!这为团队协作和界面开发工作流程解锁了更多新的可能性。

您可以下载最新的 Android Studio Canary 版来体验这项新功能。我们列举了一些可以尝试的用例,目前仍在努力将此功能引入未来的稳定版本。在此过程中,我们十分期待了解您的想法与反馈。

图像附件 - 交互新维度

我们在 2024 Google I/O 大会上首次预览了 Gemini 的多模态功能。借助这项技术,Android Studio 中的 Gemini 能够理解简单的线框图,并将其转换为可运行的 Jetpack Compose 代码。

现在,您可以在 Gemini 聊天窗口中找到图像附件图标。只需将 JPEG 或 PNG 文件作为附件添加到提示中,即可静待 Gemini 理解并响应视觉信息。我们观察到,具有强烈色彩对比度的图像效果最佳。

我们建议您尝试各种提示和图像。您可从以下这些引人注目的用例入手:

快速界面原型设计和迭代:将应用界面的简单线框图或高保真原型转换为可运行的代码。

图表说明和文档:让 Gemini 解释复杂架构或数据流程图的组成部分和关系,从而获得更深入的理解。

界面问题排查:捕获界面错误屏幕截图,并向 Gemini 寻求解决方案。

快速界面原型设计和迭代

Gemini 的多模态支持可让您将视觉设计转换为可运行的界面代码。您只需上传图像并使用清晰的提示即可。无论您是提供自己制作的草图还是设计师的模型图,这一功能都可以发挥作用。

以下是一个示例提示:"请根据提供的图像编写 Android Jetpack Compose 代码,生成一个尽可能接近该图像的界面。请确保包括导入语句、使用 Material3 并添加代码注释。" 然后,您可以根据需要添加与图像相关的特定或附加说明。

对于更复杂的界面,请优化您的提示以明确所需的特定功能。例如,在转换计算器原型时,添加 "使交互和计算按预期工作" 的提示,会生成一个功能完备的计算器:

请注意:此功能提供的是一个初始的设计框架。这是一个很好的 "初稿",需要您进行编辑和调整。常见的优化包括确保导入正确的可绘制资源和图标。您可以将生成的代码理解为高效的起点,从而加快您的界面开发工作流程。

图表说明和文档

借助 Gemini 的多模态能力,您还可以尝试上传图表图像,并要求提供解释或生成文档。

提示示例:上传 Now in Android 架构图,并输入 "解释此图中的组件和数据流" 或 "撰写有关此图的文档"。

界面问题排查

利用 Gemini 的视觉分析能力来快速识别和解决 bug。上传有问题的界面屏幕截图,Gemini 将分析图像并提供潜在的解决方案。您还可以添加相关的代码片段,以获得更精确的帮助。

在下面的示例中,我们使用了 Compose 界面检查,发现按钮在平板电脑屏幕上拉伸得太宽,因此我们截取了屏幕截图并要求 Gemini 提供解决方案——它能够利用窗口大小类别 (Window Size Classes) 来提供正确的解决方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Android
    +关注

    关注

    12

    文章

    3986

    浏览量

    133070
  • AI
    AI
    +关注

    关注

    89

    文章

    38113

    浏览量

    296659
  • Studio
    +关注

    关注

    2

    文章

    221

    浏览量

    30560

原文标题:Android Studio 中的 Gemini 现已支持多模态图像附件功能

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亚马逊云科技上线Amazon Nova模态嵌入模型

    Embeddings模态嵌入模型现已在Amazon Bedrock上线,这是一款专为Agentic RAG与语义搜索应用打造的顶尖模态嵌入模型。该模型是首个通过单一模型
    的头像 发表于 10-29 17:15 116次阅读
    亚马逊云科技上线Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模态</b>嵌入模型

    商汤日日新V6.5模态大模型登顶全球权威榜单

    Pro)模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型。
    的头像 发表于 09-10 09:55 488次阅读

    米尔RK3576部署端侧模态轮对话,6TOPS算力驱动30亿参数LLM

    轮交互机制程序会提供预设问题供用户选择(官方案例也有输入序号,可以快速提问),同时支持用户自定义输入,核心交互逻辑通过以下机制实现:
    发表于 09-05 17:25

    Android StudioGemini全面支持Dart和Flutter开发

    Android Studio 创建 Android 应用的 Flutter 开发者将迎来一次重大的飞跃: Android
    的头像 发表于 08-06 13:52 1076次阅读
    <b class='flag-5'>Android</b> <b class='flag-5'>Studio</b><b class='flag-5'>中</b>的<b class='flag-5'>Gemini</b>全面<b class='flag-5'>支持</b>Dart和Flutter开发

    Firebase Studio现已集成Gemini 2.5

    。近期,我们通过增强其内置的 App Prototyping 智能体,使其采用 Google 强大的 AI 模型 Gemini 2.5。所有 Firebase Studio 预览版用户现在都可以使用升级后集成 Gemini 2.
    的头像 发表于 07-10 18:13 775次阅读

    谷歌I/O 2025大会前透露:Android 16接入Gemini,智能手机、XR设备升级

    ”直播活动,提前预告Android 16将迎来全新的升级,包括全新的设计语言、将通过Gemini实现跨设备融合、推出新的安全功能保障设备。并在接下来几个月的时间里,深度融入智能手机、智能手表、智能汽车
    的头像 发表于 05-18 00:03 7202次阅读
    谷歌I/O 2025大会前透露:<b class='flag-5'>Android</b> 16接入<b class='flag-5'>Gemini</b>,智能手机、XR设备升级

    MaaS X Cherry Studio:基于DeepSeek API快速构建个人AI智能助手

    Cherry Studio 是一款开源的模型桌面客户端,支持 Windows、macOS 和 Linux 系统。它集成了多种主流大语言模型(如 OpenAI、DeepSeek、Gemini
    的头像 发表于 04-19 13:38 3326次阅读
    MaaS X Cherry <b class='flag-5'>Studio</b>:基于DeepSeek API快速构建个人AI智能助手

    模态交互技术解析

    模态交互 模态交互( Multimodal Interaction )是指通过多种感官通道(如视觉、听觉、触觉等)或多种交互方式(如语音、手势、触控、眼动等)与计算机系统进行自然、
    的头像 发表于 03-17 15:12 3520次阅读

    Android Studio Ladybug Feature Drop版本的新功能

    Android Studio Ladybug Feature Drop (2024.2.2) 稳定版已推出!
    的头像 发表于 03-03 16:13 855次阅读
    <b class='flag-5'>Android</b> <b class='flag-5'>Studio</b> Ladybug Feature Drop版本的新<b class='flag-5'>功能</b>

    三星 Galaxy S25 系列与谷歌 Gemini 深度整合

    设备上推出。 此外,Project Astra的屏幕共享和实时视频流功能也将在未来几个月内添加到Gemini实时更新。 扩展功能也十分实用,Gem
    的头像 发表于 01-23 17:41 1310次阅读

    体验MiniCPM-V 2.6 模态能力

    模态组网
    jf_23871869
    发布于 :2025年01月20日 13:40:48

    谷歌推出Gemini 2.0 Flash体验版

    我们正赋予开发者构建 AI 未来的能力,包括尖端模型、智能代码编写工具以及跨平台和设备的无缝集成。自 2023 年 12 月我们推出 Gemini 1.0 以来,数百万的开发者已经使用 Google AI Studio 和 Vertex AI 在 109 种语言中使用
    的头像 发表于 01-06 09:52 2561次阅读

    商汤日日新模态大模型权威评测第一

    刚刚,商汤科技日日新SenseNova模态大模型,在权威综合评测权威平台OpenCompass的模态评测取得榜单第一。
    的头像 发表于 12-20 10:39 1500次阅读

    谷歌正式发布Gemini 2.0 性能提升近两倍

    在智能体时代,谷歌再次引领技术潮流,正式发布了其最新力作——Gemini 2.0。这款AI模型不仅在性能上实现了显著提升,更是在模态表现和原生工具应用方面展现了前所未有的强大功能
    的头像 发表于 12-12 14:22 1117次阅读

    谷歌发布Gemini 2.0 AI模型

    下文处理技术,能够更有效地支持用户在学术及专业领域进行深入研究。这一新功能的推出,将为用户在探索复杂问题时提供更为精准和全面的帮助。 目前,Gemini 2.0 Flash体验版已经对所有Ge
    的头像 发表于 12-12 10:13 967次阅读