0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RTX AI加速FLUX.1 Kontext系列图像模型

NVIDIA英伟达 来源:NVIDIA英伟达 2025-08-05 16:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Black Forest Labs,作为全球顶尖 AI 研究实验室之一,为图像生成领域带来颠覆性变革。

该实验室的 FLUX.1 图像模型凭借高质量视觉输出和优秀的提示词遵循度,引发全球业界关注。现在,通过推出其最新 FLUX.1 Kontext 模型,该实验室从根本上改变了用户引导和优化图像生成过程的方式。

为了获得预期效果,AI 艺术家们通常需要整合多个模型架构并配合 ControlNets 模块,而这些 AI 模型有助于引导图像生成器的输出。这通常需要结合多个 ControlNets 或采用更高级的技术,例如 NVIDIA AI Blueprint 中推出的 3D 引导图像生成,这种方法通过 3D 场景粗稿确定图像构成。

全新 FLUX.1 Kontext 模型通过单一模型实现自然语言驱动的图像生成与编辑,大幅简化了工作流程。

NVIDIA 已与 Black Forest Labs 达成合作,通过 NVIDIA TensorRT 及量化技术对 FLUX. 1 Kontext [dev] 进行深度优化,使其在 RTX GPU 上实现更快的推理速度与更低的 VRAM 显存需求。

对于创作者和开发者而言,通过 TensorRT 优化,RTX 设备可带来更快的编辑速度、更流畅的迭代和更强大的控制。

FLUX.1 Kontext [dev]

语境感知图像生成

Black Forest Labs 于五月推出 FLUX.1 Kontext 系列图像模型,该模型同时接受文本和图像提示。

该系列模型支持用户基于参考图像进行创作,并使用简单的语言进行编辑,无需通过微调或使用多 ControlNet 的复杂工作流。

FLUX.1 Kontext 是一种专为图像编辑构建的开放式生成模型,其引导式、逐步生成架构支持从局部细节到全局场景转换的精准控制。由于该模型接受文本和图像双输入,让用户可以轻松引用视觉概念,并以自然、直观的方式引导其创作。这可以实现连贯且高质量的图像编辑,同时忠实于原始概念。

FLUX.1 Kontext 的关键功能包括:

角色一致性:确保人物特征在多镜头多视角下保持统一。

局部编辑:在不改变图像其他部分的情况下,修改特定元素。

风格迁移:将参考图像的风格和氛围应用于新场景。

实时性能:低延迟生成支持快速迭代和反馈。

Black Forest Labs 正式在 Hugging Face 平台上发布 FLUX.1 Kontext 模型权重,并同步推出经过 TensorRT 加速优化的专用版本。

传统上,高级图像编辑需要复杂的指令,并且难以创建遮罩层、深度图或边缘图。FLUX.1 Kontext [dev] 引入了一种更加直观且灵活的界面,将逐步编辑与用于扩散模型推理的尖端优化相结合。

[dev] 模型强调灵活性与控制力。该系统支持角色一致性、风格保留和局部图像调整等功能,并集成了 ControlNet 功能,实现结构化视觉提示。

FLUX.1 Kontext [dev] 现已登陆 ComfyUI 及 Black Forest Labs Playground 平台,其搭载 NVIDIA NIM 微服务版本预计将于八月正式发布。

专为 RTX 优化

并采用 TensorRT 加速技术

FLUX.1 Kontext [dev] 通过简化复杂的工作流程来加速创意。为了进一步简化工作并扩大可访性,NVIDIA 与 Black Forest Labs 合作:通过模型量化,降低 VRAM 显存需求,使更多用户能在本地运行该模型,并采用 TensorRT 对其进行优化,使其性能翻倍。

量化处理后,FP8 的模型大小从 24GB 减小至 12GB(Ada),FP4 的模型大小从 24GB 减小至 7GB(Blackwell)。FP8 模型针对 GeForce RTX 40 系列 GPU 进行优化,这些 GPU 的 Tensor Core 配备了 FP8 加速器。FP4 模型专为 GeForce RTX 50 系列 GPU 优化,该系列显卡采用新型 SVDQuant 量化技术,在将模型大小缩减的同时,保持卓越的图像生成质量。

TensorRT 是一个利用 NVIDIA RTX GPU 中 Tensor Core 实现最大化性能的框架,与使用 PyTorch 运行原始 BF16 模型相比,能够提供超过两倍的加速效果。

19887504-6ba0-11f0-a18e-92fbcf53809c.png

与 BF16 GPU 相比,速度提升(左,值越高效果越好)和运行 FLUX.1 Kontext [dev] 在不同精度下所需的内存占用(右,值越低效果越好)。

开始使用 FLUX.1 Kontext

FLUX.1 Kontext [dev] 可在 Hugging Face(Torch 和 TensorRT)平台下载。

对这些模型测试感兴趣的 AI 爱好者可以下载 Torch 版本,并在 ComfyUI 平台上部署使用。Black Forest Labs 还提供一个在线测试平台用于测试该模型。

针对高级用户和开发者,NVIDIA 正在开发示例代码,方便将 TensorRT 流水线轻松集成到工作流程中。

结尾彩蛋

Google 宣布推出 Gemma 3n,这是一款新型多模态小语言模型,非常适合在 NVIDIA GeForce RTX GPUs 以及用于边缘 AI 和机器人技术的 NVIDIA Jetson 平台上运行。

AI 爱好者可以在 Ollama 和 llama.cpp 框架中,借助 RTX 加速,使用 Gemma 3n 模型,并通过他们喜欢的应用程序,比如 AnythingLLM 和 LM Studio,轻松体验和开发 AI 功能。

此外,开发者可通过 Ollama 框架轻松部署 Gemma 3n 模型,并充分利用 RTX 加速优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109117
  • AI
    AI
    +关注

    关注

    90

    文章

    38189

    浏览量

    297007
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719

原文标题:RTX AI 加速 FLUX.1 Kontext 现已开放下载

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI
    的头像 发表于 12-01 09:25 546次阅读

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000
    的头像 发表于 11-28 09:39 3858次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> PRO 2000 Blackwell GPU性能测试

    面向科学仿真的开放模型系列NVIDIA Apollo正式发布

    用于加速工业和计算工程的开放模型系列 NVIDIA Apollo 于近日举行的 SC25 大会上正式发布。
    的头像 发表于 11-25 11:15 3w次阅读

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTXNVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑
    的头像 发表于 07-16 09:16 1869次阅读

    NVIDIA计划打造全球首个工业AI云平台

    NVIDIA 宣布,其正在为欧洲制造商构建全球首个工业 AI 云。这家总部位于德国的 AI 工厂将配备 1 万个 GPU,包括通过 NVIDIA
    的头像 发表于 06-16 14:17 1108次阅读

    NVIDIA Cosmos加速机器人和自动驾驶汽车物理AI发展

    NVIDIA Cosmos 通过可预测未来世界状态的世界基础模型加速物理 AI 的发展。
    的头像 发表于 04-24 11:01 947次阅读
    <b class='flag-5'>NVIDIA</b> Cosmos<b class='flag-5'>加速</b>机器人和自动驾驶汽车物理<b class='flag-5'>AI</b>发展

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI开发

    NVIDIA GTC 推出新一代专业级 GPU 和 AI 赋能的开发者工具—同时,ChatRTX 更新现已支持 NVIDIA NIM,RTX Remix 正式结束测试阶段,本月的
    的头像 发表于 03-28 09:59 1084次阅读

    英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展
    的头像 发表于 03-20 15:03 1082次阅读

    NVIDIA RTX 5880 Ada显卡部署DeepSeek-R1模型实测报告

    DeepSeek-R1 模型在 4 张 NVIDIA RTX 5880 Ada 显卡配置下,面对短文本生成、长文本生成、总结概括三大实战场景,会碰撞出怎样的性能火花?参数规模差异悬殊的
    的头像 发表于 03-17 11:12 2619次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> 5880 Ada显卡部署DeepSeek-R<b class='flag-5'>1</b><b class='flag-5'>模型</b>实测报告

    使用OpenVINO GenAI和LoRA适配器进行图像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用户可以将平平无奇的文本提示词转换为令人惊艳的视觉效果。
    的头像 发表于 03-12 13:49 1558次阅读
    使用OpenVINO GenAI和LoRA适配器进行<b class='flag-5'>图像</b>生成

    NVIDIA RTX 4500 Ada与NVIDIA RTX A5000的对比

    基于大众所熟知的 NVIDIA Ada Lovelace 架构,NVIDIA RTX 4500 Ada Generation是一款介于 NVIDIA
    的头像 发表于 03-05 10:30 3752次阅读

    NVIDIA GeForce RTX 50系列AI计算机图形新纪元

    和笔记本电脑两种版本,均搭载了NVIDIA革命性的Blackwell架构。 Blackwell架构的引入,使得GeForce RTX 50系列AI渲染领域实现了前所未有的突破。其内置
    的头像 发表于 01-13 10:49 790次阅读

    NVIDIA推出面向RTX AI PC的AI基础模型

    NVIDIA 今日发布能在 NVIDIA RTX AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力。
    的头像 发表于 01-08 11:01 881次阅读

    技嘉于 CES 2025 首度亮相升级散热设计与精实体积的 NVIDIA GeForce RTX 50 系列显卡

    NVIDIA GeForce RTX™ 50 系列显示芯片设计的散热系统,可大幅提升高负载需求的游戏表现。以 "Evolution of Ten" 为设计概念,技嘉新系列显卡提升高达
    的头像 发表于 01-07 17:57 783次阅读

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 1268次阅读