0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

英特尔中国 来源:未知 2023-06-30 19:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英特尔研究院宣布与Blockade Labs合作发布LDM3D(Latent Diffusion Model for 3D)模型,这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型,进而生成逼真的、沉浸式的360度全景图。LDM3D有望革新内容创作、元宇宙应用和数字体验,改变包括娱乐、游戏、建筑和设计在内的许多行业。

生成式AI技术旨在提高和增强人类创造力,并节省时间。然而,目前的大部分生成式AI模型仅限于生成2D图像,仅有少数几种可根据文本提示生成3D图像。在使用几乎相同数量参数的情况下,不同于现存的潜在扩散模型,LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比,LDM3D能够为图像中的每个像素提供更精准的相对深度,并为开发者省去了大量用于场景开发的时间。

--Vasudev Lal

英特尔研究院人工智能机器学习研究专家

封闭的生态系统限制了规模。英特尔致力于推动AI的真正普及,通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展,特别是在生成式AI方面。然而,当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2D RGB图像的现有扩散模型不同,LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计(depth estimation)中的标准后处理(post-processing)方法相比,LDM3D在使用与潜在扩散模型Stable Diffusion几乎相同数量参数的情况下,能够为图像中的每个像素提供更精准的相对深度(relative depth)。

这项研究有望改变我们与数字内容的互动方式,基于文本提示为用户提供全新的体验。LDM3D生成的图像和深度图能够将诸如宁静的热带海滩、摩天大楼、科幻宇宙等文本描述转化为细致的360度全景图。LDM3D捕捉深度信息的能力,可以即时增强整体真实感和沉浸感,使各行各业的创新应用成为可能,包括娱乐、游戏、室内设计、房产销售,以及虚拟博物馆与沉浸式VR体验等。

6月20日,在IEEE/CVF计算机视觉和模式识别会议(CVPR)的3DMV工作坊上,LDM3D模型获得了“Best Poster Award”。

LDM3D是在LAION-400M数据集包含一万个样本的子集上训练而成的。LAION-400M是一个大型图文数据集,包含超过4亿个图文对。对训练语料库进行标注时,研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large,为图像中的每个像素提供了高度准确的相对深度。LAION-400M数据集是基于研究用途创建而成的,以便广大研究人员和其它兴趣社群能在更大规模上测试模型训练。

为了展示LDM3D的潜力,英特尔和Blockade的研究人员开发了应用程序DepthFusion,通过标准的2D RGB图像和深度图创建沉浸式、交互式的360度全景体验。DepthFusion利用了TouchDesigner,一种基于节点的可视化编程语言,用于实时互动多媒体内容,可将文本提示转化为交互式和沉浸式数字体验。LDM3D是能生成RGB图像及其深度图的单一模型,因此能够节省内存占用和降低延迟。

备注:

1 地址:https://huggingface.co/docs/diffusers/main/en/api/pipelines/stable_diffusion/ldm3d_diffusion

2 地址:

https://arxiv.org/abs/2305.10853


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179360
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11223

    浏览量

    223015

原文标题:英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型
    的头像 发表于 08-07 14:42 1124次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大<b class='flag-5'>模型</b>

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特
    的头像 发表于 06-27 11:44 629次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制器与边缘智算一体机,创造“AI新视界”

    在2025北京机器视觉展览会(VisionChina)以“AI 视界:英特尔推动智能制造革新浪潮”为主题的英特尔论坛中,英特尔与诺达佳联合发布
    发表于 06-24 17:50 1393次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>发布</b>边缘<b class='flag-5'>AI</b>控制器与边缘智算一体机,创造“<b class='flag-5'>AI</b>新视界”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    电子发烧友原创  章鹰 5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新
    的头像 发表于 05-21 00:57 7001次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新
    的头像 发表于 05-20 12:27 5185次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    Computex 2025上,英特尔发布了为专业人士和开发者设计的全新图形处理器(GPU)和AI加速器产品系列。包括: 全新
    发表于 05-20 11:03 1678次阅读

    从想象到现实,英特尔与MAXHUB带你走进AI PC新视界

    事业部边缘计算CTO、英特尔客户端计算事业部高级首席AI工程师张宇博士、MAXHUB总裁林宇升出席会议,并就研发理念、产品技术进行分享。 张宇博士表示:“大语言模型生成
    的头像 发表于 04-21 10:40 413次阅读
    从想象到现实,<b class='flag-5'>英特尔</b>与MAXHUB带你走进<b class='flag-5'>AI</b> PC新视界

    自然语言提示原型在英特尔Vision大会上首次亮相

    英特尔Vision大会上,Network Optix首次展示了自然语言提示原型,该方案将重新定义视频管理,为各行各业由AI驱动的洞察和效率提速。
    的头像 发表于 04-09 09:30 796次阅读

    英特尔酷睿Ultra AI PC上部署多种图像生成模型

    全新英特尔酷睿Ultra 200V系列处理器对比上代Meteor Lake,升级了模块化结构、封装工艺,采用全新性能核与能效核、英特尔硬件线程调度器、Xe2微架构锐炫GPU、第四代NP
    的头像 发表于 04-02 15:47 1160次阅读
    在<b class='flag-5'>英特尔</b>酷睿Ultra <b class='flag-5'>AI</b> PC上部署多种图像<b class='flag-5'>生成</b><b class='flag-5'>模型</b>

    英特尔借助开放生态系统,加速边缘AI创新

    英特尔推出全新AI边缘系统、边缘AI套件和开放边缘平台软件,赋能合作伙伴将AI无缝融入现有基础设施  
    发表于 03-21 11:31 302次阅读
    <b class='flag-5'>英特尔</b>借助开放生态系统,加速边缘<b class='flag-5'>AI</b>创新

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型
    发表于 03-05 08:32

    英特尔OpenVINO 2025.0正式发布

    生成AI(GenAI)在模型质量与应用范围上持续爆发式增长,DeepSeek 等顶尖模型已引发行业热议,这种势头预计将在 2025年延续。本次更新聚焦性能提升、更多
    的头像 发表于 02-21 10:20 1683次阅读
    <b class='flag-5'>英特尔</b>OpenVINO 2025.0正式<b class='flag-5'>发布</b>

    DeepSeek发布Janus Pro模型英特尔Gaudi 2D AI加速器优化支持

    近日,DeepSeek公司正式发布了其最新的Janus Pro模型,该模型凭借其超强性能和高精度,迅速引起了业界的广泛关注。 为了进一步提升Janus Pro模型的应用效率和降低成本,
    的头像 发表于 02-08 14:35 920次阅读

    英特尔CES 2025发布全新酷睿Ultra处理器

    近日,在万众瞩目的国际消费电子展(CES 2025)上,英特尔再次展现了其在科技领域的领导地位,发布全新英特尔® 酷睿™ Ultra处理器(第二代)。这款处理器的问世,标志着
    的头像 发表于 01-10 13:57 1887次阅读

    安谋科技与智源研究院达成战略合作,共建开源AI“芯”生态

    12月25日,安谋科技(中国)有限公司(以下简称“安谋科技”)与北京智源人工智能研究院(以下简称“智源研究院”)正式签署战略合作协议,双方将面向多元AI芯片领域开展算子库优化与适配、编译器与工具链
    发表于 12-26 17:06 632次阅读
    安谋科技与智源<b class='flag-5'>研究院</b>达成战略合作,共建开源<b class='flag-5'>AI</b>“芯”生态