0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

英特尔中国 来源:未知 2023-06-30 19:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英特尔研究院宣布与Blockade Labs合作发布LDM3D(Latent Diffusion Model for 3D)模型,这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型,进而生成逼真的、沉浸式的360度全景图。LDM3D有望革新内容创作、元宇宙应用和数字体验,改变包括娱乐、游戏、建筑和设计在内的许多行业。

生成式AI技术旨在提高和增强人类创造力,并节省时间。然而,目前的大部分生成式AI模型仅限于生成2D图像,仅有少数几种可根据文本提示生成3D图像。在使用几乎相同数量参数的情况下,不同于现存的潜在扩散模型,LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比,LDM3D能够为图像中的每个像素提供更精准的相对深度,并为开发者省去了大量用于场景开发的时间。

--Vasudev Lal

英特尔研究院人工智能机器学习研究专家

封闭的生态系统限制了规模。英特尔致力于推动AI的真正普及,通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展,特别是在生成式AI方面。然而,当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2D RGB图像的现有扩散模型不同,LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计(depth estimation)中的标准后处理(post-processing)方法相比,LDM3D在使用与潜在扩散模型Stable Diffusion几乎相同数量参数的情况下,能够为图像中的每个像素提供更精准的相对深度(relative depth)。

这项研究有望改变我们与数字内容的互动方式,基于文本提示为用户提供全新的体验。LDM3D生成的图像和深度图能够将诸如宁静的热带海滩、摩天大楼、科幻宇宙等文本描述转化为细致的360度全景图。LDM3D捕捉深度信息的能力,可以即时增强整体真实感和沉浸感,使各行各业的创新应用成为可能,包括娱乐、游戏、室内设计、房产销售,以及虚拟博物馆与沉浸式VR体验等。

6月20日,在IEEE/CVF计算机视觉和模式识别会议(CVPR)的3DMV工作坊上,LDM3D模型获得了“Best Poster Award”。

LDM3D是在LAION-400M数据集包含一万个样本的子集上训练而成的。LAION-400M是一个大型图文数据集,包含超过4亿个图文对。对训练语料库进行标注时,研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large,为图像中的每个像素提供了高度准确的相对深度。LAION-400M数据集是基于研究用途创建而成的,以便广大研究人员和其它兴趣社群能在更大规模上测试模型训练。

为了展示LDM3D的潜力,英特尔和Blockade的研究人员开发了应用程序DepthFusion,通过标准的2D RGB图像和深度图创建沉浸式、交互式的360度全景体验。DepthFusion利用了TouchDesigner,一种基于节点的可视化编程语言,用于实时互动多媒体内容,可将文本提示转化为交互式和沉浸式数字体验。LDM3D是能生成RGB图像及其深度图的单一模型,因此能够节省内存占用和降低延迟。

备注:

1 地址:https://huggingface.co/docs/diffusers/main/en/api/pipelines/stable_diffusion/ldm3d_diffusion

2 地址:

https://arxiv.org/abs/2305.10853


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10342

    浏览量

    181376
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11378

    浏览量

    226509

原文标题:英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,
    的头像 发表于 04-26 16:27 1.1w次阅读
    <b class='flag-5'>AI</b>工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别云端Token焦虑

    万里红入选信通2025高质量数字化转型全景图三大核心领域

    3月26 日,北京万里红科技有限公司(以下简称:万里红)受邀出席中国信息通信研究院“铸基计划2026 年度会议”。大会重磅发布《高质量数字化转型产品及服务全景图(2025)》,万里红凭借过硬的技术
    的头像 发表于 04-08 09:48 636次阅读

    性能再越级!英特尔推出全新酷睿Ultra 200HX Plus系列移动处理器

    英特尔酷睿Ultra 200HX Plus系列登场,全新酷睿 Ultra 9 290HX Plus和酷睿Ultra 7 270HX Plus处理器,为极致性能需求注入更强动力。 今日,英特尔
    的头像 发表于 03-19 16:43 478次阅读

    释放极致游戏性能!英特尔酷睿Ultra 200S Plus发布

    :今日,英特尔发布全新英特尔酷睿Ultra 200S Plus 系列台式机处理器——270K  Plus和 250K Plus,以全新特性和
    的头像 发表于 03-19 13:13 595次阅读

    英特尔与华阳通用联手推出全新AI Box解决方案

    英特尔宣布推出基于最新英特尔 酷睿 Ultra 架构的AI Box解决方案,将PC级旗舰算力引入汽车、工业自动化、轨道交通、机器人等多种工业环境,为各行各业接入AI
    的头像 发表于 03-02 14:15 901次阅读

    英特尔携手产学合作伙伴发布《具身智能机器人安全子系统白皮书》

    提供全方位、多层次的安全保障。此白皮书由来自英特尔中国研究院、武汉大学、香港中文大学(深圳)、清华大学、国地共建具身智能机器人创新中心、南京英麒智能、优必选科技和英特尔亚太研发中心的技术专家合作撰写。 具身智能机
    的头像 发表于 12-16 17:39 895次阅读
    <b class='flag-5'>英特尔</b>携手产学合作伙伴<b class='flag-5'>发布</b>《具身智能机器人安全子系统白皮书》

    纤纳光电获得2025年浙江省企业研究院认定

    近日,浙江省经济和信息化厅发布2025年拟认定省企业研究院名单。经企业申报、县级审查、市级推荐、专家评审等程序,纤纳光电建设的“浙江省纤纳新能源钙钛矿技术企业研究院”成功入选。
    的头像 发表于 12-16 17:31 1548次阅读

    大显存突破!解锁120B MoE大模型英特尔酷睿Ultra 285H拓展AI新应用

    电子发烧友原创 章鹰 11月20日,在2025英特尔技术创新与产业生态大会上,英特尔中国技术部总经理高宇宣布,今天我们带来两款重要的产品,英特尔® 酷睿™ Ultra 200H系列,这款产品已经
    的头像 发表于 11-23 08:00 1w次阅读
    大显存突破!解锁120B MoE大<b class='flag-5'>模型</b>,<b class='flag-5'>英特尔</b>酷睿Ultra 285H拓展<b class='flag-5'>AI</b>新应用

    芯盾时代入选2025年中国网络安全市场全景图

    近日,数说安全正式发布《2025年中国网络安全市场全景图》(以下简称“全景图”)。芯盾时代凭借领先的技术能力、优异的市场表现和良好的客户口碑,连续上榜全景图,被评选为零信任、身份认证与
    的头像 发表于 08-26 10:29 1863次阅读

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型
    的头像 发表于 08-07 14:42 1636次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大<b class='flag-5'>模型</b>

    今日看点丨亚马逊上海AI研究院解散;索尼拟出售以色列芯片部门

          1、 亚马逊上海AI研究院解散! 据报道,AWS亚马逊云科技上海AI研究院的首席应用科学家王敏捷发朋友圈称,他们收到通知,AWS亚马逊云科技上海
    发表于 07-24 09:42 1487次阅读
    今日看点丨亚马逊上海<b class='flag-5'>AI</b><b class='flag-5'>研究院</b>解散;索尼拟出售以色列芯片部门

    商汤大装置万象大模型开发平台获得中国信通最高评级

    近日,中国信息通信研究院(以下简称“中国信通”)完成可信AI《大模型推理平台通用能力成熟》首轮评估。
    的头像 发表于 07-01 10:48 1201次阅读

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特
    的头像 发表于 06-27 11:44 1132次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制器与边缘智算一体机,创造“AI新视界”

    在2025北京机器视觉展览会(VisionChina)以“AI 视界:英特尔推动智能制造革新浪潮”为主题的英特尔论坛中,英特尔与诺达佳联合发布
    发表于 06-24 17:50 1609次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>发布</b>边缘<b class='flag-5'>AI</b>控制器与边缘智算一体机,创造“<b class='flag-5'>AI</b>新视界”

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。 英特尔客户端计算事
    的头像 发表于 06-20 17:32 1149次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”