0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

惊!大脑视觉信号被Stable Diffusion复现成视频!

CVer 来源:量子位 2023-06-02 16:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

现在,AI可以把人类脑中的信息,用高清视频展示出来了!

例如你坐在副驾所欣赏到的沿途美景信息,AI分分钟给重建了出来:

e8e12ad0-fae1-11ed-90ce-dac502259ad0.gif

看到过的水中的鱼儿、草原上的马儿,也不在话下:

e8f91f00-fae1-11ed-90ce-dac502259ad0.gif

e90528ea-fae1-11ed-90ce-dac502259ad0.gif

这就是由新加坡国立大学和香港中文大学共同完成的最新研究,团队将项目取名为MinD-Video。

e914e28a-fae1-11ed-90ce-dac502259ad0.png

Cinematic Mindscapes: High-quality Video Reconstruction from Brain Activity 主页:https://mind-video.com/ 论文:https://arxiv.org/abs/2305.11675 代码:https://github.com/jqin4749/MindVideo

这波操作,宛如科幻电影《超体》中Lucy读取反派大佬记忆一般:

e91f001c-fae1-11ed-90ce-dac502259ad0.gif

引得网友直呼:

推动人工智能和神经科学的前沿。

e94a5302-fae1-11ed-90ce-dac502259ad0.png

值得一提的是,大火的Stable Diffusion也在这次研究中立了不小的功劳。

e9588300-fae1-11ed-90ce-dac502259ad0.png

怎么做到的?

从大脑活动中重建人类视觉任务,尤其是功能磁共振成像技术(fMRI)这种非侵入式方法,一直是受到学界较多的关注。

因为类似这样的研究,有利于理解我们的认知过程。

但以往的研究都主要聚焦在重建静态图像,而以高清视频形式来展现的工作还是较为有限。

之所以会如此,是因为与重建一张静态图片不同,我们视觉所看到的场景、动作和物体的变化是连续、多样化的。

而fMRI这项技术的本质是测量血氧水平依赖(BOLD)信号,并且在每隔几秒钟的时间里捕捉大脑活动的快照。

相比之下,一个典型的视频每秒大约包含30帧画面,如果要用fMRI去重建一个2秒的视频,就需要呈现起码60帧。

因此,这项任务的难点就在于解码fMRI并以远高于fMRI时间分辨率的FPS恢复视频。

为了弥合图像和视频大脑解码之间差距,研究团队便提出了MinD-Video的方法。

整体来看,这个方法主要包含两大模块,它们分别做训练,然后再在一起做微调。

e96f0e18-fae1-11ed-90ce-dac502259ad0.png

这个模型从大脑信号中逐步学习,在第一个模块多个阶段的过程,可以获得对语义空间的更深入理解。

具体而言,便是先利用大规模无监督学习与mask brain modeling(MBM)来学习一般的视觉fMRI特征。

然后,团队使用标注数据集的多模态提取语义相关特征,在对比语言-图像预训练(CLIP)空间中使用对比学习训练fMRI编码器

在第二个模块中,团队通过与增强版Stable Diffusion模型的共同训练来微调学习到的特征,这个模型是专门为fMRI技术下的视频生成量身定制的。

如此方法之下,团队也与此前的诸多研究做了对比,可以明显地看到MinD-Video方法所生成的图片、视频质量要远优于其它方法。

e97b83f0-fae1-11ed-90ce-dac502259ad0.png

而且在场景连续变化的过程中,也能够呈现高清、有意义的连续帧。

e98d88ac-fae1-11ed-90ce-dac502259ad0.png

研究团队

这项研究的共同一作,其中一位是来自新加坡国立大学的博士生Zijiao Chen,目前在该校的神经精神疾病多模式神经成像实验室(MNNDL_Lab)。

另一位一作则是来自香港中文大学的Jiaxin Qing,就读专业是信息工程系。

除此之外,通讯作者是新加坡国立大学副教授Juan Helen ZHOU。

据了解,这次的新研究是他们团队在此前一项名为MinD-Vis的功能磁共振成像图像重建工作的延伸。

MinD-Vis已经被CVPR 2023所接收。

e99ee28c-fae1-11ed-90ce-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41101

    浏览量

    302577
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266908
  • 视觉
    +关注

    关注

    1

    文章

    182

    浏览量

    24864
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何通过极细同轴线束解决视觉系统中的数据延迟和信号损失?

    极细同轴线束通过低信号衰减、强抗干扰、高频传输能力及灵活布线优势,有效解决了视觉系统中常见的数据延迟和信号损失问题。结合高性能微型连接器,整套方案能够最大化信号传输稳定性,为高速图像处
    的头像 发表于 04-12 13:29 260次阅读
    如何通过极细同轴线束解决<b class='flag-5'>视觉</b>系统中的数据延迟和<b class='flag-5'>信号</b>损失?

    视频信号检测板卡:208-Base Camera Link 图像信号模拟器

    标签: AD 子卡模块, DA子卡模块, 图像信号模拟器, 视频信号检测
    的头像 发表于 03-19 10:09 284次阅读
    <b class='flag-5'>视频信号</b>检测板卡:208-Base Camera Link 图像<b class='flag-5'>信号</b>模拟器

    PyTorch 中RuntimeError分析

    原生实现。这是一个已知的 PyTorch 限制,常见于 Stable Diffusion、ComfyUI 等使用 interpolate(..., mode=\'nearest\') 的模型中
    发表于 03-06 06:02

    从炫技到量产,具身智能要突破哪些瓶颈?

    LingBot-VLA 开源,具身智能的 Stable Diffusion 来了?
    的头像 发表于 01-28 17:12 9159次阅读
    从炫技到量产,具身智能要突破哪些瓶颈?

    CM8236G+CM2001M:MIPI信号驱动工业视觉升级

    工业制造智能化升级进程中,视觉感知系统的信号性能直接决定生产精度与效率。
    的头像 发表于 01-21 17:46 1342次阅读

    如何挑选一款gps北斗导航卫星信号模拟器 导航卫星模拟器 gps模拟信号发生器

    GNSS卫星信号模拟器作为测试GNSS接收机性能的核心设备,其作用愈发凸显。它能够在实验室环境中精准复现卫星导航信号,摆脱户外测试受天气、地理位置、信号遮挡等因素的限制,为接收机的研发
    的头像 发表于 12-09 16:23 1776次阅读
    如何挑选一款gps北斗导航卫星<b class='flag-5'>信号</b>模拟器 导航卫星模拟器 gps模拟<b class='flag-5'>信号</b>发生器

    本地部署Stable Diffusion实现AI文字生成高质量矢量图片应用于电子商务

    本地部署Stable Diffusion
    的头像 发表于 11-28 07:19 890次阅读

    工业4.0的“数据桥梁”:图像采集卡如何撑起智能制造的视觉核心

    工业4.0的本质是数据驱动的智能制造。在这个由物联网、大数据和人工智能构成的智慧工厂里,机器视觉系统扮演着“火眼金睛”的角色,而图像采集卡,正是连接这双“眼睛”与“大脑”(中央处理系统)不可或缺
    的头像 发表于 11-17 16:01 1219次阅读
    工业4.0的“数据桥梁”:图像采集卡如何撑起智能制造的<b class='flag-5'>视觉</b>核心

    工业图像采集卡:机器视觉的“信号中枢”

    一、定位:连接物理视界与数字大脑的重要枢纽在工业自动化生产线的精密检测工位上,当高速相机捕捉到PCB板的微米级纹路时,一个常被忽视却至关重要的硬件正在完成关键转换——工业图像采集卡如同“信号翻译官
    的头像 发表于 11-06 15:09 412次阅读
    工业图像采集卡:机器<b class='flag-5'>视觉</b>的“<b class='flag-5'>信号</b>中枢”

    什么是太阳光谱?如何在实验室复现太阳光?

    太阳是地球最主要的能量来源,理解太阳光的本质特性,尤其是其光谱分布,对于太阳能技术、材料研究、环境科学等众多领域至关重要。而太阳光模拟器,作为在实验室内精准复现太阳光的关键设备,使试验研究能够不受
    的头像 发表于 11-03 18:04 1340次阅读
    什么是太阳光谱?如何在实验室<b class='flag-5'>复现</b>太阳光?

    图像采集卡重要功能解析:打通视频信号处理全链路

    :实现模拟与数字的“双向奔赴”前端摄像头、摄像机等设备常输出模拟视频信号,这类信号难以计算机直接识别处理。图像采集卡的首要重要功能,便是通过内置的高精度模数转换
    的头像 发表于 10-20 16:57 1048次阅读
    图像采集卡重要功能解析:打通<b class='flag-5'>视频信号</b>处理全链路

    信号处理到视觉感知:CM2001AT 与 索尼FCB-EV9520L 驱动车载智能升级

    系统的关键支撑:前者以 “信号处理中枢” 解决高清视频高效编码与稳定传输难题,后者以 “敏锐视觉之眼” 实现复杂环境下精准图像采集。二者形成 “感知 - 处理 - 传输” 闭环,为自动驾驶、车辆监控提供核心动力,推动车载
    的头像 发表于 09-15 16:25 969次阅读

    视频信号延长方案

    新龙鹏科技延长方案简介  Introduction to the Extension Scheme   适用于部署大屏幕广告、大型视频会议、家庭影院、医疗设备、金融系统、公共交通设施等场所的高清信号
    的头像 发表于 08-29 10:42 839次阅读
    <b class='flag-5'>视频信号</b>延长方案

    是德N5173B信号发生器在EMC测试中的干扰信号精准复现技巧

    具备宽频段覆盖、高精度调制和灵活的信号生成能力,成为EMC实验室中复现干扰信号的重要工具。掌握其使用技巧,可有效提升测试的精准性和效率。   二、干扰信号精准
    的头像 发表于 06-03 16:09 1018次阅读
    是德N5173B<b class='flag-5'>信号</b>发生器在EMC测试中的干扰<b class='flag-5'>信号</b>精准<b class='flag-5'>复现</b>技巧

    大脑的能力发挥到极致

    上个世纪,医学界取得了许多重大突破,全世界的科学家都在孜孜不倦地寻找下一个突破点。对于许多医学研究人员来说,极有希望实现新突破的道路,就是了解人类大脑的工作原理,然后用它自己的信号模式与之沟通。大脑是一台有机超级计算机,它负责指
    的头像 发表于 05-09 15:59 848次阅读
    将<b class='flag-5'>大脑</b>的能力发挥到极致