0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

南开大学和字节跳动联合开发一款StoryDiffusion模型

冬至配饺子 来源:网络整理 作者:网络整理 2024-05-07 14:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,南开大学和字节跳动联合开发的 StoryDiffusion 模型解决了扩散模型生成连贯图像与视频的难题。其核心在于“一致自注意力”机制,强化图像间一致性,无需额外训练即可提升现有文本到图像模型的表现。加之“语义运动预测器”,利用语义空间预测图像序列间的流畅变换,尤其在长视频生成中展现了前所未有的稳定性与主体一致性。此框架使基于文本的复杂故事视觉化成为可能,不仅在角色与场景细节一致性上超越 IP-Adapter 等工具,还能精准匹配文本描述。

南开大学和字节跳动联合开发的StoryDiffusion模型是一种新的机器学习技术,主要用于生成具有长距离相关性的图像和视频。以下是该模型的一些主要特点:

1.一致性自注意力(Consistent Self-Attention):该模型通过一种新的自注意力计算方法,在生成图像时建立批内图像之间的联系,以保持人物的一致性。这种机制无需训练即可生成主题一致的图像,解决了在一系列生成的图像中保持内容一致性的挑战,尤其是对于包含复杂主题和细节的图像。

2.语义运动预测器(Semantic Motion Predictor):为了将这种方法扩展到长视频生成,StoryDiffusion引入了语义运动预测器,将图像编码到语义空间,并预测语义空间中的运动,以生成视频。这种基于语义空间的运动预测比仅基于潜在空间的预测更加稳定。

3.两阶段长视频生成方法:通过Consistent self-attention机制生成的图像可以顺利过渡为视频,实现两阶段长视频生成方法。结合这两个部分,可以生成常长且高质量的AIGC视频。

4.用户交互性:用户可以通过提供一系列用户输入的条件图像,使用Image-to-Video模型生成视频。此外,用户还可以通过Jupyter notebook或本地adio demo来生成漫画。

5.应用范围:StoryDiffusion的应用范围广泛,包括漫画生成、图像转视频等多种场景。

StoryDiffusion模型利用了一种称为StoryGAN的生成模型,该模型可以根据输入的故事情节和场景描述生成相关的图像和视频。这项技术有助于解决传统图像和视频生成技术中的局限性,使得生成的图像和视频更加自然和连贯。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137420
  • 字节跳动
    +关注

    关注

    0

    文章

    353

    浏览量

    10148
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ISSCC 2026重磅:清华+华为+字节联合发布存内计算芯片,重塑推荐系统能效边界

    2026 上,清华大学、华为与字节跳动联合团队在会上发布论文《HYDAR: A Hybrid In-Memory Computing Framework for Efficient
    的头像 发表于 02-28 09:15 7791次阅读
    ISSCC 2026重磅:清华+华为+<b class='flag-5'>字节</b><b class='flag-5'>联合</b>发布存内计算芯片,重塑推荐系统能效边界

    东风汽车与字节跳动旗下火山引擎达成战略合作

    4月23日,东风汽车集团有限公司(以下简称东风汽车)与字节跳动旗下火山引擎正式签署战略合作协议。
    的头像 发表于 04-27 10:58 397次阅读
    东风汽车与<b class='flag-5'>字节</b><b class='flag-5'>跳动</b>旗下火山引擎达成战略合作

    华为携手南开大学在ICSE 2026上发布R-Log研究成果

    第48届国际软件工程大会(ICSE 2026)于2026年4月12日至18日在里约热内卢召开。作为软件工程领域CCF A类顶会,ICSE被誉为“软件领域的奥林匹克”,汇聚全球顶尖学者与工业界专家。
    的头像 发表于 04-23 15:04 381次阅读

    大众汽车与小鹏汽车首合作车型与众08正式投产

    今日,大众汽车与小鹏汽车首联合开发车型与众08在大众安徽按计划正式投产,从双方签署联合开发技术合作协议到量产仅用时24个月。
    的头像 发表于 03-16 14:06 363次阅读

    南开大学捅破电池天花板,我们晶振能干什么?

    刷新闻刷到它,直接给小编整精神。南开大学和上海空间电源研究所的团队,2月26号在《自然》上发了篇论文——搞出种新的电解液技术,能让现在的锂电池续航直接翻倍,零下70度还能正常工作。
    的头像 发表于 03-06 16:44 2648次阅读
    <b class='flag-5'>南开大学</b>捅破电池天花板,我们晶振能干什么?

    沐曦股份联合清华大学发布磁性材料AI原子基座模型

    2月27日,沐曦股份联合清华大学等多家研究机构联合发布了磁性材料AI原子基座模型。该模型是首个覆盖宽温压域的磁性材料AI原子
    的头像 发表于 03-03 15:25 674次阅读
    沐曦股份<b class='flag-5'>联合</b>清华<b class='flag-5'>大学</b>发布磁性材料AI原子基座<b class='flag-5'>模型</b>

    惠伦晶体助力字节豆包AI眼镜新体验

    近日,行业备受瞩目的“豆包”AI眼镜发布新动态,这款由字节跳动与龙旗科技联合研发的眼镜,搭载自研空间算法芯片,整体重量不足50克,展示了AI眼镜发展的新方向。
    的头像 发表于 01-09 11:23 905次阅读
    惠伦晶体助力<b class='flag-5'>字节</b>豆包AI眼镜新体验

    曾益科技携手NI和诺之杰亮相2025太赫兹科学技术学术大会

    由中国电子学会太赫兹分会、中国兵工学会太赫兹应用技术专业委员会联合主办,南开大学电子信息与光学工程学院、天津大学精密仪器与光电子工程学院共同承办的第十一届太赫兹科学技术学术大会,在天津市社会山国际会议中心成功举办。
    的头像 发表于 12-15 10:38 933次阅读
    曾益科技携手NI和诺之杰亮相2025太赫兹科学技术学术大会

    TDK和北海道大学联合开发模拟储备池AI芯片原型

    高速处理且功耗低。TDK和北海道大学联合开发了面向边缘A1的模拟储备池A1芯片原型。在2025年10月举行的CEATEC 2025上,我们展示了个演示机,让参观者可以实际体验其成果。
    的头像 发表于 11-24 11:22 1029次阅读
    TDK和北海道<b class='flag-5'>大学联合开发</b>模拟储备池AI芯片原型

    小鹏汽车与芯联集成联合开发 国内首个混合碳化硅产品实现量产

    近日,小鹏汽车与芯联集成联合宣布,国内首个混合碳化硅产品已实现量产。 该产品由小鹏汽车设计开发、芯联集成联合开发并量产落地。这成果为提升新能源汽车的性能和降低成本开辟了新路径。 碳化
    的头像 发表于 10-28 10:15 1456次阅读
    小鹏汽车与芯联集成<b class='flag-5'>联合开发</b> 国内首个混合碳化硅产品实现量产

    AI智能摄像头如何落地?场景+数据+联合开发

    轩展科技联合开发的可添嘉AI智能摄像头将亮相第二十届中国国际社会公共安全博览会(2025CPSE安博会),届时,欢迎你前来现场体验与交流。
    的头像 发表于 10-27 15:05 715次阅读

    电装联合开发电驱动模块eAxle搭载于铃木首量产电池电动车

    株式会社BluE Nexus(以下简称“BluE”)、株式会社爱信(以下简称“爱信”)与株式会社电装(以下简称“电装”)联合开发的电驱动模块 eAxle 将搭载于铃木首量产电池电动车(BEV)车型——“e VITARA”。
    的头像 发表于 10-27 14:56 873次阅读

    请问RT-Thread与stm32cubemx联合开发的原理是什么?

    在使用RT-Thread与stm32cubemx联合开发的原理是什么,cubemx在其中主要起到了哪些功能呢?
    发表于 10-11 15:49

    Vector与QNX联合开发基础车载软件平台

    基础车载软件平台是由Vector和QNX联合开发一款预集成、可扩展的软件平台,专为软件定义汽车的高性能计算节点(HPC)打造。该平台可用于当前和未来车型,满足最高等级的功能安全(ISO 26262,ASIL D)和网络安全(ISO 21434)要求。
    的头像 发表于 07-11 09:31 1766次阅读
    Vector与QNX<b class='flag-5'>联合开发</b>基础车载软件平台

    南京工业大学:仿生触觉传感系统让机器人拥有“人类指尖”般的细腻感知

    宏博士,联合南开大学、复旦大学、金陵科技学院等单位众多合作者,在《Advanced Materials》发表重磅研究成果,研发出种仿生纺织触觉传感器及系统,首次在单
    的头像 发表于 06-14 17:32 1113次阅读
    南京工业<b class='flag-5'>大学</b>:仿生触觉传感系统让机器人拥有“人类指尖”般的细腻感知