0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成

甲子光年 来源:甲子发现 2024-02-22 13:36 次阅读

独家获悉,谷歌高级科学家、卡内基梅隆大学(CMU)计算机学院兼职教授蒋路,已经加入TikTok。

蒋路是谷歌 VideoPoet 项目负责人,VideoPoet 是谷歌在 2023 年 12 月推出的视频生成大模型,类似 OpenAI 刚刚发布的 Sora。

近期,昆仑万维创始人周亚辉在朋友圈表示,有个论文的作者加入字节北美做Tech Leader,正是指《VideoPoet: A large language model for zero-shot video generation》论文的作者蒋路。

资料显示,蒋路先后在西安交通大学、布鲁塞尔自由大学、卡内基梅隆大学学习计算机,并先后进入微软亚洲研究院、谷歌研究院、雅虎研究院实习。

2017 年,蒋路毕业后加入谷歌。他是谷歌云 AI 的创始成员,也是李佳博士和李飞飞博士首次聘请的研究员。此后,蒋路进入谷歌研究院工作。

蒋路的研究曾被应用到谷歌多个产品,如 YouTube、云服务、云 AutoML、广告、Waymo 和翻译服务,影响了全球数十亿用户的日常生活。

蒋路的工作在自然语言处理(ACL)和计算机视觉(CVPR)的顶级会议上被提名为最佳论文。他是研究社区的活跃成员,担任美国国家种子基金(NSF SBIR)的 AI 评审专家,并定期担任 CVPR、ICCV、NeurlPS、ACM Multimedia 和 AAAI 等著名会议的领域主席。

蒋路的研究兴趣主要在多媒体交叉领域,他专注于生成式 AI 和视频创作。2019 年起,他就开始尝试将 Transformer 用在图像、视频生成研究上。

与 Sora 采用的 Diffusion + Transformer 架构不同,蒋路负责的 VideoPoet 视频生成模型采用了单 Transformer 架构,可以将任何自回归语言模型或大型语言模型转换为高质量的视频生成器,支持生成方形或纵向视频,以针对短格式内容定制生成视频,并支持视频输入生成音频

VideoPoet 采用了名为 Tokenizer 的数据处理技术,可以将视频和音频片段编码为离散标记序列(discrete tokens),这些标记也可以被转换回原始表示。其中,视频和图像数据使用名为 MAGVIT V2 的技术,音频数据使用 SoundStream 的技术。

VideoPoet 通过使用多个 Tokenizer 训练一个自回归语言模型,以学习跨视频、图像、音频和文本模态。一旦模型根据某些上下文生成了标记,这些标记就可以通过分词器解码器转换回可查看的表示。

fe1ad37c-d143-11ee-a297-92fbcf53809c.png

3 周前,蒋路本人在职场社交平台宣布了自己在谷歌的 Last Day,并特别表示对在谷歌所做的视频生成项目(VideoPoet,MAGVIT,WALT等)感到自豪。

蒋路表示自己将继续留在湾区,开始视频生成领域的新旅程。现在来看,新的旅程就是 TikTok。

值得一提的是,字节跳动已经在大模型领域全面布局,模型层推出了自研的「云雀大模型」以及类 ChatGPT 对话机器人产品豆包。2023 年底,字节跳动成立新的 AI 应用部门 Flow,并在海外推出了 Coze 等多款产品。抖音集团 CEO 张楠也于近期卸任,专注于 AI 工具剪映的发展。

字节跳动近期辟谣了推出中文版 Sora,并表示:“还无法完善产品落地,距离国外模型有很大差距。”但另一方面,字节跳动正在大力招揽人才。

大模型战场,字节跳动将会如何搅局?




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    27043

    浏览量

    201418
  • 计算机视觉
    +关注

    关注

    8

    文章

    1600

    浏览量

    45617
  • OpenAI
    +关注

    关注

    8

    文章

    761

    浏览量

    5914
  • TikTok
    +关注

    关注

    2

    文章

    196

    浏览量

    7072

原文标题:独家:TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成|甲子光年

文章出处:【微信号:jazzyear,微信公众号:甲子光年】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    OpenAI又打出王炸!一句话生成60秒视频,马斯克:人类认输吧

    了文生视频模型Gen-1,并完成了两次迭代;还有谷歌团队发布的视频生成模型VideoPoet。但问题在于,此
    的头像 发表于 02-19 09:02 3319次阅读
    OpenAI又打出王炸!一句话<b class='flag-5'>生成</b>60秒<b class='flag-5'>视频</b>,马斯克:人类认输吧

    小鹏汽车迎来新AI负责人,研发XNGP技术

    小鹏汽车近日迎来新的AI团队负责人——Cruise公司前高级资深机器学习工程师LiuXianming。他将带领小鹏AI团队研发XNGP技术,为公司的自动驾驶领域注入新的活力。
    的头像 发表于 03-26 10:43 261次阅读

    新火种AI|围攻光明顶:Sora效应下的AI视频生成竞赛

    Sora的出现,让AI视频生成领域真正“活”了起来
    的头像 发表于 03-16 11:12 228次阅读

    除了刷屏的Sora,国内外还有哪些AI视频生成工具

    。Sora的发布也让AI生成视频有了突破性进展。   过去一年多,全球科技公司都在发布各种大模型,然而AI生成内容更多集中在文本和图片方面,
    的头像 发表于 02-26 08:42 3170次阅读
    除了刷屏的Sora,国内外还有哪些<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>工具

    openai发布首个视频生成模型sora

    美国当地时间2024年2月15日 ,OpenAI正式发布文生视频模型Sora ,并发布了48个文生视频案例和技术报告 ,正式入局视频生成领域 。Sora能够根据提示词生成60s的连贯
    的头像 发表于 02-21 16:45 689次阅读

    探索OpenAI Sora视频AI生成技术及其应用如何使用指南

    OpenAI的Sora现已扩展其能力范围,进入视频生成领域,标志着人工智能技术在多媒体内容创作上的一个重大突破。Sora的视频AI功能使得用户能够根据文本描述自动生成高质量的
    的头像 发表于 02-20 12:01 846次阅读

    OpenAI新年开出王炸,视频生成模型Sora问世

    近日,OpenAI在AI生成视频领域取得重大突破,发布了全新的生成式人工智能模型“Sora”。该模型在视频生成方面展现出了惊人的能力,通过文
    的头像 发表于 02-20 11:46 378次阅读

    AI视频年大爆发!2023年AI视频生成领域的现状全盘点

    2023年,也是AI视频元年。过去一年究竟有哪些爆款应用诞生,未来视频生成领域面临的难题还有哪些?
    的头像 发表于 02-20 10:40 557次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视频</b>年大爆发!2023年<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>领域的现状全盘点

    OpenAI发布文生视频模型Sora,引领AI视频生成新纪元

    在人工智能(AI)领域掀起新一轮革命浪潮的,正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型,以其“逼真”和“富有想象力”的视频生成能力,彻底颠覆了传统视频生成
    的头像 发表于 02-19 11:03 444次阅读

    OpenAI发布首个视频生成模型Sora

    OpenAI近日宣布推出其全新的文本到视频生成模型——Sora。这一突破性的技术将视频创作带入了一个全新的纪元,为用户提供了前所未有的创作可能性。
    的头像 发表于 02-18 10:07 599次阅读

    谷歌地图引入生成AI功能

    谷歌近日宣布,在其广受欢迎的谷歌地图应用中引入了全新的生成AI功能。这一创新功能利用大型模型,深入分析了地图上超过2.5亿个地点的详细信息
    的头像 发表于 02-06 16:42 2821次阅读

    谷歌推出AI扩散模型Lumiere

    近日,谷歌研究院重磅推出全新AI扩散模型Lumiere,这款模型基于谷歌自主研发的“Space-Time U-Net”基础架构,旨在实现视频生成的一次性完成,同时保证
    的头像 发表于 02-04 13:49 594次阅读

    超算负责人离职,特斯拉下一代自动驾驶何去何从?

    电子发烧友网报道(文/周凯扬)早在去年 12 月初就有新闻爆料,称特斯拉超算 Dojo 项目负责人Ganesh Venkataramanan已经离职。据传在其离职后,该项目将由FSD 负责人
    的头像 发表于 01-02 09:19 1115次阅读

    阅流智作:一种全新的生成AI视频制作方式,或将颠覆专业视频生

    随着AIGC技术的兴起和发展,智能创作逐渐成为全球热议的焦点,而面向专业场景,可控的智能图片、视频生成式方向是所有内容创作者最关心的。 AI创作类工具的应用普及,创作者和设计师们在内容创作流程
    的头像 发表于 11-02 14:40 217次阅读

    谷歌AR系统负责人离职的原因是什么

    谷歌在AR/VR业务方面频繁进行调整,导致业务团队发生了变动。
    的头像 发表于 07-11 16:04 1854次阅读