0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Sora爆红,多模态大模型是下一发展阶段

21克888 来源:电子发烧友网 作者:综合报道 2024-02-20 16:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“大语言模型为 AI 产业带来新的生机,然而语言模型的应用场景有限。要全面打开生成式 AI 的想象力,还是要依托多模态大模型。”IDC 中国研究总监卢言霞近日表示。Sora在文生视频领域真正迈出了第一步,真正做到生成式 AI 驱动生成短视频。接下来也将刺激其他科技巨头加快在该领域的技术攻关力度以及产品发布速度。

哪些公司有潜力快速推出类似产品呢?根据卢言霞的判断,几个最有潜力的群体包括,在大模型以及 AI 领域投入最为领先的科技巨头,如 BAT、科大讯飞等;在计算机视觉领域拥有深厚积累的公司,比如商汤、海康一类的公司;以及短视频类公司;更可大胆想象,也或许会培训出多模态大模型的全新创企。

多模态大模型将率先在短视频、广告、互娱、影视、媒体等领域采用,辅助人类员工生成视频,既可以提高生产速度又可以提高生产数量,还可以创造全新的视觉感受,能够帮助企业真正实现降本增效、提升用户体验。

根据预测,未来 5 年,生成式 AI 生成的文本类文件、图像类文件、视频类文件、软件代码类文件数量将会越来越平均。而这其中,与图像文件相关的数据量可能是文本文件的 100 倍,视频文件是图像文件的 10 倍。整体来看,由于 GenAI 的采用和使用日益增多,近期和远期所创建数据的增长速度都将快于近几年。

卢言霞指出,多模态大模型行业发展的挑战在于:

• 高质量数据的稀缺:图像、视频类数据掌握在少数公司手中。这些数据也需要标注,甚至重新采集,才能用于大模型的训练。
• 多模态大模型对算力的消耗更高,算力的可获取性以及成本将是挑战之一。
• 顶尖的大模型研发人才,也是行业发展的稀缺资源。

此外,多模态大模型将带来更严峻的安全方面的挑战。一方面多模态大模型将读取更多的图像、视频类数据,这些图像视频数据是否合规是否安全,需要得到保障;另一方面,生成的视频与真实世界之间的差异,是否会影响到人身安全、社会稳定、企业安全等,也需要注意。

当前 Sora 生成的是1分钟的视频,对于行业已经是重大突破,何时能生成2分钟、5分钟以上的视频还未知,无论如何多模态大模型的应用都将是颠覆性的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亚马逊云科技上线Amazon Nova模态嵌入模型

    Embeddings模态嵌入模型现已在Amazon Bedrock上线,这是款专为Agentic RAG与语义搜索应用打造的顶尖
    的头像 发表于 10-29 17:15 115次阅读
    亚马逊云科技上线Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模态</b>嵌入<b class='flag-5'>模型</b>

    OpenAI Sora 2模型上线微软Azure AI Foundry国际版

    我们非常激动地宣布,OpenAI 的新模态视频生成模型 Sora 2 现已在 Azure AI Foundry(国际版)上线,进入公共
    的头像 发表于 10-22 09:44 448次阅读
    OpenAI <b class='flag-5'>Sora</b> 2<b class='flag-5'>模型</b>上线微软Azure AI Foundry国际版

    商汤日日新V6.5模态模型登顶全球权威榜单

    根据权威评测平台OpenCompass模态模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤「日日新 V6.5」(SenseNova-V6.5
    的头像 发表于 09-10 09:55 488次阅读

    浅析模态标注对大模型应用落地的重要性与标注实例

    ​在人工智能迈向AGI通用智能的关键道路上,大模型正从单的文本理解者,演进为能同时看、听、读、想的“多面手”。驱动这进化的核心燃料,正是高质量的
    的头像 发表于 09-05 13:49 760次阅读

    “端云+模态”新范式:《移远通信AI大模型技术方案白皮书》正式发布

    7月28日,移远通信联合智次方研究院正式发布《AI大模型技术方案白皮书》(以下简称“白皮书”)。这份白皮书系统梳理了AI大模型的技术特点、产业发展态势与多元应用场景,以及移远通信“端云+
    的头像 发表于 07-28 13:08 938次阅读
    “端云+<b class='flag-5'>多</b><b class='flag-5'>模态</b>”新范式:《移远通信AI大<b class='flag-5'>模型</b>技术方案白皮书》正式发布

    模态感知+豆包大模型!家居端侧智能升级

    电子发烧友网报道(文/李弯弯)日前,在火山引擎2025春季FORCE原动力大会上,星宸科技股份有限公司董事副总经理陈立敬谈到,在人工智能技术飞速发展的时代,模态感知与大模型的融合成为
    的头像 发表于 06-21 00:06 6613次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>感知+豆包大<b class='flag-5'>模型</b>!家居端侧智能升级

    商汤日日新SenseNova融合模态模型 国内首家获得最高评级的大模型

    的大模型。 可信AI模态模型评估2025年1月启动,由中国信通院人工智能研究所牵头,依据由业界60余家单位共同编制的《
    的头像 发表于 06-11 11:57 1156次阅读

    爱芯通元NPU适配Qwen2.5-VL-3B视觉模态模型

    熟悉爱芯通元NPU的网友很清楚,从去年开始我们在端侧模态模型适配上直处于主动紧跟的节奏。先后适配了国内最早开源的
    的头像 发表于 04-21 10:56 2591次阅读
    爱芯通元NPU适配Qwen2.5-VL-3B视觉<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>

    海康威视发布模态模型AI融合巡检超脑

    基于海康观澜大模型技术体系,海康威视推出新模态模型AI融合巡检超脑,全面升级人、车、行为、事件等算法,为行业带来全新的
    的头像 发表于 04-17 17:12 1334次阅读

    移远通信智能模组全面接入模态AI大模型,重塑智能交互新体验

    全系智能模组产品已全面接入火山引擎豆包VLM(视觉语言)模态AI大模型。这突破性进展表明,搭载移远任意智能模组的终端设备,均可无缝融合
    发表于 03-21 14:12 425次阅读
    移远通信智能模组全面接入<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大<b class='flag-5'>模型</b>,重塑智能交互新体验

    移远通信智能模组全面接入模态AI大模型,重塑智能交互新体验

    智能模组产品已全面接入火山引擎豆包VLM(视觉语言)模态AI大模型。这突破性进展表明,搭载移远任意智能模组的终端设备,均可无缝融合
    的头像 发表于 03-20 19:03 665次阅读
    移远通信智能模组全面接入<b class='flag-5'>多</b><b class='flag-5'>模态</b>AI大<b class='flag-5'>模型</b>,重塑智能交互新体验

    海康威视发布模态模型文搜存储系列产品

    模态模型为安防行业带来重大技术革新,基于观澜大模型技术体系,海康威视将大参数量、大样本量的图文模态
    的头像 发表于 02-18 10:33 1019次阅读

    体验MiniCPM-V 2.6 模态能力

    模态组网
    jf_23871869
    发布于 :2025年01月20日 13:40:48

    商汤日日新模态模型权威评测第

    刚刚,商汤科技日日新SenseNova模态模型,在权威综合评测权威平台OpenCompass的模态评测中取得榜单第
    的头像 发表于 12-20 10:39 1496次阅读

    成都汇阳投资关于Sora 正式上线,模态模型的里程碑

      事 件  12月10日,OpenAl正式上线 Sora,并向包括美国在内的多数国家用户开放,用户可在OpenAI官网上体验Sora。同时,Sora 被包含在ChatGPT Plus
    的头像 发表于 12-16 14:39 1142次阅读