0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

千亿参数多模态大模型,“紫东太初”规模化应用加速

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-12-08 00:09 次阅读

电子发烧友网报道(文/李弯弯)过去近一年时间,国内外大模型技术越来越成熟,并逐步在不同场景中实现实现应用。在国内,作为早早布局多模态大模型的科研机构,中国科学院自动化研究所自2019年开始在语音、文本、图像等单模态大模型研究和应用的基础上,向多模态大模型攻关,并于2021年7月正式发布了全球首个千亿参数多模态大模型紫东太初。

2023年6月16日,中国科学院自动化研究所和武汉人工智能研究院发布紫东太初2.0。2023年8月,中科院旗下紫东太初的大模型位列首批通过《生成式人工智能服务管理暂行办法》备案的名单,可正式上线面向公众提供服务。如今,紫东太初已经在不同领域实现应用。

紫东太初多模态大模型的技术进展

紫东太初是全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力。

紫东太初2.0在文本、图像、语音三模态的基础上,融入3D点云、视频信号等更多模态数据,现已支持多轮问答、文本创作、图像生成、3D 理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。

紫东太初多模态大模型拥有三大关键技术和六大核心能力。三大关键技术:多模态理解与生成多任务统一建模;面向国产化软硬件的高效训练与部署;多模态预训练模型架构设计与优化。六大核心能力:多模态统一表示与语义关联;预训练模型网络架构合计;模型适配与分布式训练;跨模态内容转化与生成;标注受限自监督模型学习;模型轻量化与推理加速。

近期,为推动数字技术与行业应用深度融合,提供更加先进的新一代人工智能解决方案,助力产业升级和发展,武汉人工智能研究院基于“紫东太初”全模态大模型,搭建全栈国产化“紫东太初”大模型开放服务平台。“紫东太初”跨模态通用人工智能平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。

武汉人工智能研究院院长王金桥不久前表示,武汉人工智能研究院是以科技创新与成果转化双轮驱动的新型研发机构,作为湖北省人工智能产业链“链创”平台,基于“紫东太初”多模态大模型,在智能制造、智慧医疗等多个领域打造了典型示范应用,并搭建全栈国产化自主可控的紫东太初大模型开放服务平台,全力打造湖北省数字经济智能底座。

“紫东太初”大模型正在赋能千行百业

据介绍,目前紫东太初已经在各行各业中实现应用。据武汉人工智能研究院官网介绍,该机构基于“紫东太初”多模态大模型携手长安欧尚,共同引入了元宇宙的概念,创造出YYDS虚拟数字人,可以通过复刻自己或者亲人的形象和声音,捏出专属的语音助手。

携手杭州市文广旅游局、杭州移动,基于“紫东太初”多模态大模型打造文旅场景首个多模态AI数字人“杭小忆”,为杭州文化旅游提供具有亲和力、感染力、吸引力的代言人形象。利用AR/VR技术还原南宋御街历史风貌,包含陶瓷烧制釉变、活字印刷、特色小吃等场景。

在纺织制造领域,该机构与魏桥集团合作了布匹缺陷检测设备,该设备通过接入“紫东太初”大模型的质检摄像头识别70多种布匹瑕疵,能够在较短时间内就满足生产的精度要求,在验布检验环节相比人工实现了质的突破,瑕疵识别检出率高达95%。还能够基于声音发现瑕疵,提升纺织行业织布、验布效率,助力纺织工业质检。

在医疗领域,“紫东太初-火石数智燧石医疗大模型”最新应用成果于近期正式发布,九州通医疗器械集团项目总监徐琳介绍,对于骨科疾病治疗场景来说,按照监管要求,目前很多医院设备科的工作人员,是拿着放大镜一颗一颗地去数骨钉等耗材,统计使用数量、类型,验收器械的批号和实物是否一致,这种核验过程不够高效快捷。

她透露,今年3月起,九州通与武汉人工智能研究院联合进行技术研发,历经半年,完成骨科内植入耗材系统“骨科嫦娥”智慧系统研发。系统利用人工智能、深度神经卷积以及大模型等技术,在一个完整手术治疗周期内,对骨科复杂植入物和工具进行智慧识别、全程追踪、报表统计、能效分析、数据查询、共享协同等闭环式、智慧化高效管理,试行效果良好。

“江城洛神”是基于“紫东太初”大模型打造的人工智能内容创作平台,通过多模态技术实现图像编辑与生成,辅助内容生产,用户无需任何专业技能,只需轻轻一点,便可轻松创造出属于自己的艺术作品,可广泛运用于设计、影视、游戏等多个领域。

以室内装修设计领域为例,只需提供一张户型图,“江城洛神”就可自动生成多种装修设计样式,提示词越多、越精细,生成质量就越高,还能根据不同提示自动对结果进行编辑。

王金桥表示,“紫东太初”大模型正在赋能千行百业,推动数字经济全面发展。“紫东太初”人工智能开放服务平台目前已成功应用于汽车制造质检、媒体信息服务、文化旅游、手语教育、纺织生产质检、医疗器械等10余个领域,形成规模化应用落地。

小结

人工智能未来的10年将是生成式人工智能的10年,如今国内外各大科技巨头及AI企业已经从初期招兵买马启动大模型产品的技术研发,进入到拓展应用场景的阶段。如今市面上已经发布的大模型有几百款。然而,通用大模型就如早期的操作系统一样,最终只会需要一两个或者两三个。未来,就看谁能够真正了解市场需求,最终脱颖而出了。





声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    联发科天玑9300搭载通义千问大模型,阿里云提供解决方案

    通义千问大模型已开源多项版本,包括18亿、70亿、140亿及720亿参数等版本伴随视觉、音频多模态能力提升。阿里云于去年10月发布的通义千问2.0,其参数
    的头像 发表于 03-28 09:55 130次阅读

    苹果发布300亿参数MM1多模态模型

    近日,科技巨头苹果公司在一篇由多位专家共同撰写的论文中,正式公布了其最新的多模态模型研究成果——MM1。这款具有高达300亿参数的多模态模型
    的头像 发表于 03-19 11:19 299次阅读

    【书籍评测活动NO.30】大规模语言模型:从理论到实践

    。国内的文心一言就属于这一类。 垂直大模型,聚焦解决垂直领域问题,是在通用大模型的基础上训练行业专用模型,应用到金融、医疗、教育、养老、交通等垂直行业,使大模型领域
    发表于 03-11 15:16

    蚂蚁推出20亿参数模态遥感模型SkySense

    据了解,负责开发的百灵团队利用自身拥有的19亿遥感影像数据集进行了预训练,从而生成了具有20.6亿参数的SkySense大模型。官方称其为全球范围内参数规模最大、任务覆盖最全且识别精度
    的头像 发表于 02-28 15:53 241次阅读

    1-2B参数规模模型的使用心得

    模型时代,根据大模型缩放定律,大家通常都在追求模型参数规模更大、训练的数据更多,从而使得大模型
    的头像 发表于 12-28 11:47 525次阅读
    1-2B<b class='flag-5'>参数</b><b class='flag-5'>规模</b>大<b class='flag-5'>模型</b>的使用心得

    从Google多模态模型看后续大模型应该具备哪些能力

    前段时间Google推出Gemini多模态模型,展示了不凡的对话能力和多模态能力,其表现究竟如何呢?
    的头像 发表于 12-28 11:19 475次阅读
    从Google多<b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>看后续大<b class='flag-5'>模型</b>应该具备哪些能力

    模型+多模态的3种实现方法

    我们知道,预训练LLM已经取得了诸多惊人的成就, 然而其明显的劣势是不支持其他模态(包括图像、语音、视频模态)的输入和输出,那么如何在预训练LLM的基础上引入跨模态的信息,让其变得更强大、更通用呢?本节将介绍“大
    的头像 发表于 12-13 13:55 721次阅读
    大<b class='flag-5'>模型</b>+多<b class='flag-5'>模态</b>的3种实现方法

    中国电信大模型做得怎么样了?

    千亿参数的星辰大模型发布。从2021年10月启动自研城市治理大模型,星辰大模型已经走过语义大模型
    发表于 11-15 12:24 345次阅读
    中国电信大<b class='flag-5'>模型</b>做得怎么样了?

    探究编辑多模态大语言模型的可行性

    不同于单模态模型编辑,多模态模型编辑需要考虑更多的模态信息。文章出发点依然从单模态
    发表于 11-09 14:53 255次阅读
    探究编辑多<b class='flag-5'>模态</b>大语言<b class='flag-5'>模型</b>的可行性

    北大&amp;华为提出:多模态基础大模型的高效微调

    深度学习的大模型时代已经来临,越来越多的大规模预训练模型在文本、视觉和多模态领域展示出杰出的生成和推理能力。然而大模型巨大的
    的头像 发表于 11-08 16:20 315次阅读
    北大&amp;华为提出:多<b class='flag-5'>模态</b>基础大<b class='flag-5'>模型</b>的高效微调

    云知声千亿参数山海大模型首次亮相

    8月28日,山海大模型迎来又一次迭代升级,当前版本参数规模达到千亿,实现了多学科能力、医疗能力双提升,实测性能在C-Eval全球大模型综合性
    的头像 发表于 08-31 16:00 416次阅读
    云知声<b class='flag-5'>千亿</b><b class='flag-5'>参数</b>山海大<b class='flag-5'>模型</b>首次亮相

    盘古大模型和紫东太初的区别

    盘古大模型和紫东太初的区别 无论是盘古大模型还是紫东太初,都是关于宇宙起源的理论模型,二者都试图解释宇宙的起源、演化以及它们之间的联系。尽管
    的头像 发表于 08-31 09:01 737次阅读

    更强更通用:智源「悟道3.0」Emu多模态模型开源,在多模态序列中「补全一切」

    当前学界和工业界都对多模态模型研究热情高涨。去年,谷歌的 Deepmind 发布了多模态视觉语言模型 Flamingo ,它使用单一视觉语言模型
    的头像 发表于 07-16 20:45 402次阅读
    更强更通用:智源「悟道3.0」Emu多<b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>开源,在多<b class='flag-5'>模态</b>序列中「补全一切」

    VisCPM:迈向多语言多模态模型时代

    随着 GPT-4 和 Stable Diffusion 等模型模态能力的突飞猛进,多模态模型已经成为大模型迈向通用人工智能(AGI)目标
    的头像 发表于 07-10 10:05 461次阅读
    VisCPM:迈向多语言多<b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>时代

    单张消费级显卡微调多模态模型

    把大模型的训练门槛打下来!我们在单张消费级显卡上实现了多模态模型(LaVIN-7B, LaVIN-13B)的适配和训练
    的头像 发表于 06-30 10:43 1362次阅读
    单张消费级显卡微调多<b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>