0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

千亿参数多模态大模型,“紫东太初”规模化应用加速

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-12-08 00:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)过去近一年时间,国内外大模型技术越来越成熟,并逐步在不同场景中实现实现应用。在国内,作为早早布局多模态大模型的科研机构,中国科学院自动化研究所自2019年开始在语音、文本、图像等单模态大模型研究和应用的基础上,向多模态大模型攻关,并于2021年7月正式发布了全球首个千亿参数多模态大模型紫东太初。

2023年6月16日,中国科学院自动化研究所和武汉人工智能研究院发布紫东太初2.0。2023年8月,中科院旗下紫东太初的大模型位列首批通过《生成式人工智能服务管理暂行办法》备案的名单,可正式上线面向公众提供服务。如今,紫东太初已经在不同领域实现应用。

紫东太初多模态大模型的技术进展

紫东太初是全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力。

紫东太初2.0在文本、图像、语音三模态的基础上,融入3D点云、视频、信号等更多模态数据,现已支持多轮问答、文本创作、图像生成、3D 理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。

紫东太初多模态大模型拥有三大关键技术和六大核心能力。三大关键技术:多模态理解与生成多任务统一建模;面向国产化软硬件的高效训练与部署;多模态预训练模型架构设计与优化。六大核心能力:多模态统一表示与语义关联;预训练模型网络架构合计;模型适配与分布式训练;跨模态内容转化与生成;标注受限自监督模型学习;模型轻量化与推理加速。

近期,为推动数字技术与行业应用深度融合,提供更加先进的新一代人工智能解决方案,助力产业升级和发展,武汉人工智能研究院基于“紫东太初”全模态大模型,搭建全栈国产化“紫东太初”大模型开放服务平台。“紫东太初”跨模态通用人工智能平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。

武汉人工智能研究院院长王金桥不久前表示,武汉人工智能研究院是以科技创新与成果转化双轮驱动的新型研发机构,作为湖北省人工智能产业链“链创”平台,基于“紫东太初”多模态大模型,在智能制造、智慧医疗等多个领域打造了典型示范应用,并搭建全栈国产化自主可控的紫东太初大模型开放服务平台,全力打造湖北省数字经济智能底座。

“紫东太初”大模型正在赋能千行百业

据介绍,目前紫东太初已经在各行各业中实现应用。据武汉人工智能研究院官网介绍,该机构基于“紫东太初”多模态大模型携手长安欧尚,共同引入了元宇宙的概念,创造出YYDS虚拟数字人,可以通过复刻自己或者亲人的形象和声音,捏出专属的语音助手。

携手杭州市文广旅游局、杭州移动,基于“紫东太初”多模态大模型打造文旅场景首个多模态AI数字人“杭小忆”,为杭州文化旅游提供具有亲和力、感染力、吸引力的代言人形象。利用AR/VR技术还原南宋御街历史风貌,包含陶瓷烧制釉变、活字印刷、特色小吃等场景。

在纺织制造领域,该机构与魏桥集团合作了布匹缺陷检测设备,该设备通过接入“紫东太初”大模型的质检摄像头识别70多种布匹瑕疵,能够在较短时间内就满足生产的精度要求,在验布检验环节相比人工实现了质的突破,瑕疵识别检出率高达95%。还能够基于声音发现瑕疵,提升纺织行业织布、验布效率,助力纺织工业质检。

在医疗领域,“紫东太初-火石数智燧石医疗大模型”最新应用成果于近期正式发布,九州通医疗器械集团项目总监徐琳介绍,对于骨科疾病治疗场景来说,按照监管要求,目前很多医院设备科的工作人员,是拿着放大镜一颗一颗地去数骨钉等耗材,统计使用数量、类型,验收器械的批号和实物是否一致,这种核验过程不够高效快捷。

她透露,今年3月起,九州通与武汉人工智能研究院联合进行技术研发,历经半年,完成骨科内植入耗材系统“骨科嫦娥”智慧系统研发。系统利用人工智能、深度神经卷积以及大模型等技术,在一个完整手术治疗周期内,对骨科复杂植入物和工具进行智慧识别、全程追踪、报表统计、能效分析、数据查询、共享协同等闭环式、智慧化高效管理,试行效果良好。

“江城洛神”是基于“紫东太初”大模型打造的人工智能内容创作平台,通过多模态技术实现图像编辑与生成,辅助内容生产,用户无需任何专业技能,只需轻轻一点,便可轻松创造出属于自己的艺术作品,可广泛运用于设计、影视、游戏等多个领域。

以室内装修设计领域为例,只需提供一张户型图,“江城洛神”就可自动生成多种装修设计样式,提示词越多、越精细,生成质量就越高,还能根据不同提示自动对结果进行编辑。

王金桥表示,“紫东太初”大模型正在赋能千行百业,推动数字经济全面发展。“紫东太初”人工智能开放服务平台目前已成功应用于汽车制造质检、媒体信息服务、文化旅游、手语教育、纺织生产质检、医疗器械等10余个领域,形成规模化应用落地。

小结

人工智能未来的10年将是生成式人工智能的10年,如今国内外各大科技巨头及AI企业已经从初期招兵买马启动大模型产品的技术研发,进入到拓展应用场景的阶段。如今市面上已经发布的大模型有几百款。然而,通用大模型就如早期的操作系统一样,最终只会需要一两个或者两三个。未来,就看谁能够真正了解市场需求,最终脱颖而出了。





声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    模态模型 前沿算法与实战应用 第一季》精品课程简介

    优化 模态模型参数量大,需采用混合精度训练(FP16+FP32)和梯度累积技术减少显存占用。例如在训练视频理解模型时,可将batch si
    发表于 05-01 17:46

    太初元碁:40+AI大模型全覆盖,新版本即发即适配、上线即可用,实现国产“芯”速度

    Embedding / Reranker系列向量模型、Qwen-VL、LLaVA系列模态理解模型;Stable-Diffusion、FLUX、Wan系列等
    的头像 发表于 02-25 09:21 2186次阅读

    全球首个最大规模跨本体视触觉模态数据集白虎-VTouch发布

    具身智能走向真实世界规模化应用,离不开可复现、可扩展、可协同演进的数据基础设施。围绕真实物理交互能力构建这一核心工程目标,1月26日,国家地方共建人形机器人创新中心联合上海纬钛科技有限公司正式发布
    的头像 发表于 01-29 14:41 971次阅读

    Arm技术驱动融合型AI数据中心规模化演进

    要实现人工智能 (AI) 的规模化应用,唯一路径便是开展全栈式系统设计。加速器负责处理驱动 AI 模型的数学运算,而 CPU 才是支撑系统,将计算能力转化为实际价值的核心基础。
    的头像 发表于 01-15 14:06 756次阅读

    格灵深瞳模态模型荣登InfoQ 2025中国技术力量年度榜单

    灵感实验室联合LLaVA社区发布的模态模型LLaVA-OneVision-1.5,实现了训练数据、代码和模型权重的全链路开源,在多项公开
    的头像 发表于 01-05 10:05 750次阅读

    模态模型驱动的复杂环境精准导航避障系统平台的应用

    模态模型驱动的复杂环境精准导航避障系统平台的应用
    的头像 发表于 12-22 13:15 466次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>驱动的复杂环境精准导航避障系统平台的应用

    商汤科技正式发布并开源全新模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新模态模型架构 —— NEO,为日日新SenseNova 模态
    的头像 发表于 12-08 11:19 1240次阅读
    商汤科技正式发布并开源全新<b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>模型</b>架构NEO

    亚马逊云科技上线Amazon Nova模态嵌入模型

    Embeddings模态嵌入模型现已在Amazon Bedrock上线,这是一款专为Agentic RAG与语义搜索应用打造的顶尖模态
    的头像 发表于 10-29 17:15 432次阅读
    亚马逊云科技上线Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模态</b>嵌入<b class='flag-5'>模型</b>

    中科曙光助力太初4.0大模型重磅发布

    近日,全球首个“深度推理+模态”大模型——“太初”4.0在2025东湖国际人工智能高峰论坛
    的头像 发表于 09-24 09:33 892次阅读

    商汤日日新V6.5模态模型登顶全球权威榜单

    根据权威评测平台OpenCompass模态模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤「日日新 V6.5」(SenseNova-V6.5
    的头像 发表于 09-10 09:55 1023次阅读

    米尔RK3576部署端侧模态轮对话,6TOPS算力驱动30亿参数LLM

    加载 → 图片预处理 → 用户交互 → 推理输出”的核心流程,支持图文一体的模态对话,适配轮问答、视觉问答等典型场景。 具体运行机制可拆解为以下步骤:1. 模型初始
    发表于 09-05 17:25

    浅析模态标注对大模型应用落地的重要性与标注实例

    ”的关键工序——模态标注重要性日益凸显。 一、什么是模态标注? 模态标注是指对文本、图像、
    的头像 发表于 09-05 13:49 2971次阅读

    基于米尔瑞芯微RK3576开发板的Qwen2-VL-3B模型NPU模态部署评测

    模型(如 Qwen2-VL-2B)进行专项优化,token 生成速度达 10+每秒,适配本地模态交互需求; 算力分配:RK3576 的 NPU 集成 512KB 共享内存,减少数据
    发表于 08-29 18:08

    中国科学院自动研究所携手中科曙光打造高性能工具链解决方案

    2019年起,中国科学院自动研究所以语音、文本、图像等单模态模型的研究与应用为基石,全力攻关全球首个千亿参数
    的头像 发表于 08-11 11:08 1222次阅读

    商汤日日新SenseNova融合模态模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI模态模型首轮评估。 商汤日日新SenseNova融合模态模型在所有
    的头像 发表于 06-11 11:57 1621次阅读