0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

昇腾与昇思原生,助力智谱打造自主创新大模型体系!

爱云资讯 2024-08-20 18:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【北京】2024年8月19日,北京人工智能生态大会在中关村国家自主创新示范区会议中心颐和厅成功召开。会上,华为昇腾计算业务副总裁刘鑫发表演讲介绍昇腾原生进展,智谱CEO张鹏作专题分享,张鹏简要介绍了昇腾对自主创新的智谱大模型的助力,以及正在打造的基于昇腾的第四代代码模型CodeGeeX4和多模态模型CogVLM2-video。

其中,代码生成大模型CodeGeeX4的新版本基于昇腾AI与昇思AI框架训练,依托昇腾与昇思的多维混合分布式并行技术等软硬件能力等,将大幅提升模型开发、训练的效率及模型精度。

wKgaombEcACASt93AADdKMLSlCo748.jpg

华为昇腾计算业务副总裁 刘鑫

wKgZombEcACAIdQnAADhfl6nqFM251.jpg

智谱CEO 张鹏

模型能力

1.代码生成大模型CodeGeeX4

第四代代码模型 CodeGeeX4堪称代码生成大模型的“六边形战士”,已经发布的CodeGeeX4-ALL-9B 仅用百亿级参数实现模型精度超越业界主流产品。在NaturalCodebench等测试基准上,相对于更大的模型实现了性能反超。

CodeGeeX4单一模型实现编程开发全流程覆盖,包括需求设计、前端开发、后端开发、数据处理等场景,支持代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等全面能力。模型长序列达128K,支持中文、英文、俄语、法语、西班牙语等20+自然语言和300+编程语言。同时,在模型推理可实现单卡部署,最低24GB显存即可进行量化推理,用户可在本地私有化部署,保护企业代码安全。

wKgaombEcACARrSoAAEnyvjMtWI350.jpgwKgZombEcACAcCv-AACbaM5uG5U825.jpg

2.多模态大模型CogVLM2-video(视频生成文本)

多模态大模型CogVLM2-video实现视频生成文本能力,支持2K序列长度、224×224分辨率的视频理解以及中英文回答等功能。测试实践显示,CogVLM2-video在多个视频问答任务上达到了 state-of-the-art (SOTA模型)的性能,并能够实现一分钟内的视频理解,在几个主流性能测试数据集(MVBench, VideoChatGPT-Bench and Zero-shot VideoQA datasets)中,CogVLM2-video也表现不俗,展现出全面竞争力,同时在多类主要指标上完成对其他模型的领先。

wKgaombEcACALy5iAADbOUXaPGU564.jpgwKgaombEcACAO4dyAABNa4pVLEQ393.jpgwKgZombEcACAOsZEAAB3ve3Dab4451.jpg

基于昇腾与昇思的新版本CodeGeeX4

CodeGeeX4在训练过程中,调用昇腾原生的融合算子,利用昇思MindSpore AI框架的提供的多维混合分布式并行能力,通过对流水交织并行、tensor模型并行的优化,解决内存瓶颈、降低计算空泡、提升通信效率,实现“计算、网络、存储”协同优化,对比同等规模参数的模型,训练效率20%提升,加速模型的迭代创新。

另外,该模型也采用MindSpore 2.3版本原创的多级编译技术,开启O1编译选项增加自动算子融合优化,以接近动态图的启动时间获取了图模式下接近理论值的内存复用率,进而降低重计算比例,相对动态图获得15%的性能收益。

未来,智谱将与昇腾AI持续携手,打造更多领先的自主创新大模型,加速人工智能产业发展,助力中国千行百业的智能化转型,共同迈向智能新世界。

wKgZombEcACAY3aGAAFF4PwDGFk160.jpg

昇腾使能AI产业生态打造原生成果

自从昇腾全面启动原生开发,越来越多的生态伙伴选择昇腾,大模型生态从“应用迁移”走向“原生开发”,充分依托昇腾AI基础软硬件平台和完备的原生开发工具,提升开发效率、强化模型性能、加速应用落地,面向不同行业客户提供个性化的解决方案,与昇腾共同推进中国人工智能产业的蓬勃发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296527
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261488
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4963
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产AI芯片真能扛住“算力内卷”?海的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    华为与全球开发者共赢生态

    在华为全联接大会2025期间,华为计算业务总裁张迪煊发表了“以开发者为中心,加速自主创新,共赢生态”的主题演讲,宣布CANN技术指导
    的头像 发表于 09-20 15:57 1574次阅读

    香橙派AIpro(20T)走进北京大学、上海交通大学等高校鲲鹏科教创新卓越中心特训营

    近日,北京大学、上海交通大学等高校鲲鹏科教创新卓越中心特训营-DeepSeek专场成功举办。活动旨在基于技术的DeepSeek本地化
    的头像 发表于 04-18 11:51 977次阅读
    香橙派AIpro(20T)走进北京大学、上海交通大学等高校鲲鹏<b class='flag-5'>昇</b><b class='flag-5'>腾</b>科教<b class='flag-5'>创新</b>卓越中心特训营

    华为人工智能伙伴峰会成功举行

    近日,在华为中国合作伙伴大会期间,人工智能伙伴峰会在深圳正式召开。会上,华为计算业务总裁张迪煊发表了《与时代 共
    的头像 发表于 04-01 15:38 1137次阅读

    中软国际推出金融AI解决方案和一体机v1.0

    近日,中软国际重磅推出金融AI解决方案和一体机v1.0,该方案基于AI基础软硬件平台,完成并通过
    的头像 发表于 03-28 17:05 1001次阅读

    大华股份亮相华为中国合作伙伴大会2025 星汉×推动行业创新发展

    。   星汉× 推动行业创新发展 数字化浪潮下,大模型正迅速融入各行各业,市场需求呈现爆发式增长。此次发布的大模型应用一体机等系列产品,
    的头像 发表于 03-25 17:43 2365次阅读
    大华股份亮相华为中国合作伙伴大会2025 星汉×<b class='flag-5'>昇</b><b class='flag-5'>腾</b>推动行业<b class='flag-5'>创新</b>发展

    DeepSeek在上的模型部署的常见问题及解决方案

    2024年12月26日,DeepSeek-V3横空出世,以其卓越性能备受瞩目。该模型发布即支持,用户可在硬件和MindIE推理引擎上
    的头像 发表于 03-25 16:53 1887次阅读
    DeepSeek在<b class='flag-5'>昇</b><b class='flag-5'>腾</b>上的<b class='flag-5'>模型</b>部署的常见问题及解决方案

    远达与合作推动AI PC应用创新

    近日,端侧智能领域创新者创远达携手,基于算力平台正式发布一系列AIPC应用。双方深度融
    的头像 发表于 03-25 10:22 1062次阅读

    (原创)310B(8T/20T)算力主板定制方案

    310B(20T)算力主板规格书 1.功能、性能与接口a)310B 20T算力处理器, 4个64位TAISHAN V200M处理器核,最高主频1.8GHz,计算加速器如下:1)
    发表于 03-16 21:43

    润和软件将持续深化“+DeepSeek”技术路线

    (以下简称“润和软件”)作为生态核心伙伴受邀出席,人工智能研究院AI总工朱凯分享了基于“ + openEuler + OpenHarmony + DeepSeek”的全场景云-
    的头像 发表于 03-08 09:39 1122次阅读

    推理服务器+DeepSeek大模型 技术培训在图为科技成功举办

    2月17日,华为政企业务团队受邀莅临图为科技深圳总部,并成功举办了一场聚焦于《推理服务器+DeepSeek大模型》的专业知识培训。 此次培训活动不仅深化了双方的技术交流,更标志着
    的头像 发表于 02-26 17:38 1047次阅读
    <b class='flag-5'>昇</b><b class='flag-5'>腾</b>推理服务器+DeepSeek大<b class='flag-5'>模型</b> 技术培训在图为科技成功举办

    华为推出DeepSeek大模型一体机

    DeepSeek大模型的横空出世,让AI正以前所未有的速度重塑各行各业的发展格局。DeepSeek一体机深度融合腾高性能算力底座与DeepSeek全系列大
    的头像 发表于 02-18 09:56 2608次阅读

    迅龙软件出席华为APN伙伴大会,获APN钻石伙伴授牌及两项大奖

    和战略思考。作为华为的重要合作伙伴,迅龙软件受邀参加此次会议,并以其出色的创新能力和丰富的产品线,获得APN钻石伙伴授牌,同时荣获2
    的头像 发表于 02-17 17:04 1394次阅读
    迅龙软件出席华为<b class='flag-5'>昇</b><b class='flag-5'>腾</b>APN伙伴大会,获<b class='flag-5'>昇</b><b class='flag-5'>腾</b>APN钻石伙伴授牌及两项大奖

    迅龙软件受邀参加华为人工智能框架峰会,展示X香橙派的创新AI案例

    12月14日,人工智能框架峰会在北京中关村国际创新中心召开,本次大会以“创新源动力,框架新选择”为主题,由
    的头像 发表于 12-17 18:02 1200次阅读
    迅龙软件受邀参加华为<b class='flag-5'>昇</b><b class='flag-5'>思</b>人工智能框架峰会,展示<b class='flag-5'>昇</b><b class='flag-5'>思</b>X香橙派的<b class='flag-5'>创新</b>AI案例

    云天励飞携手华为打造智算中心解决方案

    当前,人工智能技术正在加速向各行业深度渗透,成为驱动产业转型和社会进步的重要引擎。构建开放协作的AI生态体系、推动技术和应用深度融合,已成为行业发展的重要趋势。 云天励飞基于AI基础软硬件平台
    的头像 发表于 12-12 16:05 2650次阅读