0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于龙架构的AI加速开发系统正式落地

龙芯中科 来源:龙芯中科 作者:龙芯中科 2022-06-15 11:13 次阅读

随着信息数据的爆炸式增长、计算能力的提高以及理论算法的突破,AI技术快速发展,AI技术不仅在学术界产生突破性研究成果,同时在工业界被广泛应用。目前,绝大多数流行使用的AI系统均为国外开发者发布,使用国外的开发系统平台开展AI的研究和应用,具有风险性和安全问题。AI系统作为关键系统软件,亟需解决国产化问题并确保安全可控。

近期,在龙芯中科、松科智能、寒武纪等多方的共同努力下,基于LoongArch(龙架构)的AI加速开发系统,在金陵科技学院成功部署验收。

基于龙架构的AI加速开发系统

1基于LA架构,算力最高达20T

基于龙芯最新高性能处理器龙芯3C5000L设计,处理器基于龙芯自主指令系统架构LoongArch。配合国产 AI加速卡,最⾼可以完成10T算⼒的⼯作任务。多卡最⾼可以⽀持4路⼈⼯智能计算卡的部署,最⾼算⼒可以达到20T。

2与系统软硬件深度融合

该AI加速开发系统,与系统软硬件的深入融合,提供了开发、调试与维护的系统平台,有可靠的硬件支持和性能优越的算法模型,把AI技术和硬件系统环境进行有机结合,应用到具体和安全密切相关的实际场景中,例如人脸识别认证,智能检测控制、大数据风控等。在这些场景下AI技术能提供比人工更加好的识别精准度,节省人工成本,为生产生活带来便利。

AI开发系统的硬件结构

3支持多个人工智能场景

该AI加速开发系统,可以实现包括⼈脸识别、矩阵推导、模式识别、智能驾驶等⼈⼯智能场景,提供深度学习定点化训练框架以及模型的定点化⼯具,提供通⽤模型的编译以及部署开发SDK套件,⽀持 MXnet、 Caffe、TensorFlow 等主流算法框架。

人脸识别功能测试

在很多场景下的AI开发系统平台无法满足系统性能的需要,不易于开发,资源利用率低等,基于龙架构的AI加速开发系统,发挥计算芯片的效率,搭载设计先进的计算卡,开拓了机器学习系统新的发展方向。此系统搭载国产⼈⼯智能芯⽚,可以⾼效完成多路动态视频流的⼈脸检测、跟踪、特征提取和识别,⾼效⽀持墨镜、⼝罩、性别、年龄等属性检测。提供强⼤的可编程运算能⼒,满⾜CNN算法实时性处理的运算要求和算法移植和应⽤。

在国家大力发展自主可控的关键基础软硬件背景下,基于龙架构的AI加速开发系统的落地,为国产AI产业发展提供了新的创新动能与实践样本。高校是培养创新型科技人才的前沿阵地和摇篮,龙芯中科愿携手金陵科技学院及其它各类院校,不断进行产学研深度合作,培养创新技术人才,共同建设自主信息技术体系和产业生态。

原文标题:龙芯联手松科智能与寒武纪,基于LoongArch的AI加速开发系统落地南京高校

文章出处:【微信公众号:龙芯中科】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 龙芯中科
    +关注

    关注

    0

    文章

    229

    浏览量

    7450
  • 寒武纪
    +关注

    关注

    11

    文章

    182

    浏览量

    73728
  • LoongArch
    +关注

    关注

    0

    文章

    21

    浏览量

    1299

原文标题:龙芯联手松科智能与寒武纪,​基于LoongArch的AI加速开发系统落地南京高校

文章出处:【微信号:gh_53fadbdbd4d4,微信公众号:龙芯中科】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

    电子发烧友网报道(文/黄晶晶)在嵌入式领域,边缘与端侧AI推理需求不断增长,Arm既有Helium 技术使 CPU 能够执行更多计算密集型的 AI 推理算法,也有Ethos 系列 AI 加速
    的头像 发表于 04-16 09:10 2226次阅读
    Arm推动生成式<b class='flag-5'>AI</b><b class='flag-5'>落地</b>边缘!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器支持Transformer <b class='flag-5'>架构</b>,性能提升四倍

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统开发的一个目标识别的AI应用,旨在从上到下打通Openharmony AI系统,展
    发表于 04-11 16:14

    英伟达发布最强AI加速卡Blackwell GB200

    英伟达在最近的GTC开发者大会上发布了其最新、最强大的AI加速卡——GB200。这款加速卡采用了新一代AI图形处理器
    的头像 发表于 03-20 11:38 411次阅读

    【国产FPGA+OMAPL138开发板体验】(原创)5.FPGA的AI加速源代码

    OMAP-L138(定点/浮点DSP C674x+ARM9)+ FPGA处理器的开发板。 编写一个用于AI加速的FPGA程序是一个相当复杂的过程,涉及硬件描述语言(如VHDL或Verilog)以及针对特定
    发表于 02-12 16:18

    AI大模型在端侧加速落地已成必然趋势,芯片厂商提前布局!

    普遍认为,2024年AI大模型在商业应用会有极大突破。   “AI大模型在端侧的加速落地已成必然趋势。”在星宸科技上周举办的2023开发者大
    的头像 发表于 12-29 00:47 1459次阅读
    <b class='flag-5'>AI</b>大模型在端侧<b class='flag-5'>加速</b><b class='flag-5'>落地</b>已成必然趋势,芯片厂商提前布局!

    安谋科技赵永超:生成式AI加速落地,行业应用创新从“芯”突破

    生成式AI的发展机遇,以及企业要如何面对生成式AI落地难题。   随着ChatGPT等生成式AI的横空出世,为各行各业带来了新的驱动力。而如何利用好生成式
    的头像 发表于 12-26 14:32 689次阅读
    安谋科技赵永超:生成式<b class='flag-5'>AI</b><b class='flag-5'>加速</b><b class='flag-5'>落地</b>,行业应用创新从“芯”突破

    基于紫光同创FPGA的图像采集及AI加速(盘古50K开发板)

    基于紫光同创FPGA的图像采集及AI加速(盘古50K开发板)
    发表于 11-03 11:02

    基于紫光同创FPGA的多路视频采集与AI轻量化加速的实时目标检测系统

    基于紫光同创FPGA的多路视频采集与AI轻量化加速的实时目标检测系统#2023集创赛#紫光同创#小眼睛科技助力紫光同创高校生态建设@小眼睛科技 获奖作品展示:华南理工大学+CR8_Pro队
    发表于 11-02 17:51

    签了!英特尔与联想、爱奇艺引领加速AI PC落地

    10月31日下午,英特尔公司、联想集团、爱奇艺三方备忘合作发布会在北京举行。三家企业签署合作备忘录,旨在携手加速AI变革在应用端的落地,为用户带来全新的AI高级智能化体验。此次签署备忘
    的头像 发表于 11-01 14:06 243次阅读
    签了!英特尔与联想、爱奇艺引领<b class='flag-5'>加速</b><b class='flag-5'>AI</b> PC<b class='flag-5'>落地</b>

    打通AI芯片到大模型训练的算力桥梁,开放加速设计指南强力助推

    等产业议题进行研讨分享。 面向大模型时代的计算需求,算力创新已不仅是单个处理器微架构和芯片工艺的突破,而需要产业携手进行软硬件全栈系统架构全面创新。当前各类AI芯片创新仍面临存储墙、功
    的头像 发表于 10-17 16:51 533次阅读
    打通<b class='flag-5'>AI</b>芯片到大模型训练的算力桥梁,开放<b class='flag-5'>加速</b>设计指南强力助推

    AI加速架构设计与实现》+第2章的阅读概括

    首先感谢电子发烧友论坛提供的书籍和阅读评测的机会。 拿到书,先看一下封面介绍。这本书的中文名是《AI加速架构设计与实现》,英文名是Accelerator Based on CNN Design
    发表于 09-17 16:39

    AI加速架构设计与实现》+学习和一些思考

    ,如有错误还望大佬们指出,我马上改正。 目录和进度 目前阅读到第一章,先更新到第一章的内容吧 卷积神经网络 运算子系统的设计 储存子系统的设计 架构优化技术 安全与防护 神经网络
    发表于 09-16 11:11

    【书籍评测活动NO.18】 AI加速架构设计与实现

    经验总结图解NPU算法、架构与实现,从零设计产品级加速器当前,ChatGPT和自动驾驶等技术正在为人类社会带来巨大的生产力变革,其中基于深度学习和增强学习的AI计算扮演着至关重要的角色。新的计算范式需要
    发表于 07-28 10:50

    AI爱克斯开发板上使用OpenVINO加速YOLOv8目标检测模型

    《在AI爱克斯开发板上用OpenVINO加速YOLOv8分类模型》介绍了在AI爱克斯开发板上使用OpenVINO
    的头像 发表于 05-26 11:03 717次阅读
    <b class='flag-5'>AI</b>爱克斯<b class='flag-5'>开发</b>板上使用OpenVINO<b class='flag-5'>加速</b>YOLOv8目标检测模型

    AI爱克斯开发板上用OpenVINO™加速YOLOv8目标检测模型

    《在 AI 爱克斯开发板上用 OpenVINO 加速 YOLOv8 分类模型》介绍了在 AI 爱克斯开发板上使用 OpenVINO
    的头像 发表于 05-12 09:08 844次阅读
    在<b class='flag-5'>AI</b>爱克斯<b class='flag-5'>开发</b>板上用OpenVINO™<b class='flag-5'>加速</b>YOLOv8目标检测模型