0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

极狐GitLab助力AI芯片企业DevOps体系建设

话说科技 来源:话说科技 作者:话说科技 2021-09-15 12:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

根据Forrester预测,全球AI制造平台产值到2025年将达到130亿美元。并将成AI软件第一大细分市场。AI芯片行业正在全球迎来春天。据研究机构赛迪顾问报告显示,从2019年到2021年三年中国AI芯片市场规模一直保持50%以上的增长速度,到2021年,市场规模将达到305.7亿元。

面对如此诱人的市场规模和不断变化的市场需求,即便AI芯片行业已经巨头林立,依然有众多优秀并且敢于创新的新生力量进入赛道,在极速发展中占有行业的一席之地,“燧原科技”便是其中不得不提的名字。

近日,极狐(GitLab)采访到来自国内AI芯片行业代表企业——燧原科技的软件研发总监张文平先生,与您分享这家优秀的AI芯片企业数字化基础设施的升级之路。

寻找坚实的数字力护航产品研运体系

张文平表示:“燧原科技专注研发人工智能领域云端算力平台,在整个研发进程中,既包括AI芯片与板卡的设计、开发、测试、量产,也包括AI软件栈及相关工具链的设计、开发、验证、测试等各个环节。”

AI芯片本身的诸多特性需要先进的芯片架构以及易用并持续迭代的软件栈一起来保证。相较于纯软件企业的开发流程,燧原科技更具挑战的是整个研发流程,既有Pre-Silicon阶段的软件模拟平台、物理仿真平台的开发验证流程,又有Post-Silicon芯片、板卡、服务器系统以及AI集群等多种开发验证环境。因此燧原科技过去一直在使用组合工具链来打造研发流程。

燧原科技的研发团队使用不同工具来满足不同研发要求,例如代码托管平台GitLab、制品管理平台Artifactory、测试管理平台TestRail等等各类优秀的工具、并且使用Gerrit/Jenkins/GitLab CI持续集成Pipeline。

然而,复杂的组合工具链在整合过程中,一直面临稳定性与可扩展性等问题。同时如何集成各种相关工具使其高效、可持续地工作,确保产品研发等各环节高质量的完成交付工作,燧原科技正在寻求突破的方向。

另一方面,燧原科技在国内上海、北京、深圳、杭州都设有办公室,不同地点的研发人员协同效率问题也是研发团队持续面临的问题,尤其是随着代码仓库的增大,代码仓库在托管平台不同地点之间的同步也遇到挑战。

张文平表示:

燧原科技从成立的第一天开始就在使用GitLab社区版产品,但是免费的社区版产品功能随着公司的快速成长,已不再能够满足燧原科技对研发效率的追求,希望利用更多高阶的增值功能并结合燧原内部的研发场景,构建敏捷、稳定、高效以及可扩展的研发流程。在得知极狐(GitLab)公司成立后,我们对极狐GitLab专业版的功能进行了深入的调研,并对于极狐GitLab本土化支持的实时性、专业支持能力和运维能力有了充分了解,最终选择极狐GitLab专业版在燧原内部进行落地部署。在产品落地部署的同时, 极狐GitLab所提供的线上课程以及丰富详细的说明文档让燧原科技的R&D和DevOps工程师能快速地学习、成长。

星火燎原,优秀DevOps体系的试验田

张文平表示:“ 极狐GitLab专业版的引入,从DevOps的运维角度,降低了运维的难度和复杂性,同时也提高了研发体系的可靠性和工程效率,从而进一步提高研发和运维人员的研发体验。”

燧原科技十分清醒的认识到,DevOps体系大规模的改革并非一蹴而就,全面展开调整之前需要进行不断的论证、尝试和迭代,找到专属于燧原科技的DevOps体系化之路,才是正确的打开方式。

张文平说:“我们使用极狐GitLab专业版目前是从部分团队开始,期待未来可以大规模推广到更多团队。”

01

提升研发效率,统一工具平台

燧原科技亟待减少独立工具种类以搭建统一的、高效的DevOps平台以提升整体研发运维效率。

目前,燧原科技部分产品研发团队已经完成在极狐GitLab中研发流程的迁移,经过改进后,实现了单一平台的协作并且无需跳转。同时本地就近服务节点Clone/Commit代码,加速代码拉取操作,同时与K8s算力集群对接,简化代码提交、review流程的同时,实现CI pipeline的简化和高效执行。(资料来源:极狐GitLab使用情况展示)

e13de9f1f2598.png

随着燧原科技的规模发展,公司研发团队在物理位置上的分散,也出现了一些协作方面的挑战,比如其他城市的团队在检出代码时(极狐GitLab实例安装在上海的服务器上),受限于带宽和代码库大小,耗时较多。在采用了极狐GitLab GEO部署方式后,代码检出速度大大缩短,有效的提升了研发效率。(资料来源:极狐GitLab GEO部署展示)

另一方面,燧原科技也正在使用极狐GitLab的Group/Subgroup等功能对项目做更细粒度的划分管理,这也使得燧原科技对于源码管理的安全性得到了有效的提升。

02

优化生产成本,团队效能倍增

张文平说:“燧原科技利用极狐GitLab专业版降低工具平台的维护难度与成本,节约了运维时间成本,从而可以花更多精力专注在有创造性的工作内容上。”

燧原科技在前期仅仅将极狐GitLab作为源代码管理工具,而整体的CI/CD是用Jenkins来完成的。众所周知,Jenkins功能强大且较为稳定,但是大量的Jenkins插件维护对研发人员来讲是不小的工作量,插件之间还有版本依赖。随着燧原科技的项目复杂度和规模都在不断扩大,导致Jenkins实例数量的持续增加,如何保证不同环境(开发、测试以及生产)的Jenkins实例的配置、插件版本等保持一致,同时在人力有限的情况下,能够达成这样的工作体量,成为张文平团队需要考虑的下一个问题。

另外一方面,Jenkins支持多种语言来完成CI/CD,如Shell, Groovy, Python等。往往负责CI/CD编排和负责业务研发的员工是两个团队,这在无形中会增加沟通成本,阻碍DevOps的高效运行。(资料来源:极狐GitLab Pipeline流程展示)

当燧原科技开始使用极狐GitLab + 极狐GitLab CI的方式后,开发人员可以通过查看极狐GitLab CI的语法来完成CI/CD的编排,这样就省去了无穷无尽的各类插件更新和实例维护,同时CI/CD编排团队的额外沟通成本也得到有效控制。

03

更好的用户体验,推动快速落地

研发运维的工具需要创新,使用更具创新性的DevOps平台,提升员工工作体验,减少繁琐的重复和等待,可以帮助提高员工的工作效率。

对于研发人员来讲,改变现有的研发习惯,拥抱新的变化是需要过程的。张文平认为:“逐步培养研发人员使用更新、更高效的研发运维工具非常重要。一个好产品,肯定具有一定的用户粘性,研发人员一旦感受新工具、新平台带来简洁、方便、高效的特性和改变,他们将会乐意接受并融入。”

未来可期,打造更安全的DevOps体系

张文平认为:“任何生产力工具的落地,都需要一个迭代过程,我们对极狐GitLab在很多方面都有期待和想法,未来我们会在极狐GitLab中探索更多功能的使用,并在合适的时间点进一步完善体系的搭建,例如集成极狐GitLab内置的安全功能等。”

成立3年,高歌猛进。燧原科技以行业黑马的姿态在AI芯片领域开疆拓土。在近期活动中,燧原科技打出了“算力普惠之智,芯片强国之梦”的口号,这背后需要其搭建迭代更快、效率更高、能力更强的数字化基础设施体系,来支撑更长远的发展。未来,极狐(GitLab)会持续提供高质量、高品质的产品与服务助力燧原科技早日实现“芯片强国之梦”。
fqj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54644

    浏览量

    470991
  • AI
    AI
    +关注

    关注

    91

    文章

    41997

    浏览量

    303086
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    软通动力成功中标国新资产AI平台建设项目

    软通动力成功中标中国国新资产管理有限公司(简称 “国新资产”)AI 平台建设项目,将全面承建国新资产企业AI 智能决策平台,依托领先人工智能技术深度赋能资管业务全流程,
    的头像 发表于 05-12 10:21 414次阅读

    打破 DevOps 局部效率陷阱 构建端到端价值流交付体系

    了基础CI/CD工具链价值建设,业务交付的降本增效效果已经达到预期,研运的短板已经阻碍了业务高速发展的核心一步。 ##一、企业DevOps实践面临的三大共性痛点 当前企业
    的头像 发表于 04-21 17:19 419次阅读

    AI大模型微调企业项目实战课

    自主可控大模型:企业微调实战课,筑牢未来 AI 底座 在人工智能席卷全球商业版图的今天,企业对大模型(LLM)的态度已经从“新奇观望”转变为“全面拥抱”。然而,随着应用层面的不断深入,一个严峻
    发表于 04-16 18:48

    嵌入式AI开发必看:杜绝幻觉,才是工业级IDE的核心底气

    调试体系,为企业带来了确定性的价值突破。 ▌代码零修改直接部署:经过全流程校验与自动化测试的AI代码,无需人工二次修改即可直接烧录至工业设备,大幅缩短开发周期,降低调试成本。 ▌打消“AI
    发表于 03-18 13:49

    北汽获得全国首批L3级自动驾驶专用正式号牌

    12月23日,全国首批L3级自动驾驶专用正式号牌在北京完成上牌,北汽阿尔法S(L3版)完成京AA0001Z、京AA0733Z、京AA0880Z号牌登记,正式获得“合法上路资格”。这标志着北汽
    的头像 发表于 12-29 15:55 616次阅读

    北汽T1搭载魔视智能全新一代智能泊车系统

    日前,北汽集团旗下高端新能源品牌汽车推出全新A0级纯电SUV——T1。新车定位“超安全家庭纯电SUV”,以2770mm超长轴距、320和425公里续航以及2级组合驾驶辅助系统,
    的头像 发表于 10-10 16:28 1133次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    解决人类智能无法解决的复杂问题。实现AGI的AI相关研究机构和企业的主要目标。 一、生成式AI点燃AGI之火 CHatGPT就是已经取得成功的生成式AI技术。很多人都充满了信心,相信不
    发表于 09-18 15:31

    Linux企业网络安全防护体系建设

    构建完整的Linux安全防护体系不是简单的工具堆砌,而是需要从架构设计、监控告警、应急响应到持续改进的完整闭环。本文将分享我在大型企业环境中的实战经验。
    的头像 发表于 08-27 14:39 1014次阅读

    产品拆解 | 添可芙万“客”洗地机(上):AI 全向助力如何实现?

    2个滚轮电机、1个滚刷电机、1个风机、1个水泵,5个电机的电控和主控方案应该如何设计?“AI全向助力”怎么实现?元器件国产比例如何?本期拆解添可芙万8月新品客洗地机的设计方案思路,看看国产
    的头像 发表于 08-25 16:24 3681次阅读
    产品拆解 | 添可芙万“<b class='flag-5'>极</b>客”洗地机(上):<b class='flag-5'>AI</b> 全向<b class='flag-5'>助力</b>如何实现?

    AI 芯片浪潮下,职场晋升新契机?

    中能充分展现个人对行业的贡献。 持续学习助力 AI 芯片与职称双赢 AI 芯片领域知识更新迅速,持续学习是保持竞争力的关键,这一点在职称评审
    发表于 08-19 08:58

    睿海光电800G光模块助力全球AI基建升级

    巨头反馈,睿海光电在800G SR8订单中较竞品提前72小时完成交付,助力AI训练集群建设周期压缩15%。 三、广泛兼容性:全场景适配+3年超长质保,打造无忧部署体验 为应对客户多元化需求,睿海光电
    发表于 08-13 19:05

    Cognizant加速AI模型企业级开发

    -Cognizant推出AI Training Data Services,助力企业AI模型加速开发 Cognizant是数据与AI模型训
    的头像 发表于 07-31 17:25 869次阅读

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    ,技术前沿。从算法、工艺、材料、应用到系统多个维度,全面且系统地阐述AI芯片技术体系。 书中各章节层层递进,先介绍深度学习AI芯片创新方法,
    发表于 07-28 13:54

    北汽阿尔法T5 Robotaxi量产下线

    近日, 阿尔法T5 Robotaxi正式量产下线,并已全面启动在深圳的落地运营推进工作。这款搭载小马智行第七代自动驾驶系统的车型即将来到千万人身边,这标志着4级高度自动驾驶技术正式走向普及,加速融入大众生活。
    的头像 发表于 07-21 10:49 1347次阅读

    RAKsmart服务器如何助力企业破解AI转型的难题

    当今,企业AI转型已成为提升竞争力的核心战略。然而,算力不足、成本失控、部署复杂等问题却成为横亘在转型路上的“三座大山”。面对这一挑战,RAKsmart服务器凭借其技术创新与全球化资源整合能力,为企业提供了一套从底层硬件到上层应
    的头像 发表于 05-27 10:00 591次阅读