0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

芯事访谈 | 阿里云张献涛:算力需求暴增,底层创新为云计算“续航”

平头哥半导体 来源:未知 2023-08-08 14:05 次阅读

以技术驱动创新,以芯力量拥抱数智未来。《芯事》访谈对话科技创新者、引领者,探索创芯之路,共建硬核算力,赋能科技创新。

策划|平头哥半导体

媒体合作|eefocus与非网

本期《芯事》人物

张献涛

阿里云智能基础产品部副总裁

阿里云弹性计算产品线总经理

十多年前,当业界还在探讨“云计算将给IT产业格局带来什么变化”时,也许并没有想到云计算会从当初的抽象构想成为全球产业变革的必由之路,并成长为重要的经济引擎。

时至今日,云计算推动的产业、商业和社会变革,已经汇聚成承前启后的关键力量,成长为数字经济的核心生产力,而面向ChatGPT等AI应用掀起的新革命,云计算的创新活力还将持续释放,芯片作为重要的算力支撑也将发挥更大的价值。

本期《芯事》访谈,与非网采访到里云智能基础产品部副总裁、阿里云弹性计算产品线总经理张献涛。

三步见证中国云计算发展

张献涛在回顾起云计算发展的早期阶段时调侃,“大约在2014年左右,当时还处于传统算力向云计算的转移过程中,用户多是中小站长为代表的个人开发者,负载可能就是一些中小企业的网站,不会有太多客户关注高可用性、高性能等指标。”

时间来到2015年,新一轮移动互联网爆发了,以互联网公司为代表的技术型企业,逐步推动传统IT系统向基于云的IT系统转移。“云计算的第二发展阶段拉开了大幕,对IaaS、SaaS高稳定性、高性能的需求爆发了。”张献涛说道,“也就是在这个时间节点,阿里云开始了战略转型,从传统的服务中小站长用户,面向移动互联网场景的大信息流、高实时性、高性能、高并发的场景做出调整。正因如此,我们也承接了移动互联网发展的一波红利,迎来了中国云计算市场的爆发式增长。”

2020年以后,云计算进入了第三发展阶段。张献涛表示,“云计算开始纵深发展,上云的趋势从消费互联网向产业互联网转移,以产业客户为代表的传统企业上云的诉求越来越明显。”

这对云计算其实提出了较大的挑战,因为需要保障客户业务在连续、不间断的情况下,能够迁移到云的架构。也正是在这个关键节点,阿里云开始了包括计算架构、处理器、存储等核心技术的创新变革。

软硬协同设计应“云”而生

在传统IT时代,软件和硬件之间的依存程度并不高,可以分离演进,并行发展。但是进入云计算时代,软硬件分离迭代的模式逐步显现出局限性。应用变得越来越复杂,算法、软件和硬件的隔阂,已经无法满足在超大规模计算场景下提升IT计算效率、降低计算成本的诉求。如何最大化发挥“云”的价值,实现应用快速上线且高效运行成为发展的关键。

“其实这也提供了一个机会,如果你对硬件、系统软件、中间件等都掌握的话,你就可以很好地进行软硬件协同设计,这是云计算时代一种新的技术红利。”张献涛表示,“我们当时就在深入思考,既然硬件系统、软件系统都是自研,下一步我们如何从软件定义硬件、定义芯片的视角,来做软硬件协同的设计?”

当时,传统的虚拟化技术应用到云计算过程中,其实存在非常多问题,比如算力损耗等,而这通常意味着计算成本可能会随之增加。张献涛谈到,“所以在当时的时间点上,我们首先需要通过软硬件协同设计,解决传统虚拟化技术带来的这些问题。不过这一挑战非常大,因为现有芯片无法满足这些需求,我们几乎评估了业界的所有芯片后,决定重新设计芯片、设计硬件、设计服务器的计算架构,并且对整个系统软件栈进行重构,这是一个浩大的工程。”

后来的事实证明,阿里云当时的这一决定极具前瞻性,使它既享受了软硬件协同设计所实现的技术红利,同时也给云计算客户带来更多收益,比如更低的成本、更优质的算力服务等。根据IDC数据,阿里云数年来稳居公有云市场排名第一的位置,并领跑金融云、视频云等领域。

从“芯”出发,为云而生

近年来,跨界造芯成为科技界的一大趋势,不论是云计算大厂、AI算法公司或是车企,对于芯片的关注度越来越高。在这些跨入芯片圈的企业中,阿里巴巴旗下的平头哥可以说是国内起步最早的企业之一,一个核心的研发方向就是数据中心芯片。

成立于2018年的平头哥,正处于云计算的拐点之上。

还记得2017年左右,阿里云的广告语“上云就上阿里云”,雄踞国内各大机场。短短一句话,传递了云计算当时正在进行的变革和创新——它不再是互联网企业的特有应用,而是逐渐蔓延到传统领域,向千行百业的企业发出“上云”邀请。一个趋势已经显现——云计算将扩展到大数据、AI、物联网等领域,共同成为传统企业进行数字化转型、我国发展数字经济必不可少的基础支撑。

而这一切,都在倒逼底层技术加速升级。对于当时的云计算巨头来说,头等大事就是如何满足企业多种多样的差异化需求?如何提供更具性价比的云服务?一方面是看得见的巨大蓝海,一方面是对性能效率最大化的迫切需求——在这些推动因素下,自研芯片就成了一种自然而然的选择。

倚天710是阿里巴巴第一颗为云而生的CPU芯片,由平头哥半导体自研,设计核心在于适配阿里云大规模、多线程、高并发的业务特点。倚天710采用Armv9架构,拥有128个核心、主频2.75GHz。通过将芯片设计与云场景的独特需求相结合,倚天710最终实现了性能和能效比的双重突破:性能超过当时的业界标杆20%,能效比提升50%以上。倚天710发布后,2021年天猫“双11”核心交易系统平滑迁移至倚天实例,算力性价比提30%。

随着部署规模的不断扩大,自研芯片的种种优势被不断放大,不仅有助于打造稳定、响应快、能快速扩展的计算基础设施,更便于云厂商在每个业务流程中做到效率与成本的最优化,同时,还可以做到硬件和软件并行开发,这意味着能够跨越传统设计界限、创新速度更快。

“我们发现一些客户对倚天芯片的拥抱程度其实是比较高的,尤其是互联网客户,因为不需要他们进行太多的业务架构或代码层面的改动,就能获得更强的性能优势。此外,阿里云倚天实例在视频编解码业务场景中,性价比提升超过80%,在密集型计算业务场景中,性价比提升50%以上。”张献涛表示,“这样的客户越来越多,也更加坚定了我们与平头哥半导体一起在自研芯片这条路上继续往前走的决心。”

阿里云倚天ECS的用户中,北京科学智能研究院在使用密度泛函数理论软件时,性价比提升70%;汇量科技广告推理业务使用倚天710云实例,性能和网络带宽双双提升,性价比提升40% 以上。

谈及对云原生系统中未来芯片的构想,张献涛表示,“我们还是希望能够加入更多的云原生元素,与平头哥半导体继续紧密合作。此外,还有对新的总线比如UCIe、CXL的支持,从而能够和CPU的计算架构进行更为深度的融合,更好地发挥软件的协同效应。”

AI时代,软硬件融合是更优算力的路径

在生成式AI掀起的巨大声浪中,大模型对计算能力提出更高要求的同时,也给云计算带来了新的应用场景。随着大模型应用逐渐深入到千行百业,未来,每家企业都可以是“AI大模型企业”。大模型时代需要什么样的云服务?如何进一步降低用户上云门槛?

显然,成本首先是一笔要算的账,现阶段大模型的算力成本非常高昂。对此,张献涛表示,还是需要提升算力效率,通过软硬件的充分融合,通过自定义的芯片去加速算力提升,比如和平头哥进行更加深度的合作,能够让这个领域所需要的强大AI算力,通过软硬件的深度协同变得更高效、成本更低。

“无论是在初代智能时代,还是这些年AI的发展,其实都需要深度的软硬件融合技术带来提升。而软硬件融合的本质更多还是软件定义硬件的一种新型模式,通过这种模式,软件和硬件之间的协同程度更高了,能够让软件的效率充分发挥出来,最终可以把整体计算效率提升起来”,张献涛谈到。

面临AI浪潮的来袭,云计算不仅需要通过算力普惠推动企业的数字化转型,同时,也肩负着助力AI更普及、为千行百业智能化升级提供核心动力的重任。在云计算和AI深度融合驱动的新一轮变革中,云计算和AI大模型将共同成为新时代的基础设施,而芯片将提供必不可少的底层支撑,让算力更普惠、让 AI 更普及。一个由算力撬动的智能时代---大幕已经拉开。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 平头哥
    +关注

    关注

    0

    文章

    62

    浏览量

    8931

原文标题:芯事访谈 | 阿里云张献涛:算力需求暴增,底层创新为云计算“续航”

文章出处:【微信号:gh_65bdec3412bd,微信公众号:平头哥半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    微第二代8nm高性能AIOT平台 RK3576 详细介绍

    ArmSoM-Sige5采用Rockchip 第二代8nm高性能AIOT处理器 RK3576,主频高达2.2GHz,6 TOPSNPU , 支持ufs ,双USB,双网口,全功能typec,兼容树莓派40pin armsom-sige5 RK3576
    发表于 03-12 13:45

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    来说,DPU的需求也越来越大,大量边缘计算需求在飙升,边缘数据预测,边缘决策,边缘图像识别,一个个
    发表于 12-24 10:54

    【ELF 1开发板试用】+ 8.1 MQTT开发——连接阿里【项目复现】

    MQTT开发——连接阿里【项目复现】 本文基于文档中提供的项目教程,复现ELF 1连接阿里物联网平台,进行MQTT开发;记录ELF1 个人物联网开发的过程,可以提供参考; MQTT
    发表于 12-15 22:00

    闪耀“中国” 华大北斗荣获2023年“中国”优秀技术创新产品奖

    400余项,已获得授权专利150余项,公司建立了完整、丰富的芯片和模组产品体系,提供从芯片、模组、终端到芯片级解决方案的全栈式产品服务,中国集成电路产业高质量发展提供了自主可控的底层技术支持。 创新
    发表于 09-22 14:46

    Crypto加密发库资料

    Crypto模块提供通用的加密和哈希算法,包含对 OpenSSL 的哈希、HMAC、加密、解密、签名、以及验证功能的一整套封装。用于连接物联网设备,例如使用ESP32上传阿里。Crypto-0.2.0是目前最稳定的版本。
    发表于 09-18 07:11

    STM32通过NB-IoT连接阿里IOT平台

    NB-IoT技术介绍 整体框架结构 • 硬件连接注意事项 • DEMO运行效果 • 在阿里物联网平台创建并配置产品 • 在平台创建设备 • 常见问题及解决方法 • DEMO运行过程实物演示
    发表于 09-11 07:04

    5.1 私有概述#计算

    计算
    学习硬声知识
    发布于 :2023年07月14日 23:23:21

    063. 阿里·无影桌面-试用NX1953 #硬声创作季

    阿里
    充八万
    发布于 :2023年07月06日 02:08:04

    062. 阿里·无影桌面-试用NX1953-续

    阿里
    充八万
    发布于 :2023年07月06日 02:06:55

    想通过ESP8266连接阿里,固件哪里有?

    想用新唐的板子,通过esp8266连接阿里 有没有测试好的esp8266的固件? 还是说,这个固件要自己修改,自己写?
    发表于 06-27 07:40

    f429igt6阿里与iwip对接出现问题怎么解决呢?

    rtt系统使用4.0.1系统。硬件网络选择enc28j60模块 协议栈使用iwip2.0.1 阿里SDK包使用3.0.1 当前通过ping命令测试数据是ping通的。 所以确认网络通信正常。 但是
    发表于 05-17 10:57

    RISC-V入!赛昉科技联合中国电信完成首个RISC-V云原生轻量级虚拟机验证

    构建RISC-V计算生态领先优势的关键一环,有助于推动中国电信引领RISC-V上,实现数据中心基础设施自主可控、降低成本等目标。中国
    发表于 05-11 14:08

    阿里组件的底层HAL TCP相关接口是不是有问题?

    使能AT组件,选择EC200S连接阿里,出现错误,一直解析不出来地址,换的AIR720也是这样,阿里组件的底层HAL TCP相关接口是不
    发表于 05-05 14:41

    办公/教育产品方案优势瑞微RK3568开发板,高性能,支持丰富接口

    终端产品在办公、教育等行业被广泛应用,其具有实用性强、运维量小、数据存储更安全等特点,深受市场青睐。瑞微全新的RK3568终端芯片方案,基于强大的性能及丰富接口,聚焦终端产品技
    发表于 05-04 11:13