0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

平头哥半导体带你看懂倚天云实例 自研CPU倚天710已大规模应用

平头哥半导体 来源:平头哥半导体 2023-02-24 17:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2022云栖大会上,阿里巴巴宣布自研CPU倚天710已大规模应用。

编解码场景实现80%的性价比提升,数据库场景、AI推理场景、大数据场景也都分别有着30%、70%、50%的性价比有效提升。

天猫双 11 核心交易系统平滑迁移至倚天 710 云实例,算力性价比提升30%;汇量科技广告推理业务使用倚天 710 云实例,性能和网络带宽双双提升,性价比提升 40%以上。

今天就来说说,这些蹭蹭蹭的性价比提升,阿里云ECS倚天实例是怎么实现的呢?

第一个秘密武器是平头哥自研的倚天芯片本身。

倚天710芯片采用无超线程的设计,让计算性能更高。

无超线程设计,是不是有点懵?我们先来了解一下计算机的“大脑”CPU芯片平时是怎么工作的。CPU里面有两个比较重要的分工:

计算,主要CPU核里面的执行单元负责,数量越多往往算得越快,主频则是影响计算速度,越高算得越快;

缓存,则是暂时存数据的歇脚点,比如说你要算A+B=?,就需要先把A和B暂时存着,等到算的时候才用上。

后来,技术人员发现,大部分情况,一个应用都用不完一整个物理核,导致CPU有很大一分部分是“闲置”的。

于是,就有厂商设计了超线程概念,也就是把一份物理核变成2个vCPU(虚拟CPU),就可以“同时”运行两个应用进程。传统架构的CPU就是这样。

这两个vCPU,因为是在共用一个物理核和缓存,就会导致来自不同vCPU的计算指令要排队被“计算”,同样的缓存里面等待的时候也是一样的。

这样导致的坏处是,因为相互争抢和影响,所以vCPU性能波动较为严重,单个进程也因为要排队,计算速度变慢。

无超线程的设计意味着ECS倚天实例采用的是独享物理核心方式,这可以让算力密集的计算指令不必排队、不必争抢,计算速度更快。

倚天芯片的ARM架构与生产工艺让功耗更小,运算速度更快、更稳定。

倚天处理器采用的是ARM架构,采用更精简的指令集,本来功耗就比传统架构低,加上先进制程工艺,倚天710的功耗是主流架构的1/6,优势十分明显。

一般来说芯片制程越小,功耗越小,性能越高。

生产制程指的是芯片表面晶体管的尺寸,宽度越小电流通过时的损耗越小,功耗越小;更小尺寸也意味着在同等面积中可以塞入更多的晶体管,而作为运算芯片的基本组成部分,更多的晶体管数量显然能够提供更好的性能。

加更多的晶体管,要怎么加也是很有学问的。一般来说架构越新性能越高、能力也更丰富。倚天芯片采用的是最新的ARM v9架构,比之前提供了更多执行单元,也增加安全性、机器学习等新能力。

除了算得快,倚天还功耗低,意味着成本低。功耗大不仅意味着成本,可能还会影响计算性能的平稳。传统CPU架构功耗大,导致计算负载过重时温度上升,为了避免高温造成的功能失效,会主动降低主频,进而影响了性能。倚天就没有任何降频问题。

倚天云服务器性价比高的第二个秘密武器,就是阿里云的数据中心处理器,CIPU。

CIPU开创了不同的硬件架构,让服务器以CIPU为中心。

CIPU连接2颗或者更多倚天的芯片,让多个芯片共享一台服务器,这样降低了成本,使得倚天实例更有竞争力。

同时,各个倚天芯片在各自主板上,一旦某个零件出问题,不会影响同一个机器上的另一张芯片,会让产品更为稳定。这样的设计叫多单路的硬件机型设计。

双路设计,单个CPU损坏将波及同一主板的CPU

依靠CIPU实现双单路设计,低成本+高可用

最后,CIPU将虚拟化与IO转发等数据面卸载到专用硬件上进行加速,消除了原来虚拟化损耗与性能争抢,并大幅加速了IO,也会使得整体性能更高;VPC环境下支持弹性RDMA加速能力,相比TCP时延降低70%以上。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11378

    浏览量

    226492
  • 缓存
    +关注

    关注

    1

    文章

    248

    浏览量

    27854
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1653

    浏览量

    49385
  • 云栖大会
    +关注

    关注

    0

    文章

    33

    浏览量

    8862
  • 平头哥
    +关注

    关注

    0

    文章

    83

    浏览量

    10340

原文标题:小漫画带你看懂倚天云实例

文章出处:【微信号:gh_65bdec3412bd,微信公众号:平头哥半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里平头发布真武M890:144GB显存,三倍性能

    近日,阿里云峰会上,平头正式发布新一代训推一体AI芯片真武M890,内置144GB HBM显存,片间互联带宽达800GB/s,整体性能是上一代真武810E的三倍,原生支持FP32到FP4全精度,应用于阿里云磐久AL128超节
    的头像 发表于 05-27 10:17 403次阅读

    季丰电子气冷高温chuck完成技术优化

    半导体工艺测试中,温控效率直接影响测试产能与测试精度。近日,季丰气冷高温chuck完成技术优化,实现升温、降温效率的双重飞跃!
    的头像 发表于 05-19 16:56 912次阅读

    亚马逊正在公司内部大规模部署其AI产品"MeshClaw"

    近日,亚马逊(Amazon.com)正在公司内部大规模部署其AI产品"MeshClaw",允许员工创建能够接入办公软件、代替用户执行任务的AI智能体。然而,这项本应
    的头像 发表于 05-15 10:25 2181次阅读

    平头发布首款智能网卡磐脉920

    近日,在2026数字中国建设峰会上,阿里平头发布旗下首款智能网卡「磐脉920」,这是国内首个内置PCIe Switch的400G智能网卡,最大支持400Gbps吞吐带宽,可应用于万卡智算集群、通算集群和高性能存储等场景。据悉,磐脉920
    的头像 发表于 05-07 15:44 187次阅读

    阿里消息:平头发布智能网卡“磐脉920”;QoderWake发布

    平头发布首款智能网卡“磐脉920”。 千问升级图片翻译,支持119种语言“图翻图”。 QoderWake发布,Qoder移动端上线。  1;平头发布智能网卡“磐脉920” 4月28
    的头像 发表于 04-30 18:05 8576次阅读
    阿里消息:<b class='flag-5'>平头</b><b class='flag-5'>哥</b>发布智能网卡“磐脉920”;QoderWake发布

    汽车行业在阿里云使用平头真武PPU超10万卡

    4月11日,在2026智能电动汽车发展高层论坛上,阿里云智能集团公共云事业部副总裁、AI汽车行业总经理李强透露,目前已有30多家车企和智驾方案提供商在阿里云上开展智驾研发,实际使用的平头
    的头像 发表于 04-14 09:13 794次阅读

    意法半导体为超大规模AI数据中心破解供电难题

    AI大模型算力需求呈指数级飙升,兆瓦级AI机柜成为主流,传统54V低压配电系统早已触到物理极限,供电端的多重挑战正成为AI数据中心规模化发展的核心掣肘!意法半导体全新发布《面向下一代人工智能数据中心
    的头像 发表于 04-07 15:46 473次阅读
    意法<b class='flag-5'>半导体</b>为超<b class='flag-5'>大规模</b>AI数据中心破解供电难题

    实锤!比亚迪首次披露激光雷达进度,量产上车!(将全民普及)

      全球第一的新能源汽车企业比亚迪,激光雷达来了!实现量产上车!     此前,市场早已有比亚迪激光雷达的传闻,如今,比亚迪官方首
    的头像 发表于 04-01 20:07 3188次阅读
    实锤!比亚迪首次披露<b class='flag-5'>自</b><b class='flag-5'>研</b>激光雷达进度,<b class='flag-5'>已</b>量产上车!(将全民普及)

    平头镇岳510芯片累计出货量超50万片

    3月27日,在2026CFMS闪存峰会上,平头半导体宣布SSD主控芯片镇岳510累计出货量超50万,是近期国内出货量最高的主控芯片之一。目前,镇岳510已在阿里云多个核心业务
    的头像 发表于 03-31 09:07 1425次阅读

    在睿思芯科灵羽RISC-V服务器CPU实现多实例OpenClaw并发运行

    睿思芯科基于“灵羽“系列服务器CPU实测单板承载多实例OpenClaw并发运行。基于标准Linux+Docker环境并行响应不同业务需求,为企业未来的
    的头像 发表于 02-11 09:37 785次阅读
    在睿思芯科灵羽RISC-V服务器<b class='flag-5'>CPU</b>实现多<b class='flag-5'>实例</b>OpenClaw并发运行

    阿里AI芯片“真武”亮相 “通云”黄金三角浮出水面

    1月29日上午,平头官网悄然上线一款名为“真武810E”的高端AI芯片,此前被央视《新闻联播》曝光的阿里芯片PPU正式亮相。这是通义实验室、阿里云和
    的头像 发表于 01-29 09:42 814次阅读
    阿里<b class='flag-5'>自</b><b class='flag-5'>研</b>AI芯片“真武”亮相 “通云<b class='flag-5'>哥</b>”黄金三角浮出水面

    TensorRT-LLM的大规模专家并行架构设计

    之前文章介绍引入大规模 EP 的初衷,本篇将继续深入介绍 TensorRT-LLM 的大规模专家并行架构设计与创新实现。
    的头像 发表于 09-23 14:42 1522次阅读
    TensorRT-LLM的<b class='flag-5'>大规模</b>专家并行架构设计

    超800亿美元!功率半导体强势增长,理想、比亚迪SiC模块引领行业变革

    有限公司副总裁马卫清在2025中国(深圳)集成电路峰会表示。 2025年功率半导体市场有哪些机遇?全球功率半导体的头部厂商和中国厂商在占有率上有哪些变化?汽车企业SIC器件有哪些进
    的头像 发表于 06-27 00:09 1.3w次阅读
    超800亿美元!功率<b class='flag-5'>半导体</b>强势增长,理想、比亚迪<b class='flag-5'>自</b><b class='flag-5'>研</b>SiC模块引领行业变革

    平头羽阵芯片助力菜鸟打造高性价比RFID数字供应链解决方案

    6月16日,在菜鸟与平头半导体联合举办的“智启链动,芯领未来”活动上,菜鸟发布了使用平头羽阵芯片的RFID数字供应链解决方案,在提升电子
    的头像 发表于 06-17 19:19 1408次阅读
    <b class='flag-5'>平头</b><b class='flag-5'>哥</b>羽阵芯片助力菜鸟打造高性价比RFID数字供应链解决方案

    在用平头调试中,如何重新只编译k230的uboot?

    在用平头调试中,如何重新只编译k230的uboot
    发表于 06-04 07:30