0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里巴巴再度开放一份计算机集群的真实数据集(Alibaba Cluster Data V2018)

vsUE_AI_Career 来源:lq 2018-12-25 16:31 次阅读

阿里妹导读:打开一篇篇 IT 技术文章,你总能够看到“大规模”、“海量请求”这些字眼。这些功能强大的互联网应用,都运行在大规模数据中心上。数据中心每个机器的运行情况如何?运行着什么样的应用?应用有什么特点?除了少数资深从业者之外,普通学生和企业的研究者很难了解其中细节。

今天,阿里巴巴再度开放一份计算机集群的真实数据集(Alibaba Cluster Data V2018)。该数据集中记录了某个生产集群中服务器以及运行任务的详细情况。我们希望这波数据的发布可以拉近我们与学术研究、业界同行之间的距离,推动产业的进一步发展。

下面,阿里系统软件事业部的技术专家临石,为大家深入介绍这份独特的数据集。

2015 年,我们尝试在阿里巴巴的数据中心,将延迟不敏感的批量离线计算任务和延迟敏感的在线服务部署到同一批机器上运行,让在线服务用不完的资源充分被离线使用以提高机器的整体利用率。

经过 3 年多的试验论证、架构调整和资源隔离优化,目前这个方案已经走向大规模生产。我们通过混部技术将集群平均资源利用率从 10% 大幅度提高到 45%。另外,通过各种优化手段,可以让更多任务运行在数据中心,将“双11”平均每万笔交易成本下降了 17%。

那么,实施了一系列优化手段之后的计算机集群究竟是什么样子?混部的情况究竟如何?

为了让有兴趣的学生以及相关研究人员,可以从数据上更加深入地理解大规模数据中心,我们特别发布了这份数据集(Alibaba Cluster Data V2018)。数据集中记录了某个生产集群中服务器以及运行任务的详细情况。我们希望这波数据的发布可以拉近我们与学术研究、业界同行之间的距离。

在数据集中,你可以详细了解到我们是如何通过混部把资源利用率提高到 45%;我们每天到底运行了多少任务;以及业务的资源需求有什么特点。如何使用这份数据集,完全取决于你的需要。

这个数据可以做什么?

这份 Alibaba Cluster Data V2018 包含 6 个文件,压缩后大小近 50GB(压缩前270+GB),里面包含了 4000 台服务器、相应的在线应用容器和离线计算任务长达 8 天的运行情况。

通过这份数据,你可以:

了解当代先进数据中心的服务器以及任务运行特点;

试验你的调度、运筹等各种任务管理和集群优化方面的各种算法并撰写论文;

利用这份数据学习如何进行数据分析,揭示更多我们自己都未曾发现的规律。

上面这几点,没有接触过类似数据的朋友,可能对于这份数据的用处并没有直观的印象,下面我举几个简单的例子:

电商业务在白天和晚上面临的压力不同,我们如何在业务存在波峰波谷的情况下提高整体资源利用率?

你知道我们最长的 DAG 有多少依赖吗?

一个典型的容器存在时间是多久?

一个计算型任务的典型存在时间是多少?一个 Task 的多个 Instance 理论上彼此很相似,但是它们运行的时间都一样吗?

实际上,学者们甚至可以用这些数据作出更加精彩的分析。2017年,我们开放的第一波数据(Alibaba Cluster Data V2017),已经产生了多篇优秀的学术成果。

以下是学者们在论文中引用数据(Alibaba Cluster Data V2017)的例子,其中不乏被 OSDI 这样顶级学术会议收录的优秀文章。我们期待,未来你也能与我们共同分享你用这份数据产生的成果!

"LegoOS: A Disseminated, Distributed OS for Hardware Resource Disaggregation, Yizhou Shan, Yutong Huang, Yilun Chen, and Yiying Zhang, Purdue University. OSDI'18"(Best paper award!)

"Imbalance in the Cloud: an Analysis on Alibaba Cluster Trace, Chengzhi Lu et al. BIGDATA 2017"

"CharacterizingCo-located Datacenter Workloads: An Alibaba Case Study, Yue Cheng, Zheng Chai,Ali Anwar. APSys2018"

"The Elasticity and Plasticity in Semi-Containerized Co-locating Cloud Workload: aView from Alibaba Trace, Qixiao Liu and Zhibin Yu. SoCC2018"

Cluster Data V2018 更出色

新版本 V2018 与 V2017 存在两个最大的区别:

DAG 信息加入

我们加入了离线任务的 DAG 任务信息,据了解,这是目前来自实际生产环境最大的 DAG 数据。

究竟什么是 DAG?离线计算任务,例如 Map Reduce、Hadoop、Spark、Flink 中常用的任务,都是以有向无环图(Directed Acyclic Graph,DAG)的形式进行编排的,其中涉及到任务之间的并行、依赖等方面。下面是一个 DAG 的例子。

规模更大

上一版数据包含了约 1300 台机器在约 24 小时的内容数据,而新版 Cluster Data V2018 中包括了 4000 台机器 8 天的数据。

我们建立了一个关于Cluster Data V2018的交流钉钉群。使用钉钉搜索群号:23112775,即可加入。点击文末“阅读原文”,可填写调查问卷。

想看到更多数据?我们长期招收研究型实习生,与我们一起发现问题、解决问题,挑战世界级技术问题,欢迎投递简历:haiyang.dhy@alibaba-inc.com

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8105

    浏览量

    82485
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1571

    浏览量

    46431
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24347

原文标题:阿里重磅开源!4000台服务器真实数据集,揭秘世界级数据中心

文章出处:【微信号:AI_Career,微信公众号:人工智能见闻】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    阿里巴巴减持小鹏汽车股份至9.24%

    据美东时间 3 月 20 日披露,小鹏汽车于美国证券交易委员会文件中透露,阿里巴巴旗下淘系平台淘宝中国控股有限公司(Taobao China Holding Limited)正计划出售 3300 万份小鹏汽车 ADS,市值约为 3.14 亿美元(约合人民币 22.61 亿元)。
    的头像 发表于 03-21 10:45 313次阅读

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    话对我触动很大:量子计算机不仅能解决身边的问题,还能解决社会层面的重大课题。 看来真是“天下武功,唯快不破”,只要处理速度足够快,海量数据处理就像计算1+1样简单,可以想象
    发表于 03-05 17:37

    阿里巴巴推出全新AI图生视频模型EMO

    近日,阿里巴巴集团智能计算研究院宣布推出了一款革命性的AI图片-音频-视频模型技术——EMO。据官方介绍,EMO是一种先进的音频驱动肖像视频生成框架,能够将静态照片转化为生动逼真的动态视频,并且能够随着任意音频文件“说话”或“唱歌”。
    的头像 发表于 03-05 11:00 572次阅读

    阿里巴巴重返中国顶级电商轨道

    阿里巴巴集团董事会主席蔡崇信近日宣布,经过一系列架构重组和管理层变动后,阿里巴巴已成功重返中国顶级电商轨道。蔡崇信在讲话中强调,公司正在逐步调整战略,重新定位其在电商领域的领导地位。
    的头像 发表于 02-27 14:29 503次阅读

    阿里巴巴涨超3% 财报或超预期

    阿里巴巴涨超3% 今日港股开盘后阿里巴巴涨超3%,恒生科技表现也很亮眼。快手、比亚迪电子、联想集团等多股上涨。 阿里巴巴将于2月7日发布2024财年第三季度财报,业界分析会超预期。
    的头像 发表于 02-06 16:05 1211次阅读

    阿里巴巴推出自主多模态AI代理MobileAgent

    阿里巴巴最近推出了一款名为MobileAgent的自主多模态AI代理,这款产品模拟人类操作手机,并采用纯视觉解决方案,无需任何系统代码。
    的头像 发表于 02-04 10:34 503次阅读

    量子计算机开放使用,何时可谈替代

    电子发烧友网报道(文/周凯扬)1月6日,中国第三代自主超导量子计算机“本源悟空”正式上线运行,并开始向全球用户限时免费开放,接受来自全球的量子计算任务,且上线短时间后就受到了大量计算
    的头像 发表于 01-29 07:06 2712次阅读
    量子<b class='flag-5'>计算机</b><b class='flag-5'>开放</b>使用,何时可谈替代

    软银子公司确认减持阿里 阿里巴巴最大股东易主

    ;也放弃了保留股份的选择权,因此Skybridge实际上算是已经完成了阿里巴巴股份的减持。但是在结算过程中相关各方没有在市场上买卖任何阿里巴巴新股。 目前最新的消息显示,根据披露的数据来看,马云与蔡崇信近期加大力度在增持
    的头像 发表于 01-26 20:45 1532次阅读

    软银已完成减持阿里巴巴股份

    近日,软银集团全资子公司Skybridge LLC宣布,已完成对阿里巴巴股份的减持。这一决定是在经过深思熟虑后作出的,旨在优化公司的财务结构和未来的投资策略。
    的头像 发表于 01-26 15:58 449次阅读

    马云大幅增持阿里股票 马云取代软银成为阿里巴巴最大股东

    数量已超过软银的持股比例。 根据证券备案文件数据显示,马云在23年四季度购买了价值5000万美元的香港上市股票,而且蔡崇信也是大手笔加仓,在去年第四季度通过其Blue Pool Management家族投资工具购买了价值约1.51亿美元的阿里巴巴
    的头像 发表于 01-24 18:55 722次阅读

    镭神智能入选阿里巴巴诸神之战2023年度智能制造赛道之星

    近日,阿里云发布《Create@阿里巴巴诸神之战2023年度新势力榜单》,镭神智能入选Create@阿里巴巴诸神之战2023年度智能制造赛道之星。据悉,2023年,Create@阿里巴巴
    的头像 发表于 01-20 08:23 193次阅读
    镭神智能入选<b class='flag-5'>阿里巴巴</b>诸神之战2023年度智能制造赛道之星

    深夜,阿里巴巴“出售”小鹏?

    对此,阿里巴巴集团相关负责人表示,“我们根据自身的资本管理目标,出售了所持的部分小鹏股份。小鹏是中国电动汽车领域的领军者之一,我们已与其建立了战略合作关系。我们相信小鹏的前景,期待与该公司的持续合作。”
    的头像 发表于 12-18 16:31 318次阅读

    2023云栖大会 阿里巴巴要打造AI时代最开放的云

    2023云栖大会 阿里巴巴要打造AI时代最开放的云 2023杭州·云栖大会以“计算,为了无法计算的价值”为主题开启。2023云栖大会昨天开幕,阿里巴
    的头像 发表于 11-01 17:42 778次阅读

    工业计算机的应用

    工业计算机在半导体设备上的应用,具体在哪方面。比如说图像处理使用什么样的计算机,工业控制使用哪方面的计算机
    发表于 09-12 14:19

    计算机组成与设计:硬件/软件接口 risc-v版 Computer Organization and Design The Hardware/Software Interface: RISC-V Edition

    组成原理的学生阅读的入门教材。 RISC-V版,围绕RISC-V指令架构,主要讲授计算机系统的硬件组成及主要功能子系统的原理和逻辑设计,有助于提高对
    发表于 06-15 18:15