资料介绍
软件简介
Taier是袋鼠云数栈大数据家族的开源项目之一 ,它是一个分布式可视化的DAG任务调度系统,旨在降低ETL开发成本、提高大数据平台稳定性,让大数据开发人员可以在Taier直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。
一、架构设计和功能详解
在架构设计与功能特点上,Taier整体架构是使用插件式的开发模式,在任务开发下面有调度模块和各项组件,也包括数栈开源家族的Chunjun等等。

(一)Taier功能特点
Taier的功能特点有下面几个比较重要的方面:
1.任务类型:Spark SQL、数据同步(流计算任务);
2.控制台:包括队列管理、资源管理、多集群管理等;
3.运维中心:比如任务管理、周期调度、补数据等;
4.插件化开发:具体包括 taier-plugin、、DatasourceX、Chunjun等几个插件。

(二)Taier功能特征
随着不断更新完善,现在的Taier已经具有以下的几种特性:
1、拓展性
-
单点故障:去中心化的分布式模式
-
高可用方式:Zookeeper
-
过载处理∶分布式节点+两级存储策略+队列机制。每个节点都可以处理任务调度与提交;任务多时会优先缓存在内存队列,超出可配置的队列最大数量值后会全部落数据库;任务处理以队列方式消费,队列异步从数据库获取可执行实例
-
实战检验:得到数百家企业客户生产环境实战检验
2、易用性
-
支持大数据作业Spark、Flink的调度;
-
支持众多的任务类型,目前支持Spark SQL、Chunjun
-
可视化工作流配置︰支持封装工作流、支持单任务运行,不必封装工作流、支持拖拽模式绘制;
-
DAG监控界面:运维中心、支持集群资源查看,了解当前集群资源的剩余情况、支持对调度队列中的任务批量停止、任务状态、任务类型、重试次数、任务运行机器、可视化变量等关键信息一目了然;
-
调度时间配置:可视化配置;
-
多集群连接:支持一套调度系统连接多套Hadoop集群。
3、多版本引擎
-
支持Spark 、Flink等引擎的多个版本共存,例如可同时支持Flink1.10、Flink1.12(后续开源)
-
Kerberos支持Spark、Flink
-
丰富,支持3种时间基准,且可以灵活设置输出格式。
4、拓展性
-
设计之处就考虑分布式模式,目前支持整体Taier 水平扩容方式;调度能力也随集群线性增长。
二、Taier重要概念
下面从原理和操作层面给大家进一步介绍Taier,还有一些具体概念的解释。

(一)任务与实例
方便起见,数栈在Taier中提出“任务”和“实例”两个概念,例如数据开发的数据同步这项工作称之为“任务”,而已经提交并且配置了周期属性的任就称之为“实例”。

(二)实例具体操作
在Taier中,实例有这几种构建的方式:
1.基于Zookeeper选举Master节点参与Job 实例构建,T+1构建JobGraph
2. JobGraph构建前check &clean DirtyData
3.依据Task、TaskTask的数据(JobGraph)生成Job .JobJob实例数据
4.Master节点控制实例数据的负载均衡持久化入数据库

构建完毕后,实例处理的几种方式如下图所示:

其中:
1.三种任务类型:周期任务、补数据任务、重跑任务,统一调度方式
2. Job 优先入队列(1),队列容量不足入DB (2)
3.当队列容量空余时,异步线程从DB加载数据入队列(3)
4. Job出队列后进行任务提交
处理完成后,实例提交我们也做了思考,具体设计:
1.内存优先级队列,控制Job有序执行
2.多线程并发提交(可配置)
3. Job 执行超时判断(可配置)
4. Job资源不足/失败重试进入延迟队列(可配置)﹔避免长时间占用提交权

Taier 的实例状态大家主要应该关注标志停止的几个,具体有下面几种:
1. WaitEngine:内存队列中的Job、内存容量不足存储在DB中的Job(默认500 )
2. Lacking:资源不足暂时等待的Job(默认2min)
3. Restarting:失败重试的Job(默认2min )
4. Finshed、Failed、Canceled、Killed:结束状态

Taier的整个控制台设计分为公共组件、调度组件、存储组件和计划组件。通过一个租户ID,拿到这个集群下common, YARN-conf等的四个配置信息,组成包含一个任务插件所有信息的pluginlnfo。将它解析之后,一些资源初始化上传,以便我们缓存对应的客户端。

Taier Client Plugin这里,要快速开发一个插件要注意以下几点:
-
一种任务类型对应一个插件,即一个jar包
-
SPI: 在classpath 下的META-INF/services/目录下,创建以接口IClient 全限定名命名的文件,内容是上一步中实现类的全限定名

- 基于Simulink的电子对抗分布式仿真系统 26次下载
- 异构环境下的多DAG任务调度算法综述 13次下载
- 面向联邦学习的分布式与隐私安全性综述 3次下载
- 一种分布式网络扫描架构和任务调度算法 19次下载
- 如何通过YARN设计分布式资源动态调度协同分配系统 12次下载
- 如何设计液压式双足机器人运动数据可视化系统 6次下载
- 分布式智能电网控制系统的设计与实现 2次下载
- 电力系统分布式经济调度 10次下载
- SCADA过程可视化系统用户手册 2次下载
- 分布式系统进程调度方法研究
- 基于GIS的配电网调度可视化研究 16次下载
- 三层分布式计算网格任务调度系统 25次下载
- 基于Multi-Agent的分布式测控系统任务调度算法
- 基于实数编码免疫算法的分布式任务调度
- 基于扩展的随机DAG的EST估算与任务调度
- 分布式SCADA系统的特点的组成 581次阅读
- 任务调度系统设计的核心逻辑 935次阅读
- 讯维分布式可视化控制系统的功能特点 500次阅读
- Java手写分布式锁的实现 612次阅读
- tldb提供分布式锁使用方法 923次阅读
- 讯维分布式智慧指挥系统有哪些“黑科技”? 633次阅读
- 如何使用分布式存储系统促进AI模型训练 608次阅读
- 利用NI VeriStand 2010实现分布式同步系统的设计 3437次阅读
- 详谈分布式系统的定义及属性 3897次阅读
- 关于腾讯的开源分布式存储系统DCache 2028次阅读
- 分布式可视化管理系统的关键技术到底有哪些呢?详细资料分析 7147次阅读
- 存储分布式系统中如何从CAP转到PACELC 2780次阅读
- AS:可视化的调试工具--FreeRTOS+Trace 6896次阅读
- 深度解读分布式存储技术之分布式剪枝系统 1861次阅读
- 基于CAN总线的分布式网架健康状态监测系统的设计 1027次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
电子发烧友App






创作
发文章
发帖
提问
发资料
发视频
上传资料赚积分
评论