基于Kubernetes部署
部署
请按照以下步骤,完成基于Kubernetes的PowerJob组件部署
| |
|
创建PowerJob组件的流程页面一共分为四个步骤:
- PowerJob Server相关配置定义
- PowerJob Worker相关配置定义
- PowerJob 任务模版定义
- 配置确认
PowerJob Server相关配置定义, 需要配置的信息分为两部分: 第一部分,基本配置,主要有以下几项:
配置PowerJob Server启动需要Kubernetes的资源,多少个Pod?需要多少CPU?、多少内存等 | 点击k8sImage 右侧下拉列表中的添加,打开PowerJob Docker Images配置页面 点击k8sCfg右侧下拉列表中的添加,打开添加k8s引用配置页面 以上对话框表单中Yaml配置内容,需要从之前申请阿里云ACK的连接信息中拷贝而来 |
PowerJob Server相关配置定义, 需要配置的信息分为两部分: 第一部分,基本配置,主要有以下几项:
第二部分,占用Kubernetes资源(内存/CPU): 配置PowerJob Worker启动需要Kubernetes的资源,多少个Pod?(设置多个Pod会提高TIS 数据同步的并行性,增加数据同步的吞吐)需要多少CPU?、多少内存等 | |
PowerJob 任务模版相关:
| |
| |
由于TIS在Kubernetes中需要将Kubernetes容器中将PowerJob的Server和Worker拉起,设计到多个资源如RelicaSet和Service的创建,且各资源之间 是有依赖关系。 在TIS中对各资源的启动进行编排,整个拉起过程需要耗费一点时间,可以通过控制台清晰看到启动步骤和容器内部执行日志。 | |
成功拉起PowerJob后,点击关闭启动进度对话框,便自动跳转到PowerJob维护页面 通过该功能页面,用户可以查看及控制PowerJob生命周期相关操作。例如:如右图,用户可以在PowerJob运行期,动态添加或者减少 Worker数量,达到调节批量数据同步吞吐率的效果。 另外,通过点击日志Tab查看PowerJob中Server及Worker相关Pod的实时日志,等。 |
触发批量数据同步
成功拉起PowerJob服务之后,再次回到批量数据同步页面
发现上方的一行警告提醒已经消失,变成一个 分布式执行 的Tag图标,和一个 编辑 按钮,此时点击右侧的触发构建按钮可以触发批量数据同步, 此时任务是由PowerJob接管。
接下来,可进入PowerJob查看对应执行任务实例:
稍等片刻,批量数据同步任务执行完成,可点击右上方分布式执行按钮 | |
在控制面板中点击控制台链接进入PowerJob系统 | |
登录PowerJob系统,点击工作流实例发现增加了一条新的实例记录。 说明TIS触发的批量数据同步任务确实是由PowerJob接管执行的。 |
设置定时任务
执行批量执行任务,往往需要设置定时自动触发,通过PowerJob定时任务可实现此功能。
点击页面左上方编辑按钮,在表达式输入项中输入crontab表达式,点击保存按钮,定时任务就已经生效了,等到crontab设定的时间就会自动触发执行。