DolphinScheduler 是一个分布式去中心化,易扩展的可视化 DAG 工作流任务调度系统。本文主要介绍 DolphinScheduler 的基本使用,文中使用到的软件及版本:Java 1.8.0_181、DolphinScheduler 1.3.6、MySQL 5.7、Zookeeper 3.6.3、Centos 7.6。
1、DolphinScheduler 简介
1.1、DolphinScheduler 特性
A、高可靠性 去中心化的多 Master 和多 Worker, 自身支持 HA 功能, 采用任务队列来避免过载,不会造成机器卡死
B、简单易用 DAG 监控界面,所有流程定义都是可视化,通过拖拽任务完成定制 DAG,通过 API 方式与第三方系统集成, 一键部署
C、丰富的使用场景 支持暂停恢复操作. 支持多租户,更好的应对大数据的使用场景. 支持更多的任务类型,如:Spark, Hive, M/R, Python, Sub_process, Shell
D、高扩展性 支持自定义任务类型,调度器使用分布式调度,调度能力随集群线性增长,Master 和 Worker 支持动态上下线
1.2、DolphinScheduler 架构
1.3、DolphinScheduler 流程启动活动图
更多详细的介绍可参考官网:https://dolphinscheduler.apache.org/zh-cn/
2、DolphinScheduler 安装
2.1、单机安装
2.1.1、基础软件安装
a、PostgreSQL (8.2.15+) or MySQL (5.7系列) : 两者任选其一即可, 如MySQL则需要JDBC Driver 5.1.47+
b、JDK (1.8+) : 必装,安装好后需配置 JAVA_HOME 及 PATH 变量
c、ZooKeeper (3.4.6+) :必装
d、Hadoop (2.6+) or MinIO :选装, 如果需要用到资源上传功能,针对单机可以选择本地文件目录作为上传文件夹(此操作不需要部署Hadoop);当然也可以选择上传到Hadoop or MinIO集群上
2.1.2、下载安装包并解压
https://dolphinscheduler.apache.org/zh-cn/download/download.html
tar zxvf apache-dolphinscheduler-1.3.6-bin.tar.gz
2.1.3、创建部署用户并赋予目录操作权限
useradd dolphinscheduler;# 添加密码echo "dolphinscheduler" | passwd --stdin dolphinscheduler# 配置sudo免密sed -i '$adolphinscheduler ALL=(ALL) NOPASSWD: NOPASSWD: ALL' /etc/sudoerssed -i 's/Defaults requirett/#Defaults requirett/g' /etc/sudoers# 修改目录权限chown -R dolphinscheduler:dolphinscheduler apache-dolphinscheduler-1.3.6-bin
2.1.4、ssh 免密配置
su dolphinschedulerssh-keygen -t rsa -P '' -f ~/.ssh/id_rsacat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keyschmod 600 ~/.ssh/authorized_keys
2.1.5、修改数据库信息
vi conf/datasource.properties
如果选择 MySQL,需要把 MySQL 的 JDBC 驱动放到 lib 目录下
spring.datasource.driver-class-name=com.mysql.jdbc.Driverspring.datasource.url=jdbc:mysql://10.49.196.49:3306/dolphinscheduler?characterEncoding=UTF-8&allowMultiQueries=truespring.datasource.username=adminspring.datasource.password=Root_123!
2.1.6、修改运行参数
a、修改 conf/env/dolphinscheduler_env.sh
中环境变量;JAVA_HOME 和 PATH 是必须要配置的,没有用到的可以忽略或者注释掉
export HADOOP_HOME=/opt/soft/hadoopexport HADOOP_CONF_DIR=/opt/soft/hadoop/etc/hadoopexport SPARK_HOME1=/opt/soft/spark1export SPARK_HOME2=/opt/soft/spark2export PYTHON_HOME=/opt/soft/pythonexport JAVA_HOME=/home/hadoop/app/jdk1.8.0_221/bin/javaexport HIVE_HOME=/opt/soft/hiveexport FLINK_HOME=/opt/soft/flinkexport DATAX_HOME=/opt/soft/dataxexport PATH=$HADOOP_HOME/bin:$SPARK_HOME1/bin:$SPARK_HOME2/bin:$PYTHON_HOME:$JAVA_HOME/bin:$HIVE_HOME/bin:$FLINK_HOME/bin:$DATAX_HOME/bin:$PATH
b、将 jdk 软链到 /usr/bin/java下
sudo ln -s /home/hadoop/app/jdk1.8.0_221/bin/java /usr/bin/java
c、修改一键部署配置文件 conf/config/install_config.conf 中的各参数
dbtype="mysql"dbhost="10.49.196.49:3306"username="admin"password="Root_123!"zkQuorum="10.49.196.11:2181"#安装目录installPath="/home/dolphinscheduler/dolphinscheduler-1.3.6"#部署用户deployUser="dolphinscheduler"# 业务用到的比如sql等资源文件上传到哪里,可以设置:HDFS,S3,NONE,单机如果想使用本地文件系统,请配置为HDFS,因为HDFS支持本地文件系统;如果不需要资源上传功能请选择NONE。强调一点:使用本地文件系统不需要部署hadoopresourceStorageType="HDFS"#这里以保存到本地文件系统为例#如果想上传到HDFS的话,NameNode启用了HA,则需要将hadoop的配置文件core-site.#defaultFS="hdfs://mycluster:8020"defaultFS="file:///home/dolphinscheduler/data"# 资源上传根路径,支持HDFS和S3,由于hdfs支持本地文件系统,需要确保本地文件夹存在且有读写权限resourceUploadPath="/home/dolphinscheduler/data"ips="localhost"masters="localhost"workers="localhost:default"alertServer="localhost"apiServers="localhost"
d、一键部署
install.sh
脚本完成后,会启动以下5个服务:
MasterServer ----- master服务WorkerServer ----- worker服务LoggerServer ----- logger服务ApiApplicationServer ----- api服务AlertServer ----- alert服务
e、启停服务
进入到安装目录,可以启停个服务。
启停所有服务
./bin/stop-all.sh./bin/start-all.sh
启停 Master
./bin/dolphinscheduler-daemon.sh start master-server./bin/dolphinscheduler-daemon.sh stop master-server
启停 Worker
./bin/dolphinscheduler-daemon.sh start worker-server./bin/dolphinscheduler-daemon.sh stop worker-server
启停 Api
./bin/dolphinscheduler-daemon.sh start api-server./bin/dolphinscheduler-daemon.sh stop api-server
启停 Logger
./bin/dolphinscheduler-daemon.sh start logger-server./bin/dolphinscheduler-daemon.sh stop logger-server
启停 Alert
./bin/dolphinscheduler-daemon.sh start alert-server./bin/dolphinscheduler-daemon.sh stop alert-server
2.2、集群安装
集群安装和单机安装大部分都是一样的,具体可参考官网文档,这里就不说明了。
3、DolphinScheduler 使用
进入控制台 "工作流实例","任务实例"可以查看任务执行的日志。 详细的使用说明可参考官网文档:https://dolphinscheduler.apache.org/zh-cn/docs/latest/user_doc/system-manual.html。 原文转载:http://www.shaoqun.com/a/785249.html skyee:https://www.ikjzd.com/w/290 瀚霖:https://www.ikjzd.com/w/2345 百思买:https://www.ikjzd.com/w/394 promoted:https://www.ikjzd.com/w/971
DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度系统。本文主要介绍DolphinScheduler的基本使用,文中使用到的软件及版本:Java1.8.0_181、DolphinScheduler1.3.6、MySQL5.7、Zookeeper3.6.3、Centos7.6。1、DolphinScheduler简介1.1、DolphinScheduler特性A
Groupon:https://www.ikjzd.com/w/222
Buffer:https://www.ikjzd.com/w/383
CCEE:https://www.ikjzd.com/w/1530
Payssion跨境支付:https://www.ikjzd.com/w/1564
毕昌义:https://www.ikjzd.com/w/1829
Moat:https://www.ikjzd.com/w/2391
名人堂是什么:https://www.ikjzd.com/w/1082
我的上司说喜欢我 口述和经理日久生情的过程:http://lady.shaoqun.com/m/a/270173.html
口述:我让闺蜜色诱老公她假戏真做:http://lady.shaoqun.com/m/a/273526.html
寂寞漂亮少妇与农民工在电梯里(5/5):http://lady.shaoqun.com/a/46563.html
困惑:老公为何要玩充气娃娃:http://lady.shaoqun.com/a/272874.html
网络情人让我难以忘怀 口述我和情人的那些过往:http://lady.shaoqun.com/a/270039.html
口述:我把老公逼得离家出走了咋办:http://www.30bags.com/a/254187.html
口述:我恨没有外遇的老公:http://www.30bags.com/a/252948.html
午夜我任由小偷劫财又劫色:http://www.30bags.com/m/a/252369.html
香艳教师偷情男学生 他如猛兽一般攻势不断:http://www.30bags.com/m/a/254714.html
丁字裤的诱惑,干的邻家少妇嗯,,,啊:http://www.30bags.com/m/a/255230.html
No comments:
Post a Comment