文章目录 一、部署环境二、搭建步骤1、Linux下JDK环境搭建2、各服务器之间开启SSH免密登录3、查看所需端口是否被占用4、Linux下Kettle安装5、测试Kettle是否安装成功6、
环境:
jdk 1.8
Centos7
Kettle 8.2.0
Kettle组件:
Spoon:图形化工具,用于快速设计和维护复杂的ETL工作流。
Kitchen:运行作业的命令行工具。
Pan:运行转换的命令行工具。
Carte:轻量级的(大概1MB)WEB服务器,用来远程执行转换或作业,一个运行有Carte进程的机器可以作为从服务器,从服务器是Kettle集群的一部分。
dateyum -y install ntp ntpdate -u cn.pool.ntp.org
检查是否已安装SSH服务
ssh
没有则安装
输入sudo apt-get update
命令以实现更新ubuntu系统
输入sudo apt-get install openssh-server
命令以安装ssh
检查是否启动SSH服务
service --status-all | grep ssh
启动ssh服务
sudo service sshd start
在主机A上生成rsa密钥对
ssh-keygen -t rsa
三次回车后会在root目录下生成“.ssh”文件夹,里面会有两个文件,分别是id_rsa和id_rsa.pub
id_rsa:是本机的私钥,在使用ssh协议向其它主机传输数据前,主机会使用该私钥对数据进行加密
id_rsa.pub:是本机的公钥,因为ssh协议采用非对称加密法(公钥可以用来解密使用私钥进行加密的数据,同样,私钥也可以用来解密公钥进行加密的数据),所以主机一般将该公钥放到其它需要远程登录到的主机的ssh服务器中
将主机A上生成的公钥传到主机B中
一是使用命令:
在主机A的命令行上执行,就可以将主机A上生成的公钥传到主机B中。
ssh-copy-id 主机B用户名@主机Bip
二是手动操作:
首先在主机A上执行命令
scp .ssh/id_rsa.pub 主机B用户名@主机Bip:~/home
命令执行成功后会将主机A的公钥传到主机B的家目录里。
切换到主机B,命令行执行
cat ~/home/id_rsa.pub >> ~/.ssh/authorized_keys
将主机A的公钥添加到主机B的授权列表中。
免密登录
systemctl restart sshd
ssh 用户名@ip
,你会发现已经免密登录了。netstat -ntlp //查看当前所有tcp端口netstat -ntulp | grep 80 //查看所有80端口使用情况
jps命令失效,进行安装
yum install java-1.8.0-openjdk-devel.x86_64
官网下载后将压缩包传入服务器中进行解压
unzip xxxx
cd data-integration./kitchen.sh
报错信息如下:
#######################################################################WARNING: no libwebkitgtk-1.0 detected, some features will be unavailable Consider installing the package with apt-get or yum. e.g. 'sudo apt-get install libwebkitgtk-1.0-0'#######################################################################
解决方法:
wget ftp://ftp.pbone.net/mirror/ftp5.gwdg.de/pub/opensuse/repositories/home:/matthewdva:/build:/EPEL:/el7/RHEL_7/x86_64/webkitgtk-2.4.9-1.el7.x86_64.rpm
yum install webkitgtk-2.4.9-1.el7.x86_64.rpm
Carte的配置文件所在路径:/kettlle/data-integration/pwd
在该目录下含有6个文件
一个主服务器配置文件
carte-config-master-8080.xml
四个从服务器配置文件
carte-config-8081.xml、carte-config-8082.xml
carte-config-8083.xml、carte-config-8084.xml
一个集群账号密码文件kettle.pwd(密码可以修改)
主服务器(carte-config-master-8080.xml)的配置内容为:
master1</name> localhost</hostname> 8080</port> Y</master> </slaveserver>
name:指定Kettle主服务器名称
hostname:指定Kettle主服务器IP地址
port:指定Kettle主服务器端口号
master:指定是否是主服务器
伪分布式环境不需要配置该文件。
子服务器(carte-config-8081.xml)的配置内容为:
其中masters中,name、hostname、port需要和carte-config-master-8080.xml中完全一致
master1</name> master</hostname> 8080</port> cluster</username> cluster</password> Y</master> </slaveserver></masters> Y</report_to_masters> slave1-8081</name> slave1</hostname> 8082</port> cluster</username> cluster</password> N</master> </slaveserver>
其他从服务器依据以上配置,把主服务器中更改好的pwd文件夹分别覆盖其他服务器上的相应文件夹。
拷贝文件至目标主机ip
scp -rp 待拷贝文件 用户名@目标主机ip:目标主机文件夹
从目标主机拷贝文件至本机
scp -rp 用户名@目标主机ip:目标主机待拷贝文件 拷贝至本机的文件夹
启动主服务器
./carte.sh ip port
主服务器保持后台运行并将日志写入自定义文件
nohup /opt/Kettle/data-integration/./carte.sh 192.168.1.132 9090/opt/Kettle/data-integration/logs/out.log 2>&1 &
启动从服务器
./carte.sh pwd/carte-config-8081.xml
从服务器保持后台运行并将日志写入自定义文件
nohup /opt/Kettle/data-integration/./carte.sh /opt/Kettle/data-integration/pwd/carte-config-9091.xml >/opt/Kettle/data-integration/logs/out.log 2>&1 &
服务开启成功
浏览器访问
ip:port
账号密码默认
cluster
主从服务Web登录如下:
在本地打开kettle的图形化界面,新建一个test转换
在‘“转换”中选择“子服务器”,右键点击“新建”,在弹出对话框中把主从的服务器信息填入
在主对象树中,选择“Kettle集群schmas”,右键点击“新建”,在弹出对话框中把主从的服务器信息填入,然后点击“选择子服务器”,添加刚才新建的子服务器,然后确定。
在输出中右键选择“集群”,选择自己创建的“Schema”集群,点击“确定”
在“Run Configurations”中右键点击“新建”,填写如下参数
点击“运行”,选择自己创建的“测试集群”,最后点击“启动”即可
至此Kettle集群服务搭建完成。
kettle自带调度运行会造成资源占用且不释放,最好使用windows或者liunx自带调度或者第三方调度服务
2、集群只能在图形化界面使用,如使用命令行运行作业或者转换都为单节点运行
--结束END--
本文标题: Liunx中部署Kettle集群
本文链接: https://lsjlt.com/news/418306.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
2024-10-22
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0