当前位置:网站首页>Sqoop【环境搭建 01】CentOS Linux release 7.5 安装配置 sqoop-1.4.7 解决警告并验证(附Sqoop1+Sqoop2最新版安装包+MySQL驱动包资源)
Sqoop【环境搭建 01】CentOS Linux release 7.5 安装配置 sqoop-1.4.7 解决警告并验证(附Sqoop1+Sqoop2最新版安装包+MySQL驱动包资源)
2022-07-26 09:40:00 【シ風】
目前 Sqoop 有 Sqoop1 和 Sqoop2 两个版本,但是截至到目前,官方并不推荐使用 Sqoop2,因为其与 Sqoop1 并不兼容,且功能还没有完善,所以这里优先推荐使用 Sqoop 1。本次安装的文件是【Sqoop1的最新版本】 sqoop-1.4.7.bin-hadoop-2.6.0.tar.gz 以下内容均以此版本进行说明。
1.资源分享
链接:https://pan.baidu.com/s/1XRZs2PngAnrMczuD7Dn7Kg
提取码:w7b9
包含资源:(Sqoop1最新版)sqoop-1.4.7.bin-hadoop-2.6.0.tar.gz 和 sqoop-1.4.7.tar.gz
(Sqoop2最新版)sqoop-1.99.7-bin-hadoop200.tar.gz 和 sqoop-1.99.7.tar.gz
2.简单介绍
Sqoop 是一个常用的数据迁移工具,主要用于在不同存储系统之间实现数据的导入与导出:
- 导入数据:从 MySQL,Oracle 等关系型数据库中导入数据到 HDFS、Hive、HBase 等分布式文件存储系统中;
- 导出数据:从分布式文件系统中导出数据到关系数据库中。
Sqoop1的原理是将执行命令转化成 MapReduce 作业来实现数据的迁移,如下图:
3.前置条件
由于 Sqoop1 是将执行命令转化成 MapReduce 作业来实现数据的迁移,所有必须安装Hadoop,我安装的是3.1.3版本的,安装教程可参考《Hadoop3.1.3单机版安装配置》
[[email protected] ~]# hadoop version
Hadoop 3.1.3
4.安装配置
# 1.解压并移动到/usr/local/sqoop/下
tar -zxvf sqoop-1.4.7.bin-hadoop-2.6.0.tar.gz
# 这里注意一下 官网下载的安装包是【bin__hadoop】我改成-了 所以解压之后是双下划线
mv sqoop-1.4.7.bin__hadoop-2.6.0/ /usr/local/sqoop/
# 2.配置环境变量:
vim /etc/profile.d/my_env.sh
# 添加
export SQOOP_HOME=/usr/local/sqoop
export PATH=$SQOOP_HOME/bin:$PATH
# 使得配置的环境变量立即生效:
# 首先是要赋权限【只操作一次就行】
chmod +x /etc/profile.d/my_env.sh
source /etc/profile.d/my_env.sh
# 验证一下
echo $SQOOP_HOME # 显示/usr/local/sqoop表示成功
# 3.sqoop配置
# 复制${SQOOP_HOME}/conf/sqoop-env-template.sh 并修改 sqoop-env.sh 配置文件
cp sqoop-env-template.sh sqoop-env.sh
vim sqoop-env.sh
# 配置中HADOOP_COMMON_HOME和HADOOP_MAPRED_HOME是必须配置的 其他的用到了再进行配置
# Set Hadoop-specific environment variables here.
#Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/usr/local/hadoop-3.1.3
#Set path to where hadoop-*-core.jar is available
export HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.3
#set the path to where bin/hbase is available
#export HBASE_HOME=
#Set the path to where bin/hive is available
#export HIVE_HOME=
#Set the path for where zookeper config dir is
#export ZOOCFGDIR=
5.拷贝数据库驱动
将 MySQL 驱动包拷贝到 Sqoop1的安装目录的 ${SQOOP_HOME}/lib/ 目录下。百度网盘 mysql-connector-java-5.1.47.jar 分享:
链接:https://pan.baidu.com/s/1X15dNrH-B-U5oxw-H6sn8A
提取码:ibaj
6.验证
由于已经将 sqoop 的 bin 目录配置到环境变量,直接使用以下命令验证是否配置成功:
[[email protected] ~]# sqoop version
Warning: /usr/local/sqoop/../hbase does not exist! HBase imports will fail.
Please set $HBASE_HOME to the root of your HBase installation.
Warning: /usr/local/sqoop/../hcatalog does not exist! HCatalog jobs will fail.
Please set $HCAT_HOME to the root of your HCatalog installation.
Warning: /usr/local/sqoop/../accumulo does not exist! Accumulo imports will fail.
Please set $ACCUMULO_HOME to the root of your Accumulo installation.
2021-09-08 16:52:22,191 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7
Sqoop 1.4.7
git commit id 2328971411f57f0cb683dfb79d19d4d19d185dd8
Compiled by maugli on Thu Dec 21 15:59:58 STD 2017
出现对应的版本信息则代表配置成功:
2021-09-08 16:52:22,191 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7
Sqoop 1.4.7
这里出现的三个 Warning 警告是因为没有配置 $HBASE_HOME、$HCAT_HOME和$ACCUMULO_HOME,如果不使用HBase、HCatalog和Accumulo,忽略即可。Sqoop在启动时会去检查环境变量中是否有配置这些软件,如果想去除这些警告,可以修改${SQOOP_HOME}/bin/configure-sqoop ,注释掉不必要的检查。
## Moved to be a runtime check in sqoop.
#if [ ! -d "${HBASE_HOME}" ]; then
# echo "Warning: $HBASE_HOME does not exist! HBase imports will fail."
# echo 'Please set $HBASE_HOME to the root of your HBase installation.'
#fi
## Moved to be a runtime check in sqoop.
#if [ ! -d "${HCAT_HOME}" ]; then
# echo "Warning: $HCAT_HOME does not exist! HCatalog jobs will fail."
# echo 'Please set $HCAT_HOME to the root of your HCatalog installation.'
#fi
#if [ ! -d "${ACCUMULO_HOME}" ]; then
# echo "Warning: $ACCUMULO_HOME does not exist! Accumulo imports will fail."
# echo 'Please set $ACCUMULO_HOME to the root of your Accumulo installation.'
#fi
再次验证,发现清爽了很多
[[email protected] ~]# sqoop version
2021-09-08 17:03:51,446 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7
Sqoop 1.4.7
git commit id 2328971411f57f0cb683dfb79d19d4d19d185dd8
Compiled by maugli on Thu Dec 21 15:59:58 STD 2017
7.总结
至此,Sqoop1安装配置成功 使用时还会遇到相当多的问题,随后会详细说明,感谢大家的支持~
边栏推荐
- 阿里云技术专家郝晨栋:云上可观测能力——问题的发现与定位实践
- 新公链Aptos何以拉满市场期待值?
- asp.net 使用redis缓存(二)
- 【信息系统项目管理师】初见高项系列精华汇总
- (2) Hand eye calibration of face scanner and manipulator (eye out of hand: nine point calibration)
- 配置ADCS后访问certsrv的问题
- Node memory overflow and V8 garbage collection mechanism
- MQTT X CLI 正式发布:强大易用的 MQTT 5.0 命令行工具
- (1) Hand eye calibration of face scanner and manipulator (eye on hand)
- SSG框架Gatsby访问数据库,并显示到页面上
猜你喜欢
配置ADCS后访问certsrv的问题
R language ggplot2 visualization: align the legend title to the middle of the legend box in ggplot2 (default left alignment, align legend title to middle of legend)
挡不住了,纯国产PC已就位,美国的软硬件体系垄断正式被破
MQTT X CLI 正式发布:强大易用的 MQTT 5.0 命令行工具
Interview shock 68: why does TCP need three handshakes?
Solve NPM -v sudden failure and no response
Drawing shadow error diagram with MATLAB
matlab simulink实现模糊pid对中央空调时延温度控制系统控制
R语言ggplot2可视化: 将图例标题(legend title)对齐到ggplot2中图例框的中间(默认左对齐、align legend title to middle of legend)
阿里云技术专家郝晨栋:云上可观测能力——问题的发现与定位实践
随机推荐
Basic knowledge of website design
matlab simulink实现模糊pid对中央空调时延温度控制系统控制
JS judge the data types object.prototype.tostring.call and typeof
添加dll
小白搞一波深拷贝 浅拷贝
Jmeter配置元件之CSV数据文件设置
IIS website configuration
2019 ICPC Asia Yinchuan Regional(水题题解)
The difference between thread join and object wait
[MySQL] understand the important architecture of MySQL (I)
Customize permission validation in blazor
Fiddler download and installation
官方颁发的SSL证书与自签名证书结合实现网站双向认证
JS one line code to obtain the maximum and minimum values of the array
Gauss elimination solves the inverse of matrix (Gauss)
“互联网+”时代的现代医学
2020-12-29
新增市场竞争激烈,中国移动被迫推出限制性超低价5G套餐
m进制数str转n进制数
解决ProxyError: Conda cannot proceed due to an error in your proxy configuration.