Sqoop 导入

Sqoop 是一个 Hadoop 命令行工具,可将表从 RDBMS 数据源导入 HDFS,反之亦然。它生成一个 Java 类,允许我们与导入的数据进行交互。表中的每一行都保存为 HDFS 中的单独记录。记录可以存储为文本文件,也可以存储为 Avro 或序列文件的二进制表示。sqoop 有 2 个版本:

Sqoop1 和 Sqoop2

Sqoop1 是广泛接受的工具,推荐用于生产环境。在 Cloudera 的网站上找到 Sqoop1 和 Sqoop2 之间的比较。