將 RDBMS 表匯入 HDFS

sqoop import \
--connect <rdbms-jdbc-url> \
--username <username> \
--password <password> \
--table <table-name>

Mysql 示例:

sqoop import \
--connect jdbc:mysql://mysql.example.com/testdb \
--username root \
--password root \
--table employees

將在主目錄下的 employees 目錄下建立包含匯入資料的 CSV 檔案。

檢查使用命令:

hadoop fs -cat <hdfs-home-dir>/employees/part-m-* 

匯入 HDFS 中的特定目錄

sqoop import \
--connect jdbc:mysql://mysql.example.com/testdb \
--username root \
--password root \
--table emplyoees \
--target-dir /dev/data/employees

這將在/dev/data/employees 目錄下生成 CSV 檔案。

為 Sqoop 作業指定父 HDFS 目錄

sqoop import \
--connect jdbc:mysql://mysql.example.com/testdb \
--username root \
--password root \
--table emplyoees \
--warehouse-dir /dev/warehouse/

上面命令中的 --warehouse-dir 標籤會將你的主目錄更改為/dev/warehouse/