Sqoop 匯入

Sqoop 是一個 Hadoop 命令列工具,可將表從 RDBMS 資料來源匯入 HDFS,反之亦然。它生成一個 Java 類,允許我們與匯入的資料進行互動。表中的每一行都儲存為 HDFS 中的單獨記錄。記錄可以儲存為文字檔案,也可以儲存為 Avro 或序列檔案的二進位制表示。sqoop 有 2 個版本:

Sqoop1 和 Sqoop2

Sqoop1 是廣泛接受的工具,推薦用於生產環境。在 Cloudera 的網站上找到 Sqoop1 和 Sqoop2 之間的比較。