文本文件

TextFile 是默认文件格式,除非配置参数 hive.default.fileformat 具有不同的设置。我们可以使用分隔文本文件中的字段名称在配置单元上创建表。让我们说,例如,我们的 csv 文件包含三个字段(id, name, salary),我们想在 hive 中创建一个名为 employees 的表。我们将使用以下代码在 hive 中创建表。
CREATE TABLE employees (id int, name string, salary double) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘,’;

现在我们可以将一个文本文件加载到我们的表中:

LOAD DATA LOCAL INPATH '/home/ourcsvfile.csv' OVERWRITE INTO TABLE employees;

在 hive 上显示我们表的内容以检查数据是否已成功加载:

SELECT * FROM employees;