Hive 中的字数计数示例

文档文件(输入文件)

玛丽有只小羊羔

它的羊毛像雪一样白

玛丽去的地方

羔羊肯定会去的。

Hive 查询

CREATE TABLE FILES (line STRING);

LOAD DATA INPATH 'docs' OVERWRITE INTO TABLE FILES;

CREATE TABLE word_counts AS
SELECT word, count(1) AS count FROM
(SELECT explode(split(line, ' ')) AS word FROM FILES) w
GROUP BY word
ORDER BY word;

在 Hive 中输出 word_counts 表

玛丽,2

有,1

一个,1

小,1

羊肉,2

其 1

摇粒绒,1

是,2

白色,1

如,1

雪,1

并且,1

无处不在,1

即,1

所到之处,1

,1

肯定的是,1

于 1

走,1