實木複合地板

Hive 0.13.0 及更高版本中的鑲木地板柱狀儲存格式。Parquet 是從頭開始構建的,其中考慮了複雜的巢狀資料結構,並使用 Dremel 檔案中描述的記錄粉碎和組裝演算法。我們相信這種方法優於巢狀名稱空間的簡單扁平化。

Parquet 旨在支援非常有效的壓縮和編碼方案。多個專案已經證明了將正確的壓縮和編碼方案應用於資料的效能影響。Parquet 允許在每列級別指定壓縮方案,並且可以面向未來,以允許在發明和實現時新增更多編碼。

在 Cloudera 發行版中推薦使用 Impala 表的 Parquet 檔案格式。

請參閱: http//parquet.apache.org/documentation/latest/

CREATE TABLE parquet_table_name (x INT, y STRING) STORED AS PARQUET;