什麼是 Pig

Pig 提供了一個在 Hadoop 上並行執行資料流的引擎。它包括一種用於表達這些資料流的語言 Pig Latin。Pig Latin 包含許多傳統資料操作(連線,排序,過濾等)的運算子,以及使用者開發自己的讀取,處理和寫入資料的功能。Pig 是一個 Apache 開源專案。這意味著使用者可以自由下載它作為源或二進位制檔案,自己使用它,為它做貢獻,並根據 Apache 許可條款 - 在產品中使用它並根據需要進行更改。