什么是 Pig

Pig 提供了一个在 Hadoop 上并行执行数据流的引擎。它包括一种用于表达这些数据流的语言 Pig Latin。Pig Latin 包含许多传统数据操作(连接,排序,过滤等)的运算符,以及用户开发自己的读取,处理和写入数据的功能。Pig 是一个 Apache 开源项目。这意味着用户可以自由下载它作为源或二进制文件,自己使用它,为它做贡献,并根据 Apache 许可条款 - 在产品中使用它并根据需要进行更改。