大数据 Hadoop 安全性入门

1. Kerberos 是一种网络身份验证协议:

一个。优点: 在入门级别对用户进行身份验证。

湾限制: Kerberos 可防止未经授权的用户访问环境。但登录后,它不会提供详细的级别身份验证,如表,列,文件夹,文件级别等

2. Apache Sentry 是一个用于执行细粒度角色的系统

一个。优势: 应用程序级别身份验证,如 Hive,Impala,Solr 等。它可以控制特定用户/组的数据库,表,列级别的访问。

湾限制: 它无法控制在 Hive,Impala 等应用程序后面加下划线的 HDFS 文件夹。例如:存储在/user/hive/warehouse/prod.db/table1 中的 Hive 表 prod.table1。Hue 中的哨兵角色设置只能控制 Hue 中的表/列访问,但用户可以设法直接在 HDFS 中访问文件夹

C。限制: 不会控制与 Hive,Impala 等无关的 HDFS 文件夹

3.访问控制列表(ACL)是访问控制条目(ACE)的列表。ACL 中的每个 ACE 都标识受托者,并指定该受托者允许,拒绝或审核的访问权限

一个。优点: 用户可以使用文件夹级访问

4. HDFS 加密实现对从 HDFS 读取和写入的数据的透明,端到端加密

一个。优点: 加密数据将提供额外的级别安全性。一般而言,许多不同的政府,金融和监管实体都需要数据加密