HDFS - Hadoop 分布式文件系统

Hadoop 分布式文件系统(HDFS)是一个基于 Java 的文件系统,提供可扩展且可靠的数据存储,旨在跨越大型商用服务器集群。HDFS,MapReduce 和 YARN 构成了 Apache™Hadoop®的核心。

HDFS 旨在实现高度容错,这是通过在多个节点上保存给定数据块的多个副本(默认为 3 个)来实现的。