HDFS - Hadoop 分散式檔案系統

Hadoop 分散式檔案系統(HDFS)是一個基於 Java 的檔案系統,提供可擴充套件且可靠的資料儲存,旨在跨越大型商用伺服器叢集。HDFS,MapReduce 和 YARN 構成了 Apache™Hadoop®的核心。

HDFS 旨在實現高度容錯,這是通過在多個節點上儲存給定資料塊的多個副本(預設為 3 個)來實現的。