流日誌資料

通常,大多數要分析的資料將由各種資料來源(如應用程式伺服器,社交網站,雲伺服器和企業伺服器)生成。此資料將採用日誌檔案和事件的形式。

日誌檔案 - 通常,日誌檔案是列出作業系統中發生的事件/操作的檔案。例如,Web 伺服器列出日誌檔案中對伺服器發出的每個請求。

在收集此類日誌資料時,我們可以獲得有關的資訊 -

應用程式效能和定位各種軟體和硬體故障。使用者行為並獲得更好的業務洞察力。將資料傳輸到 HDFS 系統的傳統方法是使用 put 命令。讓我們看看如何使用 put 命令。