檢查缺失的資料

anyNA 報告是否存在任何缺失值; 而 is.na 報告元素缺失值:

vec <- c(1, 2, 3, NA, 5)

anyNA(vec)
# [1] TRUE
is.na(vec)
# [1] FALSE FALSE FALSE  TRUE FALSE

ìs.na 返回一個邏輯向量,該向量在算術運算下被強制轉換為整數值(FALSE = 0,TRUE = 1)。我們可以使用它來找出有多少缺失值:

sum(is.na(vec))
# [1] 1

擴充套件這種方法,我們可以在資料幀上使用 colSumsis.na 來計算每列的 NA:

colSums(is.na(airquality))
#   Ozone Solar.R    Wind    Temp   Month     Day 
#      37       7       0       0       0       0 

naniar 包 (目前在 GitHub 上,但不 CRAN)提供了更多的工具為探索缺失值。