检查缺失的数据

anyNA 报告是否存在任何缺失值; 而 is.na 报告元素缺失值:

vec <- c(1, 2, 3, NA, 5)

anyNA(vec)
# [1] TRUE
is.na(vec)
# [1] FALSE FALSE FALSE  TRUE FALSE

ìs.na 返回一个逻辑向量,该向量在算术运算下被强制转换为整数值(FALSE = 0,TRUE = 1)。我们可以使用它来找出有多少缺失值:

sum(is.na(vec))
# [1] 1

扩展这种方法,我们可以在数据帧上使用 colSumsis.na 来计算每列的 NA:

colSums(is.na(airquality))
#   Ozone Solar.R    Wind    Temp   Month     Day 
#      37       7       0       0       0       0 

naniar 包 (目前在 GitHub 上,但不 CRAN)提供了更多的工具为探索缺失值。