刪除具有大量 NA 的要素

如果某個功能在很大程度上缺少資料,那麼它很適合刪除:

library(VIM)
data(sleep)
colMeans(is.na(sleep))

   BodyWgt   BrainWgt       NonD      Dream      Sleep       Span       Gest 
0.00000000 0.00000000 0.22580645 0.19354839 0.06451613 0.06451613 0.06451613 
      Pred        Exp     Danger 
0.00000000 0.00000000 0.00000000 

在這種情況下,我們可能想要刪除 NonD 和 Dream,每個都有大約 20%的缺失值(你的截止值可能會有所不同)