過濾掉缺少資料的行(NaN 無 NaT)
如果你有一個缺少資料的資料框(NaN
,pd.NaT
,None
),你可以過濾掉不完整的行
df = pd.DataFrame([[0,1,2,3],
[None,5,None,pd.NaT],
[8,None,10,None],
[11,12,13,pd.NaT]],columns=list('ABCD'))
df
# Output:
# A B C D
# 0 0 1 2 3
# 1 NaN 5 NaN NaT
# 2 8 NaN 10 None
# 3 11 12 13 NaT
DataFrame.dropna
刪除包含至少一個缺少資料的欄位的所有行
df.dropna()
# Output:
# A B C D
# 0 0 1 2 3
要刪除指定列中缺少資料的行,請使用 subset
df.dropna(subset=['C'])
# Output:
# A B C D
# 0 0 1 2 3
# 2 8 NaN 10 None
# 3 11 12 13 NaT
使用選項 inplace = True
進行就地替換過濾幀。