查詢列之間的相關性

假設你有一個數值的 DataFrame,例如:

df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])

然後

>>> df.corr()
    a    b    c
a    1.000000    0.018602    0.038098
b    0.018602    1.000000    -0.014245
c    0.038098    -0.014245    1.000000

將找到列之間的 Pearson 相關性 。注意對角線是如何 1 的,因為每列(顯然)與自身完全相關。

pd.DataFrame.correlation 採用可選的 method 引數,指定要使用的演算法。預設為 pearson。例如,要使用 Spearman 相關,請使用

>>> df.corr(method='spearman')
    a    b    c
a    1.000000    0.007744    0.037209
b    0.007744    1.000000    -0.011823
c    0.037209    -0.011823    1.000000