建立管道

在資料中查詢模式通常在資料處理步驟鏈中進行,例如,特徵選擇,標準化和分類。在 sklearn 中,使用了一個階段的管道。

例如,以下程式碼顯示了由兩個階段組成的管道。第一個是對要素進行縮放,第二個是對得到的增廣資料集進行分類:

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier

pipeline = make_pipeline(StandardScaler(), KNeighborsClassifier(n_neighbors=4))

建立管道後,你可以像常規階段一樣使用它(具體取決於其具體步驟)。例如,這裡的管道就像一個分類器。因此,我們可以使用它如下:

# fitting a classifier
pipeline.fit(X_train, y_train)
# getting predictions for the new data sample
pipeline.predict_proba(X_test)