GradientBoostingClassifier

Gradient Boosting 用于分类。梯度增强分类器是基础模型的加性集合,其误差在连续迭代(或阶段)中通过添加回归树来校正残差(前一阶段的误差)。

导入:

from sklearn.ensemble import GradientBoostingClassifier

创建一些玩具分类数据

from sklearn.datasets import load_iris

iris_dataset = load_iris()

X, y = iris_dataset.data, iris_dataset.target

让我们将这些数据分成训练和测试集

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=0)

使用默认参数实例化 GradientBoostingClassifier 模型

gbc = GradientBoostingClassifier()
gbc.fit(X_train, y_train)

让我们在测试集上得分

# We are using the default classification accuracy score
>>> gbc.score(X_test, y_test)
1

默认情况下,建立了 100 个估算器

>>> gbc.n_estimators
100

这可以通过在初始化时间期间将 n_estimators 设置为不同的值来控制。