创建随机森林模型

机器学习算法的一个例子是 Random Forest 算法(Breiman,L。(2001).Random Forests。机器学习 45(5) ,第 5-32 页)。根据 Breiman 在 randomForest 包中的原始 Fortran 实现,该算法在 R 中实现。

通过将类变量准备为 factor,可以在 R 中创建随机森林分类器对象,这在 iris 数据集中已经很明显。因此我们可以通过以下方式轻松创建随机森林

library(randomForest)

rf <- randomForest(x = iris[, 1:4], 
                   y = iris$Species, 
                   ntree = 500, 
                   do.trace = 100)

rf

# Call:
#   randomForest(x = iris[, 1:4], y = iris$Species, ntree = 500,      do.trace = 100) 
# Type of random forest: classification
# Number of trees: 500
# No. of variables tried at each split: 2
# 
# OOB estimate of  error rate: 4%
# Confusion matrix:
#   setosa versicolor virginica class.error
# setosa         50          0         0        0.00
# versicolor      0         47         3        0.06
# virginica       0          3        47        0.06
参数 描述
X 包含类的描述变量的数据框
ÿ 个别观察的类别。如果此向量是 factor,则创建分类模型,否则创建回归模型。
ntree 构建的单个 CART 树的数量
do.trace 每次我 TH 一步,整体和每个类的出的现成的错误返回