利用python实现GBDT算法的回归、二分类以及多分类,将算法流程详情进行展示解读并可视化,便于读者庖丁解牛地理解GBDT。
算法原理以及公式推导请前往blog:GBDT算法原理以及实例理解
graphviz的-2.38.msi
,先安装,再将安装目录下的bin
添加到系统环境变量,此时如果再报错可以重启计算机。详细过程不再描述,网上很多解答。回归测试:
python example.py --model = regression
二分类测试:
python example.py --model = binary_cf
多分类测试:
python example.py --model = multi_cf
lr
-- 学习率, trees
-- 构建的决策树数量即迭代次数,depth
-- 决策树的深度, count
-- 决策树节点分裂的最小数据数量,
is_log
-- 是否打印树的生成过程, is_plot
-- 是否可视化树的结构.results
文件夹,里面包含了每棵树的内部结构和生成日志仅展示最后所有树的集合,具体每棵树的详细信息望读者自行运行代码~