ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2022 > 7期 > 综合:探索与发现
LightGBM 模型及其应用
舒仕文

【摘要】梯度提升树(G B D T)在每次操作时都会将所有训练数据加载到内存中,这会浪费大量空间并限制训练数据的大小。基于此,本文首先介绍 LightGBM 提出的动机,其次介绍实现 LightGBM 的算法,即 GOSS 算法(基于梯度的单边采样)和 EFB 算法(互斥特征捆绑),然后例举了在 Python 语言中使用 LightGBM 模型对 3 个二分类数据集分别进行分类预测的应用,计算出模型的相关评估指标以及在 3 个数据集中的运行时长和所占用的内存,并与 AdaBoostGBDTXGBoost 3 个集成算法进行对比,最后总结了 LightGBM 模型的优点(计算速度快、占用内存小)和缺点(对噪声点比较敏感等)。

【关键字】LightGBM 模型;算法;Python;二分类数据;模型评估