ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】随着经济的快速发展,人们开始更广泛地使用信用卡进行交易,在支付方式变得更方便与快捷的同时,也衍生了许多犯罪问题。其中信用卡诈骗给广大人民群众造成了巨大的经济损失,严重影响了国家的金融秩序和人民的财产安全。针对信用卡诈骗领域数据的不平衡性和数量的庞大,本文提出一种利用损失函数(focal loss)改进 XGBoost损失函数的算法(FXGBoost) 相结合的信用卡诈骗预测模型。首先,对 ULB 机器学习小组的信用卡诈骗数据集使用少数类过采样方法来平衡数据集。其次,通过输入 W-CEL 损耗到焦点损失函数的另一个参数来提高其能力,并以改进的算法训练新的数据集得到最终模型。最后,对测试集进行并行分类,并在模型对比实验中,将本项目提出的模型与逻辑回归(logistic regression)模型、支持向量机(support vector machine)模型、朴素贝叶斯(Naïve Bayes)模型、K 近邻分布(k-nearest neighbour)模型以及原有的 XGBoost 模型进行对比。实验结果表明,在极端不平衡的数据场景下,通过对召回率、精确率、准确率和马修斯相关系数四个指标进行对比,可以得出本项目提出的模型是相对优秀的。实验结果表明,该模型能够准确有效地预测信用卡诈骗行为,具有良好的实际效果,对公安经侦工作有着较高的实用价值。