ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】随着科学技术的不断创新与发展,数据的种类变得越来越多样化,数据的维度也呈显著的增长趋势。 传统模式下的机器 学习算法已无法满足有限周期内完成要解决任务的要求,因此,本文提出了一种基于 Hadoop 的数量关联规则的数据挖掘算法。 首先 该算法运用分布式计算系统(MapReduce)计算模式,对系统内数据进行多模块划分,其次利用数量参数间的关联规则挖掘有效数据, 并将挖掘后的有效数据进行合并归类,以此获得频繁参量集。 最后通过测试实验可知,优化后的算法在运算时间、运算效率等方面均 优于传统算法,使其在一定程度上有效解决传统 Apriori 算法效率低的问题。