基于隔离森林的物联网大数据清洗算法
陈虹桥
【摘要】随着物联网技术的迅速发展,不断生成和传输的大量异构高频数据面临数据质量和可靠性下降的问题,数据清洗是确保物联网大数据质量的重要步骤。针对传统的数据清洗在处理物联网大数据时面临的效率低下和效果不佳问题,本文提出了一种基于隔离森林算法的物联网大数据清洗算法,该算法能够快速识别数据中的异常点,并进行剔除和填补提高数据的整体质量。实验发现:该算法能够有效检测异常数据并完成填补,提高了物联网数据分析的准确性和可靠性。
【关键字】物联网大数据;异常检测;数据清洗;隔离森林算法
【PDF】