基于Python影评数据挖掘与分析——以《你好,李焕英》 为例
邵小青,贾钰峰,章蓬伟,丁 娟
【摘要】文本数据挖掘分析是自然语言处理的重要过程。以 Python 语言在情感分析中的应用为基础,通过爬取豆瓣影评《你好,李焕英》的评论数据,对数据预处理去除无用数据,使用 Jieba 分词对影评关键词进行可视化展示,通过SnowNLP 对观众电影的情感评价程度进行可视化展示,以期为影迷在一定程度上提供一些参考,同时为媒体、电影市场、社交网站提供口碑及相关服务的帮助。
【关键字】Python;SnowNLP;数据分析