ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2022 > 10期 > 论著
基于数据挖掘地址的文本信息提取方法
郭利荣

【摘要】随着机器学习和数据挖掘等方面技术的发展,文本分析与文本挖掘理论方法受到了广泛关注,并且在诸多领域取得了有价值的成果。针对目前多数文本分析只集中在对文本片段的分类和对文本的标注,提出通过运用数据挖掘的方法,基于统计和马尔可夫过程构建模型,用一种从文本中提取地名信息并使用地图服务供应商,补全信息形成结构化数据的方法。在对案例文本中提取地址信息的过程中,成功找到了绝大部分地名,并将其结构化。

【关键字】数据挖掘;文本分析;马尔可夫过程