ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】随着机器学习和数据挖掘等方面技术的发展,文本分析与文本挖掘理论方法受到了广泛关注,并且在诸多领域取得了有价值的成果。针对目前多数文本分析只集中在对文本片段的分类和对文本的标注,提出通过运用数据挖掘的方法,基于统计和马尔可夫过程构建模型,用一种从文本中提取地名信息并使用地图服务供应商,补全信息形成结构化数据的方法。在对案例文本中提取地址信息的过程中,成功找到了绝大部分地名,并将其结构化。