ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2024 > 10期 > 信息:技术与应用
基于文本相似性技术的地址文本补全系统设计与实现
廖洪亮

【摘要】当前地址信息应用领域日益广泛,地址文本信息的完整性、规范性、准确性尤为重要。 因历史原因,现有银行系统中收录的地址文本信息出现了各种录入不完整、关键字段缺失等问题,导致后续地址文本信息解析成经纬度信息时无法解析、解析偏差较大等。 本文基于文本相似性技术,设计实现了一种高效率、高准确度,能够快速整合接入各类应用的地址信息补全系统。 该系统通过中文分词、杰卡德相似系数算法,计算不完整地址文本信息与现有完整地址文本信息的相似度,来补全不完整的地址文本信息,从而实现地址文本信息的准确解析。 本文通过一组实验数据验证测试系统效果:若相似系数≥0. 3,地址文本补全并解析后的准确率可达70%以上,较符合实际应用。

【关键字】地址文本补全;文本相似性;中文分词;杰卡德相似系数