ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】金融领域的非结构化文本数据包含重要的实体关系信息,对金融分析至关重要。 然而,在实践中,准确识别文本中的多样实体及其复杂关系常面临实体边界模糊和关系重叠的挑战。 本研究提出了一种基于图注意力(GAT)网络的联合实体关系抽取方法,突破了传统流水线模式的局限,通过细粒度的三元组分类器实现了实体与关系的联合抽取。 此外,模型通过融合句法依存结构和词汇词性信息,有效解决了金融文本中实体界定难、实体边界模糊和关系表达复杂等问题,显著增强了对复杂金融实体和关系的识别能力。 实验在中文金融领域基准数据集 FinRE 上进行,结果表明:该方法在精确度、召回率和 F1 值上显著优于现有方法。 其中,F1值达到 44.78%,性能平均提升 10.08%。 消融实验进一步验证了各组件的重要性。