一种实体解析方法、设备、介质及产品技术

技术编号:44186104 阅读:20 留言:0更新日期:2025-02-06 18:27
本申请公开了一种实体解析方法、设备、介质及产品,涉及实体解析领域,该方法包括获取基于实体解析任务的数据集;所述数据集中每一条样本数据包括两个来源不同的实体以及对应的相似结果;根据语法知识将数据集中每一条样本数据中的两个实体生成相应的句子;利用生成句子的数据集训练BERT‑Pair‑Networks网络,得到实体解析模型;利用实体解析模型对待解析的实体进行实体解析。本申请能够理解整体句子,实现实体解析模型的强泛化能力和高扩展性,提高实体解析的准确性。

【技术实现步骤摘要】

本申请涉及实体解析领域,特别是涉及一种实体解析方法、设备、介质及产品


技术介绍

1、实体解析(entityresolution er)是数据库、信息检索、机器学习、自然语言处理等领域的研究重点,是实现数据集成的先决条件,旨在识别来自两个不同来源的元组是否指向真实世界中的同一对象,或称两者为等价匹配。

2、早期解决实体解析任务的方法主要是基于规则的方法和基于传统的机器学习方法,近几年,基于深度学习的方法在实体解析中被广泛使用,并取得了理想的结果。目前,基于深度学习解决实体解析分为两类:(1)基于属性特征的实体解析模型;(2)基于实体类型的实体解析模型。其中,基于属性特征的实体解析模型包括结合注意力机制的rnn(循环神经网络)和lstm(长短期记忆网络),这些模型能够捕获语义和句法信息,以更好地表示语义相似性,特别是对于文本属性。基于实体类型的实体解析模型,如grapher模型,主要通过图卷积网络(gcn)表示实体记录,直接提取类型的比较特征,将语义和结构信息软性嵌入到图网络中;grapher模型依赖端到端的深度学习框架,解决了属性中心方法所面临本文档来自技高网...

【技术保护点】

1.一种实体解析方法,其特征在于,所述实体解析方法包括:

2.根据权利要求1所述的实体解析方法,其特征在于,所述根据语法知识将数据集中每一条样本数据中的两个实体生成相应的句子,具体包括:

3.根据权利要求2所述的实体解析方法,其特征在于,所述BERT-Pair-Networks网络的训练过程,具体包括:

4.根据权利要求3所述的实体解析方法,其特征在于,所述池化策略为平均池化、最大池化或CLS三种映射函数。

5.根据权利要求3所述的实体解析方法,其特征在于,所述利用BERT-Pair-Networks网络中的MLP网络将固定维度向量Ui和固...

【技术特征摘要】

1.一种实体解析方法,其特征在于,所述实体解析方法包括:

2.根据权利要求1所述的实体解析方法,其特征在于,所述根据语法知识将数据集中每一条样本数据中的两个实体生成相应的句子,具体包括:

3.根据权利要求2所述的实体解析方法,其特征在于,所述bert-pair-networks网络的训练过程,具体包括:

4.根据权利要求3所述的实体解析方法,其特征在于,所述池化策略为平均池化、最大池化或cls三种映射函数。

5.根据权利要求3所述的实体解析方法,其特征在于,所述利用bert-pair-networks网络中的mlp网络将固定维度向量ui和固定维度向量uj进行分类,得到分类结果,具体包括:

6...

【专利技术属性】
技术研发人员:刘鑫姚俊萍王佳硕陈菁李晓军郭毅
申请(专利权)人:中国人民解放军火箭军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1