【技术实现步骤摘要】
实体链接方法、装置及电子设备
[0001]本申请涉及人工智能
,尤其涉及一种实体链接方法、装置及电子设备。
技术介绍
[0002]在诸如问答系统中,由于用户输入的语句中常常会出现一些口语化的表达、错别字以及语序颠倒等问题,比如在“机械键盘价格多少啊”这句话中,用户将“机械键盘”误输入为“机械间盘”,为准确理解用户语句所的真实意图,以确保针对用户语句的应答效果,需要对用户输入的语句进行实体链接处理,也即将用户输入的语句中的可能描述实体的片段链接到实体库中对应的实体上。
[0003]目前,实体链接方法大多都是对用户语句进行切词并利用指称(mention)词典获取用户语句中的词语在实体库中对应的实体,进而将用户语句中的词语链接到对应的实体。但是,在用户输入的语句中常常会出现一些口语化的表达、错别字以及语序颠倒等问题时,上述方式可能会将用户语句中的关键词拆分开,进而导致获取的实体的不准确,影响实体链接的准确率。
技术实现思路
[0004]本申请实施例提供一种实体链接方法、装置及电子设备,用于解决现有的实体链接方法存在的链接准确率低的问题。
[0005]为了解决上述技术问题,本申请实施例采用下述技术方案:
[0006]第一方面,本申请实施例提供一种实体链接方法,包括:
[0007]从实体库中召回与待处理的目标对话内容对应的候选实体;
[0008]分别对所述目标对话内容、与所述目标对话内容相关的历史对话内容、所述候选实体及所述候选实体对应的关联实体进行特征提取,得到所 ...
【技术保护点】
【技术特征摘要】
1.一种实体链接方法,其特征在于,包括:从实体库中召回与待处理的目标对话内容对应的候选实体;分别对所述目标对话内容、与所述目标对话内容相关的历史对话内容、所述候选实体及所述候选实体对应的关联实体进行特征提取,得到所述目标对话内容、所述历史对话内容、所述候选实体及所述关联实体各自的语义向量;基于所述历史对话内容、所述候选实体及所述关联实体各自的语义向量以及注意力机制,对所述目标对话内容的语义向量进行语义增强,得到所述目标对话内容的目标语义向量;基于所述关联实体、所述目标对话内容及所述历史对话内容各自的语义向量以及注意力机制,对所述候选实体的语义向量进行语义增强,得到所述候选实体的目标语义向量;基于所述目标对话内容及候选实体各自的目标语义向量,将所述目标对话内容中的实体及片段链接至与所述目标对话内容对应的候选实体。2.根据权利要求1所述的方法,其特征在于,所述基于所述历史对话内容、所述候选实体及所述关联实体各自的语义向量以及注意力机制,对所述目标对话内容的语义向量进行语义增强,得到所述目标对话内容的目标语义向量,包括:基于自注意力机制和所述历史对话内容的语义向量,对所述目标对话内容的语义向量进行语义增强,得到所述目标对话内容的增强语义向量;基于自注意力机制和实体集合中各实体的语义向量,对所述实体集合中其他实体的语义向量进行语义增强,得到所述实体集合中各实体的增强语义向量,其中,所述实体集合包括所述候选实体和所述关联实体;基于交叉注意力机制和所述实体集合中各实体的增强语义向量,对所述目标对话内容的增强语义向量进行语义增强,得到所述目标对话内容的目标语义向量。3.根据权利要求1所述的方法,其特征在于,所述基于所述关联实体、所述目标对话内容及所述历史对话内容各自的语义向量以及注意力机制,对所述候选实体的语义向量进行语义增强,得到所述候选实体的目标语义向量,包括:基于自注意力机制和所述关联实体的语义向量,对所述候选实体的语义向量进行语义增强,得到所述候选实体的增强语义向量;基于自注意力机制和对话集合中各对话内容的语义向量,对所述对话集合中其他对话内容的语义向量进行语义增强,得到所述对话集合中各对话内容的增强语义向量,其中,所述对话集合包括所述目标对话内容和所述历史对话内容;基于交叉注意力机制和所述对话集合中各对话内容的增强语义向量,对所述候选实体的增强语义向量进行语义增强,得到所述候选实体的目标语义向量。4.根据权利要求1所述的方法,其特征在于,所述基于所述目标对话内容及候选实体各自的目标语义向量,将所述目标对话内容中的实体提及片段链接至与所述目标对话内容对应的候选实体,包括:基于所述目标对话内容及候选实体各自的目标语义向量,确定所述目标对话内容与所述候选实体之间的匹配程度;若所述目标对话内容与所述候选实体之间的匹配,则将所述目标对话内容中的实体提及片段链接至所述候选实体。
5.根据权利要求4所述的方法,其特征在于,在基于所述目标对话内容及候选实体各自的目标语义向量,确定所述目标对话内容与所述候选实体之间的匹配程度之前,所述方法还包括:基于召回所述候选实体所使用的召回模式,获取所述目标对话内容及所述候选实体各自对应于所述召回模式的实体特征;所述基于所述目标对话内容及候选实体各自的目标语义向量,确定所述目标对话内容与所述候选实体之间的匹配程度,包括:基于所述目标对话内容及所述候选实体各自的目标语义向量,确定所述目标对话内容与所述候选实体之间的第一相似度;基于所述目标对话内容及所述候选实体各自对应于所述召回模式的实体特征,确定所述目标对话内容与所述候选实体之间的第二相似度;基于所述第一相似度和所述第二相似度,确定所述目标对话内容与所述候选实体之间的匹配程度。6.根据权利要求4所述的方法,其特征在于,所述基于所述目标对话内容及候选实体各自的目标语义向量,确定所述目标对话内容与所述候选实体之间的匹配程度之间的匹配程度,包括:将所述目标对话内容及候选实体各自的目标语义向量输入匹配网络,得到所述目标对话内容与所述候选实体之间的匹配程度,其中,所述匹配网络是以不同的第一样本字符串的语义向量作为输入、以所述不同的第一样本字符串之间的匹配程度作为输出进行训练得到的。7.根据权利要求1所述的方法,其特征在于,所述在基于所述目标对话内容及候选实体各自的目标语义向量,确定所述目标对话内容与所述候选实体之间的匹配程度之前,所述方法还包括:基于召回所述候选实体所使用的召回模式,获取所述目标对话内容及所述候选实体各自对应于所述召回模式的实体特征;所述基于所述目标对话内容及候选实体各自的目标语义向量,确定所述目标对话内容与所述候选实体之间的匹配程度之间的匹配程度,包括:基于召回所述候选实体所使用的召回模式以及所述目标对话内容及所述候选实体各自对应于召回模式的实体特征,确定候选实体的来源特征向量;将所述目标对话内容的目标语义向量、所述候选实体的目标语义向量以及所述候选实体的来源特征向量输入预先训练的匹配网络,输出目标对话内容与候选实体之间的匹配程度,其中,所述匹配网络是以不同的第一样本字符串的语义向量及来源特征向量作为输入、以所述不同的第一样本字符串之间的匹配程度作为输出进行训练得到的。8.根据权利要求1所述的方法,其特征在于,所述分别对所述目标对话内容、与所述目标对话内容相关的历史对话内容、所述候选实体及所述候选实体对应的关联实体进行特征提取,包括:将所述目标对话内容、所述历史对话内容、所述候选实体及所述候选实体对应的关联实体输入特征提取网络,得到所述目标对话内容、所述历史对话内容、所述候选实体及所述关联实体各自的语义向量,其中,所述特征提取网络是以不同的第二样本字符串作为输入、
以所述不同的第二样本字符串的语义向量作为输出进行训练得到的。9.根据权利要求1所述的方法,其特征在于,所述从实体库中召回与待处理的目标对话内容对应的候选实体,包括:通过多种召回模式,从实体库中获取所述目标对话内容对应的召回实体;基于获取的召回实体,确定所述目标对话内容对应的候选实体。10.根据权利要求9所述的方法,其特征在于,若所述多种召回模式包括规则召回模式,从实体库中获取所述目标对话内容对应的...
【专利技术属性】
技术研发人员:邓泽贵,蒋宁,王洪斌,吴海英,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。