一种文本内容指代消解方法、装置、设备及其存储介质制造方法及图纸

技术编号:41135596 阅读:22 留言:0更新日期:2024-04-30 18:06
本申请实施例属于金融科技技术领域,应用于文本内容指代消解场景中,涉及一种文本内容指代消解方法、装置、设备及其存储介质,包括获得待进行指代消解的文本;抽取文本中包含的所有实体数据;对待进行指代消解的文本中包含的所有实体数据进行同义词归类整理;将归类结果输入到根据目标识别图谱训练的表示学习模型,获得对应的包含语义信息的实体关系向量;根据对应的包含语义信息的实体关系向量,对待进行指代消解的文本中包含的实体数据进行指代消解。通过表示学习模型获得目标识别图谱中包含的实体关系向量作为监督信号,确定待进行指代消解的文本中所有实体数据间的实体关系向量,更好的辅助金融处理系统进行文本内容指代消解。

【技术实现步骤摘要】

本申请涉及金融科技,应用于文本内容指代消解场景中,尤其涉及一种文本内容指代消解方法、装置、设备及其存储介质


技术介绍

1、随着互联网的飞速发展,各行各业都在依托互联网寻求行业突破点,近年来,金融行业也正在围绕着互联网进行线上业务拓展。由于金融行业涉及的业务量和数据量较大,导致了在金融业务文本处理上,需要更好的理解文本的含义。

2、而指代消解是自然语言处理中一个重要的任务,它的目标是在一段文本中解决名词短语的指代关系,即确定同一实体(如人、地点、物品等)在文本中出现的所有地方,可以帮助我们更好地理解文本的含义。

3、目前的指代消解方法,通常注重于输入文本本身,着力于挖掘输入文本中的信息:如有研究者使用端到端的神经网络计算文本中短语的向量表示和文本中短语的头注意力机制,以此达到指代消解的目的;还有的学者使用问答模型的形式,首先从文本中提取出候选指称,其次将每个指称所在句子作为问句,整个文本作为上下文,将二者拼接起来,最后通过一个问答模型抽取该文本中该指称的所有共指词,可以发现上述指代消解方法仅对输入文本进行处理,获得的信息十分有限,无本文档来自技高网...

【技术保护点】

1.一种文本内容指代消解方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的文本内容指代消解方法,其特征在于,所述解析所述目标知识图谱,得到所有实体数据以及所有实体数据间的关系表征数据的步骤,具体包括:

3.根据权利要求1所述的文本内容指代消解方法,其特征在于,在执行所述将所述所有实体数据以及所有实体数据间的关系表征数据输入预设的表示学习模型,根据所述表示学习模型的输出结果获得包含语义信息的实体关系向量的步骤之前,所述方法还包括:

4.根据权利要求1或3所述的文本内容指代消解方法,其特征在于,所述将所述所有实体数据以及所有实体数据间的关系表征数据...

【技术特征摘要】

1.一种文本内容指代消解方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的文本内容指代消解方法,其特征在于,所述解析所述目标知识图谱,得到所有实体数据以及所有实体数据间的关系表征数据的步骤,具体包括:

3.根据权利要求1所述的文本内容指代消解方法,其特征在于,在执行所述将所述所有实体数据以及所有实体数据间的关系表征数据输入预设的表示学习模型,根据所述表示学习模型的输出结果获得包含语义信息的实体关系向量的步骤之前,所述方法还包括:

4.根据权利要求1或3所述的文本内容指代消解方法,其特征在于,所述将所述所有实体数据以及所有实体数据间的关系表征数据输入预设的表示学习模型,根据所述表示学习模型的输出结果获得包含语义信息的实体关系向量的步骤,具体包括:

5.根据权利要求1所述的文本内容指代消解方法,其特征在于,所述实体抽取模型为基于crf算法的bert实体抽取模型,所述将所述待进行指代消解的文本输入预设的实体抽取模型,根据所述实...

【专利技术属性】
技术研发人员:孔令格
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1