【技术实现步骤摘要】
实体简介生成方法、设备及存储介质
[0001]本申请属于自然语言处理
,具体涉及一种实体简介生成方法、设备及存储介质。
技术介绍
[0002]实体是指客观存在并可相互区别的事物。实体通常具有多种属性。目前通常需要按照实体的属性对实体进行介绍,因此,需要生成实体简介。
[0003]传统的实体简介生成方法包括:获取目标实体的多种属性的三元组数据和多种属性之间的相关关系;将多个三元组数据和该相关关系输入预训练的融合模型,得到目标实体简介。
[0004]然而,不是所有属性的属性数据都是用户期望获知的,按照传统的介绍内容生成方法会导致生成的介绍内容出现冗余的问题。
技术实现思路
[0005]本申请提供了实体简介生成方法、设备及存储介质,可以解决传统的介绍内容生成方法会导致生成的介绍内容出现冗余的问题。本申请提供如下技术方案:
[0006]第一方面,提供了一种实体简介生成方法,所述方法包括:
[0007]获取待生成简介目标实体的三元组数据;
[0008]确定与所述 ...
【技术保护点】
【技术特征摘要】
1.一种实体简介生成方法,其特征在于,所述方法包括:获取待生成简介目标实体的三元组数据;确定与所述三元组数据相关的目标文档;使用所述目标文档确定所述三元组数据中符合所述目标实体简介的目标三元组数据和所述目标三元组数据的排列顺序;使用所述目标三元组数据确定所述实体类别;将所述目标三元组数据按照所述顺序融合为符合所述实体类别的实体简介,得到所述目标实体简介。2.根据权利要求1所述的方法,其特征在于,所述目标文档包括第一目标文档和第二目标文档,其中,第二目标文档中与所述目标实体相关度高于所述第一目标文档与所述目标实体相关度;所述使用所述目标文档确定所述三元组数据中符合所述目标实体简介的目标三元组数据和所述目标三元组数据的排列顺序,包括:使用所述第一目标文档和所述第二目标文档确定所述三元组数据中的目标三元组数据;使用所述第二目标文档确定所述目标三元组数据的排列顺序。3.根据权利要求2所述的方法,其特征在于,所述使用所述第一目标文档和所述第二目标文档确定所述三元组数据中的目标三元组数据,包括:对于每个目标文档,将每个三元组数据与所述目标文档中的各分句进行对齐处理,得到与所述三元组数据对齐的至少一个对齐分句,以及所述三元组数据的对齐次数;获取每个对齐分句在所述目标文档中的注意力权重;基于所述对齐次数与所述注意力权重确定所述三元组数据在所述目标文档中的得分值;确定每个三元组数据在各个目标文档中的得分值的加权平均值,得到每个三元组数据的目标分数;确定目标分数大于分数阈值的三元组数据,得到所述目标三元组数据。4.根据权利要求2所述的方法,其特征在于,所述使用所述第二目标文档确定所述目标三元组数据的排列顺序,包括:将所述目标三元组数据与所述第二目标文档中各分句进行对齐,得到与所述目标三元组数据对齐的目标对齐分句;获取所述目标对齐分句在所述第二目标文档中出现的分句顺序,得到所述排列顺序。5.根据权利要求1所述的方法,其特征在于,所述确定与所述三元组数据相...
【专利技术属性】
技术研发人员:李翔,施淼元,李茂龙,缪庆亮,俞凯,
申请(专利权)人:思必驰科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。