System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,特别是涉及一种角色属性的预测方法、训练方法及相关装置。
技术介绍
1、目前,直接基于文本内容(例如,小说),预测文本内容中人物角色的属性。但是,文本内容中包括与人物角色的属性无关的内容,即,文本噪声,所以,基于整个文本内容进行人物角色的属性的预测,会被文本噪声影响而导致预测不准确。
技术实现思路
1、本申请主要解决的技术问题是提供一种角色属性的预测方法、训练方法及相关装置,能够提高角色属性的准确性。
2、为解决上述技术问题,本申请采用的一个技术方案是:提供一种色属性的预测方法,该方法包括:获取待预测文本;其中,待预测文本中至少包括一个目标人物角色;从待预测文本中,筛选出与各目标人物角色的属性相关的目标文本内容;基于与各目标人物角色的属性相关的目标文本内容,对各目标人物角色的属性进行预测,得到各目标人物角色的目标属性预测结果。
3、其中,从待预测文本中,筛选出与各目标人物角色的属性相关的目标文本内容,包括:对于各目标人物角色,从待预测文本中,获取与目标人物角色相关的至少一个第一目标句子;从目标人物角色对应的至少一个第一目标句子中,筛选出至少一个存在属性信息的第二目标句子,作为目标人物角色对应的目标文本内容。
4、其中,从目标人物角色对应的至少一个第一目标句子中,筛选出至少一个存在属性信息的第二目标句子,作为目标人物角色对应的目标文本内容的步骤是利用角色属性预测模型中的二分类网络执行的;从目标人物角色对应的至少一个第一目标句子中,
5、其中,利用二分类网络对各目标人物角色对应的至少一个第一目标句子进行分类,得到各第一目标句子的目标分类结果,包括:利用二分类网络对各目标人物角色对应的至少一个第一目标句子进行分类,得到各第一目标句子的表征目标分类结果的目标参数值;基于各第一目标句子对应的目标参数值,确定各第一目标句子的目标分类结果。
6、其中,基于各第一目标句子对应的目标参数值,确定各第一目标句子的目标分类结果,包括:将目标参数值为第一参考参数值的第一目标句子,确定为存在属性信息;将目标参数值为第二参考参数值的第一目标句子,确定为不存在属性信息。
7、其中,从待预测文本中,获取与目标人物角色相关的至少一个第一目标句子,包括:利用滑窗切分的方式对待预测文本进行切分,得到待预测文本中的各个第三目标句子;查找出含有目标人物角色对应的角色标识信息的第三目标句子,作为与目标人物的角色相关的第一目标句子。
8、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种角色属性预测模型的训练方法,该方法包括:获取第一样本文本;其中,第一样本文本中至少包括一个样本人物角色,第一样本文本标注有各样本人物角色的标注属性信息;利用角色属性预测模型,从第一样本文本中,筛选出与各样本人物角色的属性相关的样本文本内容;基于与各样本人物角色相关的样本文本内容,对各样本人物角色的属性进行预测,得到各样本人物角色的样本属性预测结果;基于各样本人物角色的样本属性预测结果和标注属性信息之间的差异,调整角色属性预测模型的模型参数。
9、其中,利用角色属性预测模型,从第一样本文本中,筛选出与各样本人物角色的属性相关的样本文本内容,包括:利用滑窗切分的方式对第一样本文本进行切分,得到与各样本人物角色相关的至少一个第一样本句子;从样本人物角色对应的至少一个第一样本句子中,筛选出有效样本句子,作为与样本人物角色相关的样本文本内容;其中,有效样本句子标注有正确的标注属性信息。
10、其中,从样本人物角色对应的至少一个第一样本句子中,筛选出有效样本句子,包括:对各第一样本句子打标,得到各第一样本句子的样本打标结果;以及,获取各第一样本句子的标注属性信息;其中,标注属性信息是人工标注的;对于各第一样本句子,基于样本打标结果和标注属性信息,确定第一样本句子是否为有效样本句子。
11、其中,对各第一样本句子打标,得到各第一样本句子的样本打标结果,包括:对各第一样本句子分别进行两次打标,得到各第一样本句子的第一样本打标结果和第二样本打标结果;基于样本打标结果和标注属性信息,确定第一样本句子是否为有效样本句子,包括:响应于第一样本打标结果、第二样本打标结果和标注属性信息三者一致,确定第一样本句子为有效样本句子。
12、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种角色属性的预测装置,该装置包括获取模块、筛选模块和预测模块;获取模块用于获取待预测文本;其中,待预测文本中至少包括一个目标人物角色;筛选模块用于从待预测文本中,筛选出与各目标人物角色的属性相关的目标文本内容;预测模块用于基于与各目标人物角色的属性相关的目标文本内容,对各目标人物角色的属性进行预测,得到各目标人物角色的目标属性预测结果。
13、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种角色属性预测模型的训练装置,该装置包括获取模块、筛选模块、预测模块和调整模块;获取模块用于获取第一样本文本;其中,第一样本文本中至少包括一个样本人物角色,第一样本文本标注有各样本人物角色的标注属性信息;筛选模块用于利用角色属性预测模型,从第一样本文本中,筛选出与各样本人物角色相关的样本文本内容;预测模块用于基于与各样本人物角色相关的样本文本内容,对各样本人物角色的属性进行预测,得到各样本人物角色的样本属性预测结果;调整模块用于基于各样本人物角色的样本属性预测结果和标注属性信息之间的差异,调整角色属性预测模型的模型参数。
14、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,该电子设备包括存储器和处理器,存储器存储有程序指令,处理器用于执行程序指令以实现上的方法。
15、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质用于存储程序指令,程序指令能够被执行以实现上述的方法。
16、上述技术方案,与各目标人物角色的属性相关的目标文本内容,是从待预测文本中,剔除会影响对应目标人物角色的属性预测的文本噪音得到的;所以,基于与各目标人物角色的属性相关的文本内容进行各目标人物角色的属性预测,以准确地预测各个目标人物角色的属性,提高了属性预测的准确性。
本文档来自技高网...【技术保护点】
1.一种角色属性的预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从所述待预测文本中,筛选出与各所述目标人物角色的属性相关的目标文本内容,包括:
3.根据权利要求2所述的方法,其特征在于,所述从所述目标人物角色对应的至少一个第一目标句子中,筛选出至少一个存在属性信息的第二目标句子,作为所述目标人物角色对应的目标文本内容的步骤是利用角色属性预测模型中的二分类网络执行的;
4.根据权利要求3所述的方法,其特征在于,所述利用所述二分类网络对各所述目标人物角色对应的至少一个第一目标句子进行分类,得到各所述第一目标句子的目标分类结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于各所述第一目标句子对应的所述目标参数值,确定各所述第一目标句子的目标分类结果,包括:
6.根据权利要求2所述的方法,其特征在于,所述从所述待预测文本中,获取与所述目标人物角色相关的至少一个第一目标句子,包括:
7.一种角色属性预测模型的训练方法,其特征在于,所述方法包括:
8.根据权利
9.根据权利要求8所述的方法,其特征在于,所述从所述样本人物角色对应的至少一个第一样本句子中,筛选出有效样本句子,包括:
10.根据权利要求9所述的方法,其特征在于,所述对各所述第一样本句子打标,得到各所述第一样本句子的样本打标结果,包括:
11.一种角色属性的预测装置,其特征在于,所述装置包括:
12.一种角色属性预测模型的训练装置,其特征在于,所述装置包括:
13.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有程序指令,所述处理器用于执行所述程序指令以实现如权利要求1-10任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序指令,所述程序指令能够被执行以实现如权利要求1-10任一项所述的方法。
...【技术特征摘要】
1.一种角色属性的预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从所述待预测文本中,筛选出与各所述目标人物角色的属性相关的目标文本内容,包括:
3.根据权利要求2所述的方法,其特征在于,所述从所述目标人物角色对应的至少一个第一目标句子中,筛选出至少一个存在属性信息的第二目标句子,作为所述目标人物角色对应的目标文本内容的步骤是利用角色属性预测模型中的二分类网络执行的;
4.根据权利要求3所述的方法,其特征在于,所述利用所述二分类网络对各所述目标人物角色对应的至少一个第一目标句子进行分类,得到各所述第一目标句子的目标分类结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于各所述第一目标句子对应的所述目标参数值,确定各所述第一目标句子的目标分类结果,包括:
6.根据权利要求2所述的方法,其特征在于,所述从所述待预测文本中,获取与所述目标人物角色相关的至少一个第一目标句子,包括:
7.一种角色属性预测模型的训练方法...
【专利技术属性】
技术研发人员:张天怡,胡亚军,方昕,潘嘉,高建清,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。