【技术实现步骤摘要】
一种文本信息处理方法、装置、电子设备
[0001]本申请涉及计算机
,具体涉及一种文本信息处理方法。本申请同时涉及一种文本信息处理装置、电子设备以及存储介质。
技术介绍
[0002]随着科技学技术的快速发展,相关人员在日常生活中常常如何处理并利用海量文本信息的问题,如:随着互联网技术的快速发展,相关人员往往需要面临如何从海量网络文本信息中快速、准确地分析出真正有用的信息的问题,再比如:随着工业科技的快速发展,越来越多的大型、重型设备被应用于工业生产、加工作业中,这些设备一旦发生故障,不仅会引发设备损坏的直接损失,还会导致工业生产、加工作业的间接损失,为了提高这些设备可靠性,工业企业往往会通过布设大量传感装置或者其他监控装置来对这些设备进行监测、巡检、以及检修,在对这些设备进行监测、巡检、以及检修的过程中往往会产生大量的与设备质量信息有关的设备质量文本信息,并且质量文本信息中大多数是由人工编写、且以非结构化的文本信息为主,包括但不限于:巡检日志、缺陷记录、故障案例、处置方案、技术规范、标准导则、指导手册、说明书、科研论文 ...
【技术保护点】
【技术特征摘要】
1.一种文本信息处理方法,其特征在于,包括:获得目标文本信息,并获得所述目标文本信息中的指定命名实体信息;根据所述指定命名实体信息,确定所述指定命名实体信息对应的目标属性槽位信息,所述目标属性槽位信息为用于指示所述指定命名实体信息对应的需要填槽属性信息的目标属性的信息;根据所述指定命名实体信息和所述目标属性槽位信息,从所述目标文本信息中提取第一目标属性的属性信息,并根据所述目标文本信息、所述指定命名实体信息以及所述目标属性槽位信息,确定第二目标属性的属性信息。2.根据权利要求1所述的文本信息处理方法,其特征在于,所述第一目标属性为能够在所述目标文本信息中直接确定属性信息的所述目标属性,所述第二目标属性为不能够直接在所述目标文本信息中确定属性信息的所述目标属性。3.根据权利要求1或2所述的文本信息处理方法,其特征在于,所述根据所述指定命名实体信息和所述目标属性槽位信息,从所述目标文本信息中提取第一目标属性的属性信息,包括:将所述目标文本信息、所述指定命名实体信息以所述目标属性槽位信息输入到第一属性信息抽取模块中,获得所述第一目标属性的属性信息,所述第一属性信息抽取模块中用于根据所述目标文本信息、所述指定命名实体信息以所述目标属性槽位信息,确定所述第一目标属性的属性信息。4.根据权利要求3所述的文本信息处理方法,其特征在于,所述将所述目标文本信息、所述指定命名实体信息以所述目标属性槽位信息输入到第一属性信息抽取模块中,获得所述第一目标属性的属性信息,包括:将所述目标文本信息、所述指定命名实体信息以所述目标属性槽位信息输入到第一属性信息抽取模块中,获得所述目标文本信息对应的关键字信息、所述指定命名实体信息对应的实体特征信息、所述目标属性对应的特征信息以及所述指定命名实体信息在所述目标文本信息中的位置特征信息;根据所述目标文本信息对应的关键字信息、所述指定命名实体信息对应的实体特征信息、所述目标属性对应的特征信息以及所述指定命名实体信息在所述目标文本信息中的位置特征信息,确定所述第一目标属性的属性信息。5.根据权利要求3所述的文本信息处理方法,其特征在于,还包括:确定第一目标样本属性的属性信息;针对所述第一目标样本属性的属性信息,获得所述第一目标样本属性的属性信息对应的样本文本信息、所述样本文本信息中的指定命名实体信息以及所述样本文本信息中的指定命名实体信息对应的属性槽位信息;根据所述第一目标样本属性的属性信息、所述第一目标样本属性的属性信息对应的样本文本信息、所述样本文本信息中的指定命名实体信息以及所述样本文本信息中的指定命名实体信息对应的属性槽位信息,确定所述第一属性信息抽取模块。6.根据权利要求3所述的文本信息处理方法,其特征在于,所述将所述目标文本信息、所述指定命名实体信息以所述目标属性槽位信息输入到第一属性信息抽取模块中,获得所述第一目标属性的属性信息,包括:将所述目标文本信息、所述指定命名实体信息以所述目标属性槽位信息输入到第一属性信息抽取模块中,获得所述第一目标属性,并获得所述第
一目标属性的属性信息;所述根据所述目标文本信息、指定命名实体信息以及所述目标属性槽位信息,确定第二目标属性的属性信息,包括:根据所述所述目标属性槽位信息和所述第一目标属性,确定所述第二目标属性,并确定所述第二目标属性对应的所述指定命名实体;将所述第二目标属性、所述第二目标属性对应的所述指定命名实体以及所述目标文本信息输入到第二属性信息提取模块中,获得所述第二目标属性的属性信息,所述第二属性信息提取模块用于根据所述第二目标属性、所述第二目标属性对应的所述指定命名实体以及所述目标文本信息,获得所述第二目标属性的属性信息。7.根据权利要求6所述的文本信息处理方法,其特征在于,所述将所述第二目标属性、所述第二目标属性对应的所述指定命名实体以及所述目标文本信息输入到第二属性信息提取模块中,获得所述第二目标属性的属性信息,包括:将所述第二目标属性、所述第二目标属性对应的所述指定命名实体以及所述目标文本信息输入到第二属性信息提取模块中,获得所述第二目标属性对应的特征信息;根据所述第二目标属性对应的特征信息,在所述目标文本信息中确定与所述第二目标属性对应的特征信息匹配的候选属性信息;根据所述候选属性信息、所述第二目标属性、所述第二目标属性对应的所述指定命名实体以及所述目标文本信息,获得所述所述第二目标属性的属性信息。8.根据权利要求7所述的文本信息处理方法,其特征在于,还包括:确定第二目标样本属性的属性信息;针对所述第二目标样本属性的属性信息,确定所述第二目标样本属性的属性信息对应的命名实体信息、所述第二目标样本属性的属性信息对应的属性槽位信息以及所述第二目标样本属性的属性信息对应的文本信息;根据所述第二目标样本属性的属性信息、所述第二目标样本属性的属性信息对应的命名实体信息、所述第二目标样本属性的属性信息对应的属性槽位信息以及所述第二目标样本属性的属性信息对应的文本信息,确定所述第二属性信息抽取模块。9.根据权利要求1所述的文本信息处理方法,其特征在于,所述获得目标文本信息,并获得所述目标文本信息中的指定命名实体信息,包括:对所述目标文本信息进行命名实体识别,获得所述指定命名实体信息。10.根据权利要求1所述的文本信息处理方法,...
【专利技术属性】
技术研发人员:谭玮,邱剑,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。