【技术实现步骤摘要】
确定文本条目合理性的方法、电子设备及存储介质
[0001]本专利技术实施例涉及计算机
,尤其涉及一种确定文本条目合理性的方法、电子设备及存储介质。
技术介绍
[0002]随着计算机技术的发展,采用计算机处理自然语言文本来抽取有价值的信息成为一个重要领域。然而,由于自然语言文本的来源、表述等问题,自然语言文本中不仅仅包括有正确、有效的信息,也可能存在大量杂乱的信息。计算机往往很难进行区分,因此提取出的信息是良莠不齐,甚至互相矛盾的。
[0003]目前解决该问题的技术主要是提前进行文本清洗,人工过滤错误的信息再交给计算机处理。但是,由于人的知识有限、主观性较强,该方法无法排除所有错误的信息,同时工作量也较大、效率低下。另一种方案是利用神经网络完成上述工作。但是,这种方法往往需要大量的标注数据,大量数据在实际业务中很难获得,同时也需要大量人工标注。即使准备好了标注数据,训练神经网络模型也需要大量的算力资源,成本较高。
技术实现思路
[0004]本申请提供了一种确定文本条目合理性的方法、电子设备及存储介质,以解决现有技术中上述部分或全部的问题。
[0005]第一方面,本申请提供了一种确定文本条目合理性的方法,该方法包括:获取待处理的文本条目;对文本条目进行解析,获取与文本条目对应的多个统计位格;根据多个统计位格,对文本条目进行解析,获取与文本条目对应的多个文本子条目;获取第一文本子条目的第一位格、与第一位格对应的第一位格信息,以及获取与第一文本子条目对应的第一信念值;根据第一位格,从预构 ...
【技术保护点】
【技术特征摘要】
1.一种确定文本条目合理性的方法,其特征在于,所述方法包括:获取待处理的文本条目;对所述文本条目进行解析,获取与所述文本条目对应的多个统计位格;根据多个所述统计位格,对所述文本条目进行解析,获取与所述文本条目对应的多个文本子条目;获取第一文本子条目的第一位格、与所述第一位格对应的第一位格信息,以及获取与所述第一文本子条目对应的第一信念值;根据所述第一位格,从预构建的条目数据库中查找与所述第一文本子条目对应的第一目标条目;当确定存在所述第一目标条目时,获取与所述第一目标条目的第一位格对应的第二位格信息,和与所述第一目标条目对应的第二信念值;根据所述第一位格的位格类型,从所述第一信念值、所述第二信念值、所述第一位格信息、所述第二位格信息中选取多个目标参数,确定所述第一文本子条目的合理性,其中所述第一文本子条目为多个所述文本子条目中的任一个文本子条目。2.根据权利要求1所述的方法,其特征在于,多个所述统计位格中每一个所述统计位格分别具有与之对应的优先级;所述根据多个所述统计位格,对所述文本条目进行解析,获取与所述文本条目对应的多个文本子条目,具体包括:根据每一个所述统计位格的优先级,对多个所述统计位格进行排序;按照排序顺序中排序在第i位的统计位格,在当前文本条目中剔除排序在第i位的统计位格,生成第i条文本子条目,其中,当i为1时,当前文本条目为所述文本条目,当i为大于1时,当前文本条目为所述当前文本条目为在前一个文本条目中剔除第i
‑
1位的统计位格后,生成的第i
‑
1条文本子条目,i为正整数;直至所述排序顺序中的最后一个统计位格在当前文本条目中剔除后,生成最后一个文本子条目后结束,获取与所述文本条目对应的多个文本子条目。3.根据权利要求1所述的方法,其特征在于,当所述第一位格的位格类型为第一预设位格类型时,所述从所述第一信念值、所述第二信念值、所述第一位格信息、所述第二位格信息中选取多个目标参数,确定所述第一文本子条目的合理性,具体包括:选取所述第一位格信息、所述第二信念值,以及所述第二位格信息作为所述目标参数;根据所述目标参数,确定所述第一文本子条目的合理性。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标参数,确定所述第一文本子条目的合理性,具体包括:当所述第二信念值小于或等于第一预设信念阈值,且所述第一位格信息与所述第二位格信息之间的差值小于或等于第一预设位格信息阈值,大于或等于第二预设位格信息阈值时,确定所述第一文本子条目合理。5.根据权利要求1所述的方法,其特征在于,当确定所述第一文本子条目不合理时,所述方法还包括:根据所述第一信念值、所述第一位格信息、所述第二信念值,以及所述第二位格信息,更新所述第一目标条目的信念值。6.根据权利要求1所述的方法,其特征在于,当所述第一位格的位格类型为第二预设位
格类型时,所述从所述第一信念值、所述第二信念值、所述第一位格信息、所述第二位格信息中选取多个目标参数,确定所述第一文本子条目的合理性,具体包括:当确定存在所述第一目标条目时,将与所述第一文本子条目对应的第一信念值加载到所述第一目标条目对应的第二信念值上;或者,当确定未存在所述第一目标条目时,将所述第一文本子条目作为所述第一目标条目,并将所述第一信念值作为所述第一目标条目对应的第二信念值;将所述第一文本子条目中的所述第一位格信息替换为预设信息后,寻找具有所述预设信息的第二目标条目,并读取所述第二目标条目的第三信念值;根据所述第一信念值和所...
【专利技术属性】
技术研发人员:钱小一,刘逸川,江冠斌,陈美如,陈浩,
申请(专利权)人:杭州北冥星眸科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。