一种文本数据的处理终端查找方法技术

技术编号:36932681 阅读:31 留言:0更新日期:2023-03-22 18:55
本发明专利技术涉及文本数据处理技术领域,公开了一种文本数据的处理终端查找方法,在实际使用时,本发明专利技术提前依据文本数据的类别生成对应的规则处理器,每个规则处理器中包括处理终端,当有文本数据输入时,先提前判断出与文本数据对应的子分类号,然后对子分类号进行过滤得到有用子分类号,接着依据有用子分类号分配对应的规则处理器,然后在所有规则处理器中确定有用规则处理器,然后分别计算有用规则处理器中的处理终端的处理规则的配置标签集合与文本数据的文本数标签集合的相似度,并基于相似度为每个处理终端生成一个总得分值,通过将总得分值最大的处理终端作为数据处理终端,从而可以替代人工进行文本数据的处理对象查找,提高了查找效率。了查找效率。了查找效率。

【技术实现步骤摘要】
一种文本数据的处理终端查找方法


[0001]本专利技术涉及文本数据处理
,具体涉及一种文本数据的处理终端查找方法。

技术介绍

[0002]在事务处理系统中,用户大多先在输入界面输入文本数据,然后工作人员基于文本数据进行分类,按照文本数据的类别将文本数据分发到对应的处理终端上进行处理,具体步骤如下:先人工判断文本数据所属的主分类号,然后根据其所属的主分类号进行数据分类;接着人工根据文本数据的主分类号查看文本数据内容,并依据经验确定文本数据的子分类号;然后人工依据子分类号进行任务派发,将文本数据发送到派发部门,派发部门接收到文本数据后依据文本数据的主分类号查看文本内容来确定文本数据的处理部门,处理部门对文本数据进行处理。然而这种处理方式在实际使用时存在以下不足:一方面都是通过人工判断,则需要大量的人工投入,导致效率较低;另外一方面,由于文本数据存在表述不准的可能性,会出现一定的误判可能性。

技术实现思路

[0003]在鉴于
技术介绍
的不足,本专利技术是提供了一种文本数据的处理终端查找方法,所要解决的技术问题是现有文本数据的处理终端的查找都是通过人工完成,效率较低。
[0004]为解决以上技术问题,本专利技术提供了如下技术方案:一种文本数据的处理终端查找方法,先依据文本数据的主分类号中的子分类号生成对应的规则处理器,每个规则处理器中包括至少一个处理终端,一个处理终端中设有对应的处理规则;包括以下步骤:S1:先获取所述文本数据的主分类号,然后在所述主分类号的所有子分类号中查找所述文本数据对应的子分类号;S2:对所述文本数据对应的子分类号进行过滤,将所述文本数据对应的子分类号中与所述文本数据不匹配的子分类号去除掉,剩余的子分类号作为有用子分类号;S3:先基于所述有用子分类号分配规则处理器,然后在所有规则处理器中查找与所述文本数据相匹配的规则处理器,将与所述文本数据相匹配的规则处理器作为有用规则处理器;S4:获取所述有用规则处理器中的每个处理终端的处理规则的配置标签,并将每个处理规则的所有配置标签作为一个配置标签集合;对所述文本数据进行标签提取,获取文本数据的所有文本标签,将所有文本标签生成为文本标签集合;S5:对每个配置标签集合依次进行以下处理:依次选取配置标签集合中的一个配置标签,计算选取的配置标签与文本标签集合中与选取的配置标签所对应的文本标签的相似度;S6:对每个配置标签集合依次进行以下处理:判断配置标签集合中的每个配置标
签的相似度是否大于判定阈值,如果大于则将该相似度乘以配置权重得到该配置标签的得分值,如果相似度小于判定阈值,则将该配置标签的得分值置零;S7:将配置标签集合中的所有配置标签的得分相加得到配置标签集合的总得分值;S8:将总得分最高的配置标签集合所对应的处理终端作为所述文本数据的数据处理终端。
[0005]在某种实施方式中,步骤S2具体如下:S20:对每个所述文本数据对应的子分类号依次进行步骤S21;S21:将文本数据和子分类号带入到配置的表达式中,通过表达式计算子分类号是否满足要求,如果满足则进行步骤S22,否则将该子分类号过滤掉,结束步骤S21;S22:判断当前子分类号是否有特征值,如果有特征值则进行步骤S23,反之则结束步骤S22;S23:通过人工智能算法提取所述文本数据的文本特征值,并判断所述文本特征值是否与所述特征值相匹配,如果匹配则结束步骤S23,反之则将该子分类号过滤掉。
[0006]在某种实施方式中,步骤S3具体如下:S30:获取所有分配的规则处理器的匹配条件;S31:判断所述文本数据是否满足所述分配的规则处理器的匹配条件,如果满足则将满足的规则处理器作为有用规则处理器。
[0007]在某种实施方式中,在步骤S7中,当得到配置标签集合的总得分值时,将配置标签集合对应的处理规则打上所述总得分值,生成判断数据包,并将判断数据包存入总分集合中;步骤S8中,遍历所述总分集合中的判断数据包,在所述总分集合中查找总得分值最大的判断数据包,并将总得分值最大的判断数据包中的处理规则所对应的处理终端作为数据处理终端。
[0008]在某种实施方式中,所述规则处理器通过样本数据训练得到。
[0009]在某种实施方式中,还包括步骤S9,步骤S9如下:S9:获取所述数据处理终端中的处理规则,通过所述数据处理终端中的处理规则对所述文本数据进行处理,并将处理后的数据保存到数据库中。
[0010]本专利技术与现有技术相比所具有的有益效果是:本专利技术提前依据文本数据的类别生成对应的规则处理器,每个规则处理器中包括处理终端,当有文本数据输入时,先提前判断出与文本数据对应的子分类号,然后对子分类号进行过滤得到有用子分类号,接着依据有用子分类号分配对应的规则处理器,然后在所有规则处理器中确定有用规则处理器,然后分别计算有用规则处理器中的处理终端的处理规则的配置标签集合与文本数据的文本数标签集合的相似度,并基于相似度为每个处理终端生成一个总得分值,通过将总得分值最大的处理终端作为数据处理终端,从而可以替代人工进行文本数据的处理对象查找,提高了查找效率。
附图说明
[0011]图1为实施例中的本专利技术的流程图;图2为实施例中的本专利技术的步骤S2的流程图;
图3为实施例中的本专利技术的步骤S3的流程图。
具体实施方式
[0012]现在结合附图对本专利技术作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本专利技术的基本结构,因此其仅显示与本专利技术有关的构成。
[0013]一种文本数据的处理终端查找方法,先依据文本数据的主分类号中的子分类号生成对应的规则处理器,每个规则处理器中包括至少一个处理终端,一个处理终端中设有对应的处理规则,处理规则用于对文本数据进行处理,在实际使用时,为了便于文本数据匹配到对应的处理终端,每个处理规则都设有配置标签。另外,本实施例中,规则处理器通过样本数据训练得到,通过不断的增加样本数量和样本类型可以得到更多不同的规则处理器,从而能对更多文本数据进行处理。另外为了能依据文本数据查找到对应的规则处理器,每个规则处理器都设置有对应的匹配条件。
[0014]如图1所示,本专利技术包括以下步骤:S1:先获取文本数据的主分类号,然后在主分类号的所有子分类号中查找文本数据对应的子分类号。
[0015]在实际使用时,主分类号是文本数据的大类,例如可以是教育、行政、环境和公共卫生等类别;子分类号是文本数据的小类,以环境这个主分类号为例,其下面可以有空气污染、河流污染、森林砍伐等多个子分类号。
[0016]在实际使用时,可以通过人工智能算法对文本数据进行关键词提取来得到文本数据的主分类号和子分类号。
[0017]在实际使用时,步骤S1得到的文本数据的主分类号为一个,但是得到的文本数据的子分类号可能有两个以上。
[0018]S2:对文本数据对应的子分类号进行过滤,将文本数据对应的子分类号中与文本数据不匹配的子分类号去除掉,剩余的子分类号作为有用子分类号。
[0019]在实际使用时,步骤S1中获得的文本数据的所有子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本数据的处理终端查找方法,其特征在于,先依据文本数据的子分类号生成对应的规则处理器,每个规则处理器中包括至少一个处理终端,一个处理终端中设有对应的处理规则;包括以下步骤:S1:先获取所述文本数据的主分类号,然后在所述主分类号的所有子分类号中查找所述文本数据对应的子分类号;S2:对所述文本数据对应的子分类号进行过滤,将所述文本数据对应的子分类号中与所述文本数据不匹配的子分类号去除掉,剩余的子分类号作为有用子分类号;S3:先基于所述有用子分类号分配规则处理器,然后在所有分配的规则处理器中查找与所述文本数据相匹配的规则处理器,将与所述文本数据相匹配的规则处理器作为有用规则处理器;S4:获取所述有用规则处理器中的每个处理终端的处理规则的配置标签,并将每个处理规则的所有配置标签作为一个配置标签集合;对所述文本数据进行标签提取,获取文本数据的文本标签,将文本标签生成为文本标签集合;S5:对每个配置标签集合依次进行以下处理:依次选取配置标签集合中的一个配置标签,计算选取的配置标签与文本标签集合中与选取的配置标签所对应的文本标签的相似度;S6:对每个配置标签集合依次进行以下处理:判断配置标签集合中的每个配置标签的相似度是否大于判定阈值,如果大于则将该相似度乘以配置权重得到该配置标签的得分值,如果相似度小于判定阈值,则将该配置标签的得分值置零;S7:将配置标签集合中的所有配置标签的得分相加得到配置标签集合的总得分值;S8:将总得分最高的配置标签集合所对应的处理终端作为所述文本数据的数据处理终端。2.根据权利要求1所述的一种文本数据的处理终端查找方法,其特征在于,步骤S2具体如下:S20:对每个...

【专利技术属性】
技术研发人员:柴亚团陈思远
申请(专利权)人:无锡容智技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1