工单文本内容的分析方法、系统、设备以及存储介质技术方案

技术编号:33964528 阅读:41 留言:0更新日期:2022-06-30 01:11
本申请涉及一种工单文本内容的分析方法、系统、设备以及存储介质,涉及文本信息处理的技术领域,其方法包括提取工单中的文本内容,对所述文本内容进行第一预处理;基于训练好的税务场景分类模型,对第一预处理后的文本内容进行税务场景分类,得到税务场景种类;基于训练好的税务诉求分类模型,对第一预处理后的文本内容进行税务诉求分类,得到税务诉求种类;根据规则抽取方法,对所述工单进行要素抽取,得到要素种类。本申请具有小计算量的分析工单信息的效果。信息的效果。信息的效果。

【技术实现步骤摘要】
工单文本内容的分析方法、系统、设备以及存储介质


[0001]本申请涉及文本信息处理的
,尤其是涉及一种工单文本内容的分析方法、系统、设备以及存储介质。

技术介绍

[0002]在税务办事过程中,会产生大量工单,这些工单中包含业务内容和答复内容等信息;其中,业务内容为用户的各种提问信息;答复内容为呼叫中心座席的对用户提问的回答信息。
[0003]目前,通常采用人工分析或实体识别的方法对工单中的文本信息进行分析,确定工单的税务场景种类、税务诉求种类、系统平台、税种和票种等。但是,如果采用人工分析的方法,不仅分析量大,而且人工成本高,如果采用实体识别的方法,计算量大且精准度低。

技术实现思路

[0004]为了小计算量的分析工单信息,本申请提供一种工单文本内容的分析方法、系统、设备以及存储介质。
[0005]第一方面,本申请提供一种工单文本内容的分析方法,采用如下的技术方案:
[0006]一种工单文本内容的分析方法,包括:
[0007]提取工单中的文本内容,对所述文本内容进行第一预处理;
[0008]基于训练好的税务场景分类模型,对第一预处理后的文本内容进行税务场景分类,得到税务场景种类;
[0009]基于训练好的税务诉求分类模型,对第一预处理后的文本内容进行税务诉求分类,得到税务诉求种类;
[0010]根据规则抽取方法,对所述工单进行要素抽取,得到要素种类。
[0011]通过采用上述技术方案,利用税务场景分类模型、税务诉求分类模型和规则抽取方法,自动对工单进行分析处理,得到税务场景种类、税务诉求种类和要素种类(要素种类包括系统平台、税种和票种),在节省计算量的同时,提升税务场景种类、税务诉求种类和要素种类的分类精度。
[0012]优选的,所述税务场景分类模型的训练方法,包括:
[0013]采集样本,对所述样本进行第二预处理;
[0014]设置损失函数和损失权重,基于第二预处理后的样本、损失函数和损失权重对所述税务场景分类模型进行训练和优化。
[0015]通过采用上述技术方案,对样本进行第二预处理,使第二预处理后的样本更好的适用于作为税务场景分类模型的输入;基于损失函数和损失权重的配合使用,提升税务场景分类模型对税务场景种类的分类精度。
[0016]优选的,所述税务诉求分类模型的训练方法,包括:
[0017]采集样本,对所述样本进行第二预处理;
[0018]设置损失函数和损失权重,基于第二预处理后的样本、损失函数和损失权重对所述税务诉求分类模型进行训练和优化。
[0019]通过采用上述技术方案,对样本进行第二预处理,使第二预处理后的样本更好的适用于作为税务诉求分类模型的输入;基于损失函数和损失权重的配合使用,提升税务诉求分类模型对税务诉求种类的分类精度。
[0020]优选的,所述根据规则抽取方法,对所述工单进行要素抽取,得到要素种类,包括:
[0021]根据工单中的已有字段,在工单中抽取关键词;
[0022]若没有抽取到关键词,则根据所述文本内容和构建的要素码表,获取关键词;
[0023]判断关键词是否为俗称;
[0024]若是,则将关键词转换为专业词,所述专业词为要素种类;
[0025]若否,则关键词为要素种类。
[0026]通过采用上述技术方案,通过已有字段和要素码表抽取关键字,并将关键字转换为专业词,本申请通过这种方法抽取工单中的要素种类信息,辅助呼叫中心座席更详细了解来电人咨询的问题和当前的税务状况。
[0027]优选的,在所述基于训练好的税务场景分类模型,对第一预处理后的文本内容进行税务场景分类,得到税务场景种类之后,还包括:
[0028]根据所述文本内容和税务场景种类,构建第一框架表。
[0029]通过采用上述技术方案,构建第一框架表,直观明了的展示文本内容和对应的税务场景种类,方便用户了解详情。
[0030]优选的,在所述基于训练好的税务诉求分类模型,对第一预处理后的文本内容进行税务诉求分类,得到税务诉求种类之后,还包括:
[0031]根据所述文本内容和税务诉求种类,构建第二框架表。
[0032]通过采用上述技术方案,构建第二框架表,直观明了的展示文本内容和对应的税务诉求种类,方便用户了解详情。
[0033]优选的,在所述根据规则抽取方法,对所述工单进行要素抽取,得到要素种类之后,还包括:
[0034]根据所述文本内容、税务场景种类、税务诉求种类和要素种类,构建第三框架表。
[0035]通过采用上述技术方案,构建第三框架表,直观明了的展示文本内容和对应的税务场景种类、税务诉求种类、要素种类,方便用户了解详情。
[0036]第二方面,本申请提供一种工单文本内容的分析系统,采用如下的技术方案:
[0037]一种工单文本内容的分析系统,包括,
[0038]文本内容提取模块,用于提取工单中的文本内容,对所述文本内容进行第一预处理;
[0039]税务场景分类模块,用于基于训练好的税务场景分类模型,对第一预处理后的文本内容进行税务场景分类,得到税务场景种类;
[0040]税务诉求分类模块,用于基于训练好的税务诉求分类模型,对第一预处理后的文本内容进行税务诉求分类,得到税务诉求种类;以及,
[0041]要素抽取模块,用于根据规则抽取方法,对所述工单进行要素抽取,得到要素种类。
[0042]第三方面,本申请提供一种计算机设备,采用如下的技术方案:
[0043]一种计算机设备,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行第一方面任一项所述的工单文本内容的分析方法的计算机程序。
[0044]第四方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
[0045]一种计算机可读存储介质,存储有能够被处理器加载并执行第一方面任一项所述的工单文本内容的分析方法的计算机程序。
附图说明
[0046]图1是本申请实施例提供的工单文本内容的分析方法的流程示意图。
[0047]图2是本申请实施例提供的字段A、字段B、业务内容和答复内容的示意图。
[0048]图3是本申请实施例提供的工单文本内容的分析系统的结构框图。
[0049]图4是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
[0050]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0051]本实施例提供一种工单文本内容的分析方法,如图1所示,该方法的主要流程描述如下(步骤S101~S104):
[0052]步骤S101:提取工单中的文本内容,对文本内容进行第一预处理。
[0053]本实施例中,查询工单中文本内容所在的字段,提取字段下的文本内容;其中,工单可以为调研的公司内部税本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工单文本内容的分析方法,其特征在于,包括:提取工单中的文本内容,对所述文本内容进行第一预处理;基于训练好的税务场景分类模型,对第一预处理后的文本内容进行税务场景分类,得到税务场景种类;基于训练好的税务诉求分类模型,对第一预处理后的文本内容进行税务诉求分类,得到税务诉求种类;根据规则抽取方法,对所述工单进行要素抽取,得到要素种类。2.根据权利要求1所述的方法,其特征在于,所述税务场景分类模型的训练方法,包括:采集样本,对所述样本进行第二预处理;设置损失函数和损失权重,基于第二预处理后的样本、损失函数和损失权重对所述税务场景分类模型进行训练和优化。3.根据权利要求1所述的方法,其特征在于,所述税务诉求分类模型的训练方法,包括:采集样本,对所述样本进行第二预处理;设置损失函数和损失权重,基于第二预处理后的样本、损失函数和损失权重对所述税务诉求分类模型进行训练和优化。4.根据权利要求1所述的方法,其特征在于,所述根据规则抽取方法,对所述工单进行要素抽取,得到要素种类,包括:根据工单中的已有字段,在工单中抽取关键词;若没有抽取到关键词,则根据所述文本内容和构建的要素码表,获取关键词;判断关键词是否为俗称;若是,则将关键词转换为专业词,所述专业词为要素种类;若否,则关键词为要素种类。5.根据权利要求1所述的方法,其特征在于,在所述基于训练好的税务场景分类模型,对第一预处理后的文...

【专利技术属性】
技术研发人员:张子墨周航宋志远
申请(专利权)人:北京零点有数数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1