工单文本内容的分析方法、系统、设备以及存储介质技术方案

技术编号:33964528 阅读:60 留言:0更新日期:2022-06-30 01:11
本申请涉及一种工单文本内容的分析方法、系统、设备以及存储介质,涉及文本信息处理的技术领域,其方法包括提取工单中的文本内容,对所述文本内容进行第一预处理;基于训练好的税务场景分类模型,对第一预处理后的文本内容进行税务场景分类,得到税务场景种类;基于训练好的税务诉求分类模型,对第一预处理后的文本内容进行税务诉求分类,得到税务诉求种类;根据规则抽取方法,对所述工单进行要素抽取,得到要素种类。本申请具有小计算量的分析工单信息的效果。信息的效果。信息的效果。

【技术实现步骤摘要】
工单文本内容的分析方法、系统、设备以及存储介质


[0001]本申请涉及文本信息处理的
,尤其是涉及一种工单文本内容的分析方法、系统、设备以及存储介质。

技术介绍

[0002]在税务办事过程中,会产生大量工单,这些工单中包含业务内容和答复内容等信息;其中,业务内容为用户的各种提问信息;答复内容为呼叫中心座席的对用户提问的回答信息。
[0003]目前,通常采用人工分析或实体识别的方法对工单中的文本信息进行分析,确定工单的税务场景种类、税务诉求种类、系统平台、税种和票种等。但是,如果采用人工分析的方法,不仅分析量大,而且人工成本高,如果采用实体识别的方法,计算量大且精准度低。

技术实现思路

[0004]为了小计算量的分析工单信息,本申请提供一种工单文本内容的分析方法、系统、设备以及存储介质。
[0005]第一方面,本申请提供一种工单文本内容的分析方法,采用如下的技术方案:
[0006]一种工单文本内容的分析方法,包括:
[0007]提取工单中的文本内容,对所述文本内容进行第一预处理;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工单文本内容的分析方法,其特征在于,包括:提取工单中的文本内容,对所述文本内容进行第一预处理;基于训练好的税务场景分类模型,对第一预处理后的文本内容进行税务场景分类,得到税务场景种类;基于训练好的税务诉求分类模型,对第一预处理后的文本内容进行税务诉求分类,得到税务诉求种类;根据规则抽取方法,对所述工单进行要素抽取,得到要素种类。2.根据权利要求1所述的方法,其特征在于,所述税务场景分类模型的训练方法,包括:采集样本,对所述样本进行第二预处理;设置损失函数和损失权重,基于第二预处理后的样本、损失函数和损失权重对所述税务场景分类模型进行训练和优化。3.根据权利要求1所述的方法,其特征在于,所述税务诉求分类模型的训练方法,包括:采集样本,对所述样本进行第二预处理;设置损失函数和损失权重,基于第二预处理后的样本、损失函数和损失权重对所述税务诉求分类模型进行训练和优化。4.根据权利要求1所述的方法,其特征在于,所述根据规则抽取方法,对所述工单进行要素抽取,得到要素种类,包括:根据工单中的已有字段,在工单中抽取关键词;若没有抽取到关键词,则根据所述文本内容和构建的要素码表,获取关键词;判断关键词是否为俗称;若是,则将关键词转换为专业词,所述专业词为要素种类;若否,则关键词为要素种类。5.根据权利要求1所述的方法,其特征在于,在所述基于训练好的税务场景分类模型,对第一预处理后的文...

【专利技术属性】
技术研发人员:张子墨周航宋志远
申请(专利权)人:北京零点有数数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1