文本处理方法、系统、设备和存储介质技术方案

技术编号:37291746 阅读:11 留言:0更新日期:2023-04-21 03:22
本申请公开了一种文本处理方法、系统、设备和存储介质,方法包括:提取经预处理后的文本数据中的关键信息;根据所述关键信息确定对应的维度和对应的业务细分标签,所述维度按照预设特征要素组合构成预设优先级;根据所述预设优先级确定所述业务细分标签的准确率并输出对应的提示符。本申请的文本处理方法中关键信息之间的可以与既定的业务细分标签联系起来,能够准确的将业务细分标签进行分级确认,便于人工进行修改审核,大大提高了业务细分标签识别的准确性。签识别的准确性。签识别的准确性。

【技术实现步骤摘要】
文本处理方法、系统、设备和存储介质


本申请涉及文本处理
,特别是涉及一种文本处理方法、系统、设备和存储介质。

技术介绍

主题发现是文本处理中常用的技术,用于从文本中自动发现主题。但是当文本中信息较为分散时,重点主题词难以发现,且多个主题词之间的无法与既定的业务细分标签联系起来,识别难度较大,识别准确度较低。

技术实现思路

本申请要解决的技术问题是为了克服现有技术中文本的识别难度较大,识别准确度较低的缺陷,提供一种文本处理方法、系统、设备和存储介质。本申请是通过下述技术方案来解决上述技术问题的:本申请提供了一种文本处理方法,包括:提取经预处理后的文本数据中的关键信息;根据所述关键信息确定对应的维度和对应的业务细分标签,所述维度按照预设特征要素组合构成预设优先级;根据所述预设优先级确定所述业务细分标签的准确率并输出对应的提示符。可选的,所述根据所述关键信息确定对应的维度和对应的业务细分标签,包括:预设各个维度和每个所述维度对应的关键信息,并将所述关键信息关联到对应的业务细分标签;使用识别模型识别出所述关键信息并确定对应的维度;通过将所述关键信息与预设词语信息进行相似度计算以确定所述关键信息;输出带有预设标签和所述维度的关键信息。可选的,所述维度包括执行类、现象类和原因类;所述执行类包括执行类特征要素、所述现象类包括现象类特征要素和所述原因类包括原因类特征要素;所述维度按照预设特征要素组合构成预设优先级,包括:所述执行类特征要素优先级高于现象类特征要素优先级,所述现象类特征要素优先级高于原因类特征要素优先级。可选的,所述执行类特征要素、所述现象类特征要素和所述原因类特征要素分别对应不同的关键信息;所述根据所述预设优先级确定所述业务细分标签的准确率,包括:确定所述关键信息对应的特征信息;当所述特征信息同时包含所述执行类特征要素、所述现象类特征要素和所述原因类特征要素,且所述执行类特征要素、所述现象类特征要素和所述原因类特征要素组合符合同一业务细分标签时确定所述业务细分标签为高准确性标签;当所述特征信息同时包含所述执行类特征要素、所述现象类特征要素和所述原因类特征要素,且所述执行类特征要素、所述现象类特征要素和所述原因类特征要素不能组成同一业务细分标签时,则根据所述预设优先级打标业务细分标签,并确定所述业务细分标签为中准确性标签。可选的,所述维度还包括业务类,所述业务类还包括业务类特征要素;当所述特征信息同时缺少所述执行类特征要素、所述现象类特征要素和所述原因
类特征要素时,所述文本处理方法还包括:重新抽取所述文本数据中的业务类特征要素,并根据所述业务类特征要素出现的频次及位置打标业务细分标签,并确定所述业务细分标签为低准确性标签。可选的,所述输出对应的提示符,包括:获取所述业务细分标签的场景集合并确定所述业务细分标签的准确率高低;确认最终的业务细分标签提示,并输出对应的提示符。可选的,所述文本处理方法还包括:对输入的文本进行分词与词性标注;根据预设符号、预设语气词和预设关键词中的至少一种识别用户当前语句是询问句,并识别客服回复信息,同时对所述客服回复信息进行标注;删除无用内容并保存客服

用户文本以形成预处理后的文本数据。本申请还提供一种文本处理系统,包括:数据预处理模块,用于提取经预处理后的文本数据中的关键信息;确定模块,用于根据所述关键信息确定对应的维度和对应的业务细分标签,所述维度按照预设特征要素组合构成预设优先级;输出模块,用于根据所述预设优先级确定所述业务细分标签的准确率并输出对应的提示符。本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述方法的步骤。本申请的文本处理方法、系统、设备和存储介质,通过提取经预处理后的文本数据中的关键信息;根据所述关键信息确定对应的维度和对应的业务细分标签,所述维度按照预设特征要素组合构成预设优先级;根据所述预设优先级确定所述业务细分标签的准确率并输出对应的提示符,关键信息之间的可以与既定的业务细分标签联系起来,同时,基于业务细分标签与维度的组合识别方法,能够准确的将业务细分标签进行分级确认,便于人工进行修改审核,大大提高了业务细分标签识别的准确性,尤其是在处理标签不断增加或变化的场景中,能够准确的识别出标签工单及非标签工单,可以为后续新标签的生成收集工单信息。
附图说明
图1为本申请的一个实施例的文本处理方法的流程图;图2为本申请的一个实施例的面向对话文本的可解释性标签提取方法的流程图;图3

图5为图2中面向对话文本的可解释性标签提取方法的部分流程图;图6为本申请的一个实施例的文本处理系统的模块示意图;图7为本申请的一个实施例的面向对话文本的可解释性标签提取系统的模块示意图。
具体实施方式
下面通过实施例的方式进一步说明本申请,但并不因此将本申请限制在的实施例范围之中。如图1所示,本申请提供了一种文本处理方法的流程图,文本处理方法包括以下步骤:
步骤S101、提取经预处理后的文本数据中的关键信息;步骤S102、根据关键信息确定对应的维度和对应的业务细分标签,维度按照预设特征要素组合构成预设优先级;步骤S103、根据预设优先级确定业务细分标签的准确率并输出对应的提示符本实施例的文本处理方法,通过提取经预处理后的文本数据中的关键信息;根据关键信息确定对应的维度和对应的业务细分标签,维度按照预设特征要素组合构成预设优先级;根据预设优先级确定业务细分标签的准确率并输出对应的提示符,关键信息之间的可以与既定的业务细分标签联系起来,同时,基于业务细分标签与维度的组合识别方法,能够准确的将业务细分标签进行分级确认,便于人工进行修改审核,大大提高了业务细分标签识别的准确性,尤其是在处理标签不断增加或变化的场景中,能够准确的识别出标签工单及非标签工单,可以为后续新标签的生成收集工单信息。在可选的一种实施方式中,文本处理方法还包括:对输入的文本进行分词与词性标注;根据预设符号、预设语气词和预设关键词中的至少一种识别用户当前语句是询问句,并识别客服回复信息,同时对客服回复信息进行标注。预设符号包括问号“?”,预设语气词包括“吗”、“吧”、“呢”等,预设关键词包括“什么”、“想问”、“还没”等关键词。删除无用内容并保存客服

用户文本以形成预处理后的文本数据。具体的,删除停用词及与询问对话无关等无用内容;删除“嗯嗯”、“啊”等多个语气助词,删除特定的无关的对话内容等。本实施例中,通过上述预处理过程可以提高关键信息提取的准确性,进而提高整个文本处理结果的准确性。在可选的一种实施方式中,步骤S102中根据关键信息确定对应的维度和对应的业务细分标签包括:预设各个维度和每个维度对应的关键信息,并将关键信息关联到对应的业务细分标签。本实施例中关键信息包括关键词/短语,对每个维度的关键词/短语继进行预设,并将预设的关键词/短语关联到具体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:提取经预处理后的文本数据中的关键信息;根据所述关键信息确定对应的维度和对应的业务细分标签,所述维度按照预设特征要素组合构成预设优先级;根据所述预设优先级确定所述业务细分标签的准确率并输出对应的提示符。2.如权利要求1所述的文本处理方法,其特征在于,所述根据所述关键信息确定对应的维度和对应的业务细分标签,包括:预设各个维度和每个所述维度对应的关键信息,并将所述关键信息关联到对应的业务细分标签;使用识别模型识别出所述关键信息并确定对应的维度;通过将所述关键信息与预设词语信息进行相似度计算以确定所述关键信息;输出带有预设标签和所述维度的关键信息。3.如权利要求2所述的文本处理方法,其特征在于,所述维度包括执行类、现象类和原因类;所述执行类包括执行类特征要素、所述现象类包括现象类特征要素和所述原因类包括原因类特征要素;所述维度按照预设特征要素组合构成预设优先级,包括:所述执行类特征要素优先级高于现象类特征要素优先级,所述现象类特征要素优先级高于原因类特征要素优先级。4.如权利要求3所述的文本处理方法,其特征在于,所述执行类特征要素、所述现象类特征要素和所述原因类特征要素分别对应不同的关键信息;所述根据所述预设优先级确定所述业务细分标签的准确率,包括:确定所述关键信息对应的特征信息;当所述特征信息同时包含所述执行类特征要素、所述现象类特征要素和所述原因类特征要素,且所述执行类特征要素、所述现象类特征要素和所述原因类特征要素组合符合同一业务细分标签时确定所述业务细分标签为高准确性标签;当所述特征信息同时包含所述执行类特征要素、所述现象类特征要素和所述原因类特征要素,且所述执行类特征要素、所述现象类特征要素和所述原因类特征要素不能组成同一业务细分标签时,则根据所述预设优先级打标业务细分标签,并确...

【专利技术属性】
技术研发人员:代晓菊李铮张黎程佳骏陈国润徐玉清郑荣
申请(专利权)人:上海理想信息产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1