一种反馈信息分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35095296 阅读:13 留言:0更新日期:2022-10-01 16:57
本发明专利技术公开了一种反馈信息分类方法、装置、电子设备及存储介质,该方法包括:对新增反馈信息对应的反馈文本进行分词处理;根据多个分词词语中每个分词词语对应多个第一类别的词频

【技术实现步骤摘要】
一种反馈信息分类方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,特别涉及一种反馈信息分类方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,用户在使用终端中的应用程序时,时常会基于实际体验进行反馈,例如使用某个应用程序生成视频非常慢,那么基于该体验反馈的内容可以是“为什么我生成视频那么慢,都一天了”等反馈信息。
[0003]相关技术中,在对反馈信息进行分析时通常基于深度学习模型先对反馈信息进行分类。但是,由于反馈信息的文本长度通常只有10~15个字,仅仅基于深度学习模型从文本中提取的信息有限,从而导致相关技术对于反馈信息的分类结果不够准确、有效性较差,无法为反馈信息的后续处理提供有效的判断依据。

技术实现思路

[0004]为了解决现有技术的问题,本专利技术实施例提供了一种反馈信息分类方法、装置、电子设备及存储介质。所述技术方案如下:
[0005]一方面,提供了一种反馈信息分类方法,所述方法包括:
[0006]确定新增反馈信息对应的反馈文本,对所述反馈文本进行分词处理得到多个分词词语;
[0007]根据所述多个分词词语中每个分词词语对应多个第一类别的词频

逆文档频率,确定所述新增反馈信息属于各所述第一类别的置信度,根据所述置信度最高的第一类别确定所述新增反馈信息所属的目标第一类别;
[0008]根据所述目标第一类别、每个所述分词词语在所述反馈文本中对应的句子以及在所述句子中的位置,对所述多个分词词语进行向量嵌入;
[0009]对所述向量嵌入的结果进行编码,根据所述编码的结果进行分类得到所述新增反馈信息所属的目标第二类别;所述目标第二类别是所述目标第一类别的子级分类类别;
[0010]根据所述目标第二类别、所述目标第一类别以及所述目标第二类别与所述目标第一类别之间的层级关系,生成所述新增反馈信息对应的多层级分类结果。
[0011]另一方面,提供了一种反馈信息分类装置,所述装置包括:
[0012]分词模块,用于确定新增反馈信息对应的反馈文本,对所述反馈文本进行分词处理得到多个分词词语;
[0013]第一分类模块,用于根据所述多个分词词语中每个分词词语对应多个第一类别的词频

逆文档频率,确定所述新增反馈信息属于各所述第一类别的置信度,根据所述置信度最高的第一类别确定所述新增反馈信息所属的目标第一类别;
[0014]第一向量嵌入模块,用于根据所述目标第一类别、每个所述分词词语在所述反馈文本中对应的句子以及在所述句子中的位置,对所述多个分词词语进行向量嵌入;
[0015]第二分类模块,用于对所述向量嵌入的结果进行编码,根据所述编码的结果进行分类得到所述新增反馈信息所属的目标第二类别;所述目标第二类别是所述目标第一类别的子级分类类别;
[0016]层级分类结果生成模块,用于根据所述目标第二类别、所述目标第一类别以及所述目标第二类别与所述目标第一类别之间的层级关系,生成所述新增反馈信息对应的多层级分类结果。
[0017]在一个示例性的实施方式中,所述第二分类模块包括:
[0018]第一卷积模块,用于对所述向量嵌入的结果进行卷积处理,得到特征向量;
[0019]第一编码模块,用于基于自注意力机制对所述特征向量进行编码处理,得到编码特征向量;
[0020]第一分类子模块,用于根据所述编码特征向量进行分类,得到所述新增反馈信息所属的目标第二类别。
[0021]在一个示例性的实施方式中,所述第一分类模块包括:
[0022]词频确定模块,用于确定所述多个分词词语中各分词词语在所述反馈文本中的词频;
[0023]逆文档频率确定模块,用于根据每个所述第一类别对应的分类词信息,确定各所述分词词语对应每个所述第一类别的逆文档频率;
[0024]词频

逆文档频率确定模块,用于根据每个所述分词词语的词频以及对应每个所述第一类别的逆文档频率,确定每个所述分词词语对应每个所述第一类别的词频

逆文档频率;
[0025]类别置信度确定模块,用于针对每个所述第一类别,确定多个所述分词词语对应所述第一类别的词频

逆文档频率的和值,得到所述新增反馈信息属于所述第一类别的置信度;
[0026]第二分类子模块,用于根据多个所述第一类别中置信度最高的第一类别,确定所述新增反馈信息所属的目标第一类别。
[0027]在一个示例性的实施方式中,所述装置还包括:
[0028]样本分词模块,用于对历史反馈文本集合中的历史反馈文本进行分词处理,得到每个所述历史反馈文本对应的分词词语;
[0029]层次聚类模块,用于根据每个所述历史反馈文本对应的分词词语,对所述历史反馈文本集合进行层次聚类得到层次聚类结果;所述层次聚类结果包括所述多个第一类别以及每个所述第一类别的聚类簇;
[0030]第一确定模块,用于根据每个所述第一类别的聚类簇中历史反馈文本对应的分词词语,确定每个所述第一类别的分类词信息。
[0031]在一个示例性的实施方式中,所述装置还包括:
[0032]类别预测模块,用于将所述历史反馈文本集合中历史反馈文本的分词词语以及所述历史反馈文本对应的第一类别输入分类模型进行类别预测,得到类别预测结果;其中,所述分类模型用于根据所述历史反馈文本的第一类别、所述历史反馈文本的每个分词词语在所述历史反馈文本中对应的句子以及在所述句子中的位置对所述历史反馈文本进行向量嵌入,并根据向量嵌入的结果预测所述历史反馈文本的类别;
[0033]模型训练模块,用于根据各所述历史反馈文本对应的类别预测结果与所述历史反馈文本对应的参考类别之间的差异,调整所述分类模型的模型参数进行迭代训练直至满足预设训练结束条件;其中,所述历史反馈文本对应的参考类别为相应第一类别的子级分类类别。
[0034]在一个示例性的实施方式中,所述类别预测模块包括:
[0035]第二向量嵌入模块,用于将所述历史反馈文本集合中历史反馈文本的分词词语以及所述历史反馈文本对应的第一类别输入至分类模型的嵌入层进行所述向量嵌入;
[0036]卷积编码模块,用于通过所述分类模型的卷积层对所述向量嵌入的结果进行卷积,将所述卷积的结果输入所述分类模型的自注意力编码层进行编码;
[0037]类别预测子模块,用于通过所述分类模型的分类层对所述编码的结果进行类别预测,得到类别预测结果。
[0038]在一个示例性的实施方式中,所述装置还包括:
[0039]展示模块,用于展示每个所述第一类别的分类词信息;
[0040]更新模块,用于响应于对任一所述第一类别的分类词信息的配置指令,更新任一所述第一类别的分类词信息。
[0041]另一方面,提供了一种电子设备,包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种反馈信息分类方法,其特征在于,所述方法包括:确定新增反馈信息对应的反馈文本,对所述反馈文本进行分词处理得到多个分词词语;根据所述多个分词词语中每个分词词语对应多个第一类别的词频

逆文档频率,确定所述新增反馈信息属于各所述第一类别的置信度,根据所述置信度最高的第一类别确定所述新增反馈信息所属的目标第一类别;根据所述目标第一类别、每个所述分词词语在所述反馈文本中对应的句子以及在所述句子中的位置,对所述多个分词词语进行向量嵌入;对所述向量嵌入的结果进行编码,根据所述编码的结果进行分类得到所述新增反馈信息所属的目标第二类别;所述目标第二类别是所述目标第一类别的子级分类类别;根据所述目标第二类别、所述目标第一类别以及所述目标第二类别与所述目标第一类别之间的层级关系,生成所述新增反馈信息对应的多层级分类结果。2.根据权利要求1所述的反馈信息分类方法,其特征在于,所述对所述向量嵌入的结果进行编码,根据所述编码的结果进行分类得到所述新增反馈信息所属的目标第二类别包括:对所述向量嵌入的结果进行卷积处理,得到特征向量;基于自注意力机制对所述特征向量进行编码处理,得到编码特征向量;根据所述编码特征向量进行分类,得到所述新增反馈信息所属的目标第二类别。3.根据权利要求1所述的反馈信息分类方法,其特征在于,所述根据所述多个分词词语中每个分词词语对应多个第一类别的词频

逆文档频率,确定所述新增反馈信息属于各所述第一类别的置信度,根据所述置信度最高的第一类别确定所述新增反馈信息所属的目标第一类别,包括:确定所述多个分词词语中各分词词语在所述反馈文本中的词频;根据每个所述第一类别对应的分类词信息,确定各所述分词词语对应每个所述第一类别的逆文档频率;根据每个所述分词词语的词频以及对应每个所述第一类别的逆文档频率,确定每个所述分词词语对应每个所述第一类别的词频

逆文档频率;针对每个所述第一类别,确定多个所述分词词语对应所述第一类别的词频

逆文档频率的和值,得到所述新增反馈信息属于所述第一类别的置信度;根据多个所述第一类别中置信度最高的第一类别,确定所述新增反馈信息所属的目标第一类别。4.根据权利要求3所述的反馈信息分类方法,其特征在于,所述方法还包括:对历史反馈文本集合中的历史反馈文本进行分词处理,得到每个所述历史反馈文本对应的分词词语;根据每个所述历史反馈文本对应的分词词语,对所述历史反馈文本集合进行层次聚类得到层次聚类结果;所述层次聚类结果包括所述多个第一类别以及每个所述第一类别的聚类簇;根据每个所述第一类别的聚类簇中历史反馈文本对应的分词词语,确定每个所述第一类别的分类词信息。
5.根据权利要求4所述的反馈信息分类方法,其特征在于,所述方法还包括:将所述历史反馈文本集合中历史反馈文本的分词词语以及所述历史反馈文本对应的第一类别输入分类模型进行类别预测,得到类别预测结果;其中,所述分类模型用于根据所述历史反馈文本的第一类别、所述历史反馈文本的每个分词词语在所述历史反馈文本中对应的句子以及在所述句子中的位置对所述历史反馈文本进行向量嵌入,并根据向量嵌入的结果预测所述历史反馈文本...

【专利技术属性】
技术研发人员:商韵怡郑若琳谢宗兴韦家益
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1