一种反馈信息分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号：35095296 阅读：13 留言：0更新日期：2022-10-01 16:57

本发明专利技术公开了一种反馈信息分类方法、装置、电子设备及存储介质，该方法包括：对新增反馈信息对应的反馈文本进行分词处理；根据多个分词词语中每个分词词语对应多个第一类别的词频

全部详细技术资料下载

【技术实现步骤摘要】
一种反馈信息分类方法、装置、电子设备及存储介质

[0001]本专利技术涉及计算机
，特别涉及一种反馈信息分类方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网技术的发展，用户在使用终端中的应用程序时，时常会基于实际体验进行反馈，例如使用某个应用程序生成视频非常慢，那么基于该体验反馈的内容可以是“为什么我生成视频那么慢，都一天了”等反馈信息。
[0003]相关技术中，在对反馈信息进行分析时通常基于深度学习模型先对反馈信息进行分类。但是，由于反馈信息的文本长度通常只有10～15个字，仅仅基于深度学习模型从文本中提取的信息有限，从而导致相关技术对于反馈信息的分类结果不够准确、有效性较差，无法为反馈信息的后续处理提供有效的判断依据。

技术实现思路

[0004]为了解决现有技术的问题，本专利技术实施例提供了一种反馈信息分类方法、装置、电子设备及存储介质。所述技术方案如下：
[0005]一方面，提供了一种反馈信息分类方法，所述方法包括：
[0006]确定新增反馈信息对应的反馈文本，对所述反馈文本进行分词处理得到多个分词词语；
[0007]根据所述多个分词词语中每个分词词语对应多个第一类别的词频
‑
逆文档频率，确定所述新增反馈信息属于各所述第一类别的置信度，根据所述置信度最高的第一类别确定所述新增反馈信息所属的目标第一类别；
[0008]根据所述目标第一类别、每个所述分词词语在所述反馈文本中对应的句子以及在所述句子中的位置，对所述多个分...

【技术保护点】

【技术特征摘要】
1.一种反馈信息分类方法，其特征在于，所述方法包括：确定新增反馈信息对应的反馈文本，对所述反馈文本进行分词处理得到多个分词词语；根据所述多个分词词语中每个分词词语对应多个第一类别的词频
‑
逆文档频率，确定所述新增反馈信息属于各所述第一类别的置信度，根据所述置信度最高的第一类别确定所述新增反馈信息所属的目标第一类别；根据所述目标第一类别、每个所述分词词语在所述反馈文本中对应的句子以及在所述句子中的位置，对所述多个分词词语进行向量嵌入；对所述向量嵌入的结果进行编码，根据所述编码的结果进行分类得到所述新增反馈信息所属的目标第二类别；所述目标第二类别是所述目标第一类别的子级分类类别；根据所述目标第二类别、所述目标第一类别以及所述目标第二类别与所述目标第一类别之间的层级关系，生成所述新增反馈信息对应的多层级分类结果。2.根据权利要求1所述的反馈信息分类方法，其特征在于，所述对所述向量嵌入的结果进行编码，根据所述编码的结果进行分类得到所述新增反馈信息所属的目标第二类别包括：对所述向量嵌入的结果进行卷积处理，得到特征向量；基于自注意力机制对所述特征向量进行编码处理，得到编码特征向量；根据所述编码特征向量进行分类，得到所述新增反馈信息所属的目标第二类别。3.根据权利要求1所述的反馈信息分类方法，其特征在于，所述根据所述多个分词词语中每个分词词语对应多个第一类别的词频
‑
逆文档频率，确定所述新增反馈信息属于各所述第一类别的置信度，根据所述置信度最高的第一类别确定所述新增反馈信息所属的目标第一类别，包括：确定所述多个分词词语中各分词词语在所述反馈文本中的词频；根据每个所述第一类别对应的分类词信息，确定各所述分词词语对应每个所述第一类别的逆文档频率；根据每个所述分词词语的词频以及对应每个所述第一类别的逆文档频率，确定每个所述分词词语对应每个所述第一类别的词频
‑
逆文档频率；针对每个所述第一类别，确定多个所述分词词语对应所述第一类别的词频
‑
逆文档频率的和值，得到所述新增反馈信息属于所述第一类别的置信度；根据多个所述第一类别中置信度最高的第一类别，确定所述新增反馈信息所属的目标第一类别。4.根据权利要求3所述的反馈信息分类方法，其特征在于，所述方法还包括：对历史反馈文本集合中的历史反馈文本进行分词处理，得到每个所述历史反馈文本对应的分词词语；根据每个所述历史反馈文本对应的分词词语，对所述历史反馈文本集合进行层次聚类得到层次聚类结果；所述层次聚类结果包括所述多个第一类别以及每个所述第一类别的聚类簇；根据每个所述第一类别的聚类簇中历史反馈文本对应的分词词语，确定每个所述第一类别的分类词信息。
5.根据权利要求4所述的反馈信息分类方法，其特征在于，所述方法还包括：将所述历史反馈文本集合中历史反馈文本的分词词语以及所述历史反馈文本对应的第一类别输入分类模型进行类别预测，得到类别预测结果；其中，所述分类模型用于根据所述历史反馈文本的第一类别、所述历史反馈文本的每个分词词语在所述历史反馈文本中对应的句子以及在所述句子中的位置对所述历史反馈文本进行向量嵌入，并根据向量嵌入的结果预测所述历史反馈文本...

【专利技术属性】
技术研发人员：商韵怡，郑若琳，谢宗兴，韦家益，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人