文本数据的分类方法、设备及存储介质技术

技术编号：31228126 阅读：15 留言：0更新日期：2021-12-08 09:38

本发明专利技术实施例提供一种文本数据的分类方法、设备及存储介质，通过获取待分类的目标物品的评价文本数据，输入预设的分类模型；通过分类模型，获取评价文本数据对应的文本词序列的词向量矩阵，对词向量矩阵分别以不同的滤波单元处理获取第一特征向量和第二特征向量，并融合得到融合特征向量，根据融合特征向量确定评价文本数据的分类结果；根据分类结果对目标物品进行标注和/或将分类结果发送给目标终端设备。本发明专利技术实施例通过分类模型实现对评价文本数据的分类，且在分类过程中通过提取评价文本数据的融合特征向量，考虑更多评价文本数据的特征信息，提高对评价文本数据分类的准确率和召回率，降低维护难度，也无需配置繁琐的逻辑规则，便于实施。便于实施。便于实施。

全部详细技术资料下载

【技术实现步骤摘要】
文本数据的分类方法、设备及存储介质

[0001]本专利技术实施例涉及计算机
，尤其涉及一种文本数据的分类方法、设备及存储介质。

技术介绍

[0002]随着电商平台的发展，网络购物逐渐成为当下流行的元素，商品的售后服务，也由线下向线上转移。消费者可通过电商网络平台进行退换修操作，并将商品质量问题点以文本形式反馈给商家，例如评价文本。由于退换修操作也多种多样，商品质量问题点更是五花八门。电商平台将这些质量问题点归类，再呈现给商家，对于质量问题较多且质量问题严重的商品，取消活动提报、搜索降权，从而驱动商家改良商品质量，为消费者提供高质量商品。
[0003]现有技术中，对于目标物品的评价文本数据，通常通过关键词命中的方式进行评价文本数据质量问题分类，主要判断评价文本数据命中某些关键词，从而找到关键词对应的问题类型，进而对评价文本数据进行商品质量问题归类。
[0004]现有技术通过关键词命中的方式进行评价文本数据质量问题分类，维护成本高，召回率低，准确率低，并且需要繁琐的逻辑规则才能实现，不便于实施。

技术实现思路

[0005]本专利技术实施例提供一种文本数据的分类方法、设备及存储介质，用以提高评价文本数据的分类的准确率和召回率，降低维护难度，便于实施。
[0006]第一方面，本专利技术实施例提供一种文本数据的分类方法，包括：
[0007]获取待分类的目标物品的评价文本数据，并将所述评价文本数据输入预设的分类模型；
[0008]通过所述分类模型，获取所述评价文本数据...

【技术保护点】

【技术特征摘要】
1.一种文本数据的分类方法，其特征在于，包括：获取待分类的目标物品的评价文本数据，并将所述评价文本数据输入预设的分类模型；通过所述分类模型，获取所述评价文本数据对应的文本词序列的词向量矩阵，对所述词向量矩阵分别以不同的滤波单元处理获取第一特征向量和第二特征向量，并融合所述第一特征向量和所述第二特征向量得到融合特征向量，根据所述融合特征向量确定所述评价文本数据的分类结果；根据所述分类结果对所述目标物品进行标注和/或将所述分类结果发送给目标终端设备。2.根据权利要求1所述的方法，其特征在于，所述对所述词向量矩阵分别以不同的滤波单元处理获取第一特征向量和第二特征向量，包括：通过所述分类模型的第一滤波单元和第二滤波单元，分别对所述词向量矩阵进行信息提取，以分别获取所述第一特征向量和所述第二特征向量；其中所述第一特征向量为对所述词向量矩阵各维度求平均值得到的向量，所述第二特征向量为对所述词向量矩阵各维度取最大值得到的向量。3.根据权利要求1所述的方法，其特征在于，所述融合所述第一特征向量和所述第二特征向量得到融合特征向量，包括：对所述第一特征向量和所述第二特征向量进行拼接，将拼接所得的向量作为所述融合特征向量；或者将所述第一特征向量和所述第二特征向量对应维度进行加权平均处理，将加权平均结果作为所述融合特征向量。4.根据权利要求1-3任一项所述的方法，其特征在于，所述根据所述融合特征向量确定所述评价文本数据的分类结果，包括：所述通过所述分类模型的第一全连接层，根据所述融合特征向量对所述评价文本数据进行二分类，判断所述评价文本数据的类别是否为存在质量问题的类别；若为存在质量问题的类别，则通过所述分类模型的第二全连接层，根据所述融合特征向量对所述评价文本数据进行多分类，确定所述评价文本数据所属的质量问题类别。5.根据权利要求1-3任一项所述的方法，其特征在于，所述获取所述评价文本数据对应的文本词序列的词向量矩阵，包括：通过所述分类模型的分词工具，对所述评价文本数据进行分词，得到文本词序列；通过所述分类模型的嵌入层，获取所述文本词序列的词向量矩阵。6.根据权利要求5所述的方法，其特征在于，所述通过所述分类模型的嵌入层，获取所述文本词序列的词向量矩阵，包括：根...

【专利技术属性】
技术研发人员：李银锋，黄明星，周彬，田俊文，李晓敏，晏梦佳，
申请(专利权)人：北京京东世纪贸易有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人