数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:25441888 阅读:18 留言:0更新日期:2020-08-28 22:29
本发明专利技术的实施例提供了一种数据处理方法、装置、电子设备以及存储介质,涉及计算机技术领域。该数据处理方法包括:获取当前商品评论数据;根据所述当前商品评论数据获得当前词向量矩阵;将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签。本发明专利技术实施例的技术方案利用训练好的联合深度学习模型能够自动给商品评论打标签,从而有利于消费者根据其个人的消费决策点去浏览对应标签下的商品评论,减少了消费者浏览商品评论的数量。

【技术实现步骤摘要】
数据处理方法、装置、电子设备及存储介质
本专利技术涉及计算机
,具体而言,涉及一种数据处理方法、数据处理装置、电子设备以及计算机可读存储介质。
技术介绍
随着互联网电子商务技术的发展,消费者购买商品的习惯逐渐从传统的线下模式转化为线上模式。当消费者决策是否从某电商网站上购买一件商品时,除了对电商平台、商品品牌、商品详情等因素的关注之外,商品评论也是消费者重点关注的方面。消费者可以从商品评论中获得最关心和渴望得到解决的消费决策需求点,例如商品的外观、性能、价格、物流、使用感受等信息。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:像一些大型电商平台,一件热销商品的评论可能达到数十万甚至上百万条,消费者要从大量的文本信息中获得消费决策需求点,不仅耗时耗力,甚至会消磨消费者的耐心,从而可能导致消费者的流失。因此,需要一种新的数据处理方法、装置、电子设备以及存储介质。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术实施例的目的在于提供一种数据处理方法、数据处理装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术中存在的商品评论数据量较多而导致的消费者无法快速获得自己感兴趣的商品评论的技术问题。根据本专利技术实施例的第一方面,提供了一种数据处理方法,包括:获取当前商品评论数据;根据所述当前商品评论数据获得当前词向量矩阵;将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签。在本专利技术的一些示例性实施例中,所述联合深度学习模型包括卷积神经网络模型,所述卷积神经网络模型包括卷积层、池化层和全连接层;其中,将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签,包括:将所述当前词向量矩阵输入至所述卷积层,输出当前局部特征向量序列;将所述当前局部特征向量序列输入至所述池化层,输出第一预设维度的句子特征向量;将所述句子特征向量输入至所述全连接层,输出第二预设维度的语义向量;其中,所述第二预设维度小于所述第一预设维度。在本专利技术的一些示例性实施例中,所述卷积层包括多个卷积核;其中,将所述当前词向量矩阵输入至所述卷积层,输出当前局部特征向量序列,包括:将所述当前词向量矩阵分别与每个卷积核进行卷积操作,获得每个卷积核对应的语境特征;将每个卷积核对应的语境特征进行融合,获得所述当前局部特征向量序列。在本专利技术的一些示例性实施例中,所述联合深度学习模型还包括循环神经网络模型;其中,将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签,还包括:将所述语义向量输入至所述循环神经网络模型,输出所述当前商品评论数据对应的商品的各个标签的概率;对各个标签的概率进行排序,选取前k个概率最大的标签作为所述当前商品评论数据的目标标签;其中,k为大于等于1的正整数。在本专利技术的一些示例性实施例中,所述方法还包括:获取前k个最大概率的概率分布;若所述概率分布满足预设条件,则确定前k个概率最大的标签作为所述当前商品评论数据的目标标签。在本专利技术的一些示例性实施例中,所述方法还包括:若所述概率分布不满足所述预设条件,则从前k个最大概率中选取前m个最大概率;确定前m个最大概率对应的标签作为所述当前商品评论数据的目标标签;其中,m为小于等于k且大于等于1的正整数。在本专利技术的一些示例性实施例中,根据所述当前商品评论数据获得当前词向量矩阵,包括:对所述当前商品评论数据进行预处理,获得当前评论词语序列;将所述当前评论词语序列输入至训练完成的词向量模型,输出所述当前词向量矩阵。在本专利技术的一些示例性实施例中,所述方法还包括:获得训练数据集,所述训练数据集包括标注其标签的历史商品评论数据;根据所述历史商品评论数据训练所述词向量模型,并输出历史词向量矩阵;将所述历史词向量矩阵输入至所述联合深度学习模型,并根据其标注的标签对其进行训练。根据本专利技术实施例的第二方面,提供一种数据处理装置,包括:评论数据获取模块,配置为获取当前商品评论数据;向量矩阵获得模块,配置为根据所述当前商品评论数据获得当前词向量矩阵;目标标签预测模块,配置为将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签。根据本专利技术实施例的第三方面,提供一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上述任意一项所述的数据处理方法。根据本专利技术实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述的数据处理方法。上述专利技术中的一个实施例具有如下优点或有益效果:一方面,因为采用了将当前商品评论数据转换为当前词向量矩阵的技术手段,为后续联合深度学习模型进行运算提高了处理效率;另一方面,因为还采用了将该当前词向量矩阵输入至训练完成的联合深度学习模型、并利用该训练好的联合深度学习模型预测输出该当前商品评论数据的目标标签的技术手段,从而可以实现给该当前商品评论数据自动打标签的技术效果,消费者可以根据其个人的消费决策点去浏览对应标签下的商品评论,减少了消费者浏览商品评论的数量,有助于消费者快速获得自己感兴趣的商品评论,提高了消费者对商品的购买欲,可以促进消费者在电子商务平台上下单,提高电子商务平台的购买转化率,增加电子商务平台的消费者粘性,因此,能够解决现有技术中存在的商品评论数据量较多而导致的消费者无法快速获得自己感兴趣的商品评论的技术问题。上述专利技术中的另一个实施例具有如下优点或有益效果:因为采用了联合深度学习模型结合了卷积神经网络模型和循环神经网络模型的技术手段,卷积神经网络可以很好的提取输入的当前词向量矩阵包含的特征信息,同时循环神经网络模型可以通过顺序地对句子或文本进行建模来有效的考虑一个句子或是文本整体所包含的特征信息,因此,将综合卷积神经网络模型和循环神经网络模型的联合深度学习模型运用到给商品评论自动打标签上,可以提高标签的准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1示出了根据本专利技术的一些实施例的数据处理方法的流程示意图;图2示出了图1中的步骤S130的一些实施例流程示意图;图3示出了根据本专利技术另一些实施例的数据处理方法的流程示意图;图4示出了根据本专利技术又一些实施例的数据处理方法的流程示意图;图5示出了根据本发本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取当前商品评论数据;/n根据所述当前商品评论数据获得当前词向量矩阵;/n将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取当前商品评论数据;
根据所述当前商品评论数据获得当前词向量矩阵;
将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签。


2.根据权利要求1所述的数据处理方法,其特征在于,所述联合深度学习模型包括卷积神经网络模型,所述卷积神经网络模型包括卷积层、池化层和全连接层;
其中,将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签,包括:
将所述当前词向量矩阵输入至所述卷积层,输出当前局部特征向量序列;
将所述当前局部特征向量序列输入至所述池化层,输出第一预设维度的句子特征向量;
将所述句子特征向量输入至所述全连接层,输出第二预设维度的语义向量;
其中,所述第二预设维度小于所述第一预设维度。


3.根据权利要求2所述的数据处理方法,其特征在于,所述卷积层包括多个卷积核;其中,将所述当前词向量矩阵输入至所述卷积层,输出当前局部特征向量序列,包括:
将所述当前词向量矩阵分别与每个卷积核进行卷积操作,获得每个卷积核对应的语境特征;
将每个卷积核对应的语境特征进行融合,获得所述当前局部特征向量序列。


4.根据权利要求2所述的数据处理方法,其特征在于,所述联合深度学习模型还包括循环神经网络模型;其中,将所述当前词向量矩阵输入至训练完成的联合深度学习模型中,预测所述当前商品评论数据的一个或者多个目标标签,还包括:
将所述语义向量输入至所述循环神经网络模型,输出所述当前商品评论数据对应的商品的各个标签的概率;
对各个标签的概率进行排序,选取前k个概率最大的标签作为所述当前商品评论数据的目标标签;
其中,k为大于等于1的正整数。


5.根据权利要求4所述的数据处理方法,其特征在于,还包...

【专利技术属性】
技术研发人员:倪高伟
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1