一种电商评论多类目多客户快速定制化模型的方法和装置制造方法及图纸

技术编号：21399092 阅读：25 留言：0更新日期：2019-06-19 07:01

本发明专利技术涉及一种电商评论多类目多客户快速定制化模型的方法和装置，所述的电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤：第一：最低粒度标签的构建，第二：深度神经网络模型训练模块的构建，第三：深度神经网络模型标注模块的构建。其优点表现在：本发明专利技术为商家定制模型时中遇到的问题，按照本发明专利技术的方法处理，满足了商家对自有品牌定制化的需求，高效的解决了快速训练，标注，标签命名不同等问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种电商评论多类目多客户快速定制化模型的方法和装置
本专利技术涉及自然语言处理
，具体地说，是一种电商评论多类目多客户快速定制化模型的方法和装置。
技术介绍
近年来，随着信息技术以及互联网的蓬勃发展，我国网购市场发展迅猛，越来越多的人通过电商网站来了解产品信息、购买商品并通过评价表达自己购买商品过程的感受、对购买商品的满意程度和对所购商品的建议和要求等。一方面，消费者在网购时无法直接接触实际商品，只能根据电商平台提供的文字、图片等描述性信息以及历史消费者发表的评论文本了解商品、商家、品牌的基本特征。另一方面，用户产生的商品评论对于消费者购买商品改进商品都有着很重要的参考价值，但是商家、品牌方也无法直接接触消费者，只能根据历史消费者发表评论文本分析消费者的喜好，对产品设计、销售策略进行调整。然而，随着时间及历史的推移，电商平台积聚的评论文本信息不断膨胀，碎片化、海量化特征日趋明显，采用人工的方式对电商评论文本进行情感分析需要消耗大量的人力、物力，而现有的评论总结技术大多是基于评论中高频词语的聚类和相应评论的情感词标注，来生成重要的总结性词语或者短语，借以概括大家对某个商品的观点、反映某商品的特性，从而为消费者购买和商家改进产品提供参考。因此大多现有的评论总结技术还停留在短语级别，对于消费者和商家的参考价值有限，现有的电商平台对产品的评论的挖掘利用尚不充分。通过关键词，否定词和程度副词，领域词典来构建模型，并通过词性，语法成分分词后生成特征向量，通过模型训练得到观点结果。该方案遇到的问题是每个商家拥有自己独特的评论数据，例如斯凯奇用户有形容产品“踩屎感”...

【技术保护点】
1.一种电商评论多类目多客户快速定制化模型的方法和装置，其特征在于，所述的一种电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤：第一：最低粒度标签的构建：S11.根据实际情况将训练集拆分成最低粒度标签，任意类目店铺需要的标签都可由最低粒度的标签组合而成，若不能组合，说明非最低粒度，需要继续拆分；S12.根据新类目的引入会提出新的需求，导致原先最低粒度的标签不再是最低粒度，需按照S11的方式拆分成最低粒度，例：AB是配送快，当前最低粒度；新用户提出发货快和送货快的概念，则需要将原AB分拆成A发货快，B送货快；A和B就是新的最低粒度，AB不是；第二：深度神经网络模型训练模块的构建：S21.将S12的数据使用卷积神经网络进行训练，使用训练好的词向量，将分词结果转换为词向量；S22.将转换后的词向量，使用2，3，4，5四种过滤器，分别做卷积与最大池化；S23.定义损失函数，做全连接层进行sigmoid回归输出多分类概率；S24.使用Adam优化算法训练，保存模型；第三：深度神经网络模型标注模块的构建：S31.将评论数据分句，每个子句做为输入文本；S32.读取训练模型，将子句文本转化...

【技术特征摘要】
1.一种电商评论多类目多客户快速定制化模型的方法和装置，其特征在于，所述的一种电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤：第一：最低粒度标签的构建：S11.根据实际情况将训练集拆分成最低粒度标签，任意类目店铺需要的标签都可由最低粒度的标签组合而成，若不能组合，说明非最低粒度，需要继续拆分；S12.根据新类目的引入会提出新的需求，导致原先最低粒度的标签不再是最低粒度，需按照S11的方式拆分成最低粒度，例：AB是配送快，当前最低粒度；新用户提出发货快和送货快的概念，则需要将原AB分拆成A发货快，B送货快；A和B就是新的最低粒度，AB不是；第二：深度神经网络模型训练模块的构建：S21.将S12的数据使用卷积神经网络进行训练，使用训练好的词向量，将分词结果转换为词向量；S22.将转换后的词向量，使用2，3，4，5四种过滤器，分别做卷积与最大池化；S23.定义损失函数，做全连接层进行sigmoid回归输出多分类概率；S24.使用Adam优化算法训练，保存模型；第三：深度神经网络模型标注模块的构建：S31.将评论数据分句，每个子句做为输入文本；S32.读取训练模型，将子句文本转化为标签分类概率，取大于0.5概率的标签；S33.将子句组合成原句，并保存子...

【专利技术属性】
技术研发人员：李平章，王航，丁丁，郑圆，
申请(专利权)人：上海宝尊电子商务有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人