一种电商评论多类目多客户快速定制化模型的方法和装置制造方法及图纸

技术编号:21399092 阅读:25 留言:0更新日期:2019-06-19 07:01
本发明专利技术涉及一种电商评论多类目多客户快速定制化模型的方法和装置,所述的电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤:第一:最低粒度标签的构建,第二:深度神经网络模型训练模块的构建,第三:深度神经网络模型标注模块的构建。其优点表现在:本发明专利技术为商家定制模型时中遇到的问题,按照本发明专利技术的方法处理,满足了商家对自有品牌定制化的需求,高效的解决了快速训练,标注,标签命名不同等问题。

【技术实现步骤摘要】
一种电商评论多类目多客户快速定制化模型的方法和装置
本专利技术涉及自然语言处理
,具体地说,是一种电商评论多类目多客户快速定制化模型的方法和装置。
技术介绍
近年来,随着信息技术以及互联网的蓬勃发展,我国网购市场发展迅猛,越来越多的人通过电商网站来了解产品信息、购买商品并通过评价表达自己购买商品过程的感受、对购买商品的满意程度和对所购商品的建议和要求等。一方面,消费者在网购时无法直接接触实际商品,只能根据电商平台提供的文字、图片等描述性信息以及历史消费者发表的评论文本了解商品、商家、品牌的基本特征。另一方面,用户产生的商品评论对于消费者购买商品改进商品都有着很重要的参考价值,但是商家、品牌方也无法直接接触消费者,只能根据历史消费者发表评论文本分析消费者的喜好,对产品设计、销售策略进行调整。然而,随着时间及历史的推移,电商平台积聚的评论文本信息不断膨胀,碎片化、海量化特征日趋明显,采用人工的方式对电商评论文本进行情感分析需要消耗大量的人力、物力,而现有的评论总结技术大多是基于评论中高频词语的聚类和相应评论的情感词标注,来生成重要的总结性词语或者短语,借以概括大家对某个商品的观点、反映某商品的特性,从而为消费者购买和商家改进产品提供参考。因此大多现有的评论总结技术还停留在短语级别,对于消费者和商家的参考价值有限,现有的电商平台对产品的评论的挖掘利用尚不充分。通过关键词,否定词和程度副词,领域词典来构建模型,并通过词性,语法成分分词后生成特征向量,通过模型训练得到观点结果。该方案遇到的问题是每个商家拥有自己独特的评论数据,例如斯凯奇用户有形容产品“踩屎感”的标签,在其他鞋类不具有这类特性,那么在斯凯奇品牌就需要加入该标签。运动类对于有型属于外观漂亮,而服饰类有型属于设计好。现有的解决方案只能解决通用问题,不能服务于商家独特的标签以及不同类目分类定义。中国专利文献:CN108256968A,公开日:2018.07.06,公开了一种电商平台商品专家评论生成方法,提出一种基于序列到序列生成模型的专家评论总结生成技术,提取某商品所有用户评论中的重要信息,生成一段总结性的话语来描述商品的特性。消费者可以根据生成的专家评论来了解商品的优缺点,考虑是否购买;商家可根据生成的专家评论来改进自己的商品。中国专利文献:CN109101478A,公开日:2018.12.28,公开了一种面向电商评论文本的Aspect级情感分析方法。首先,对电商评论文本进行预处理,并按照其所属的商品、商家、品牌进行分批;接着,在一批电商评论文本内部,综合考虑词性、句法及共现性特征,对候选评价对象的重要性进行排序,抽取电商评论文本中的评价对象;然后,利用动态滑动窗口机制将词项间共现限定在评论段级,并基于LDA模型对这一批电商评论文本中的评价对象进行聚类,得到评论Aspect-评价对象间对应关系;最后,基于构建的情感词典、否定词典,对电商评论文本进行情感分析。但是关于本专利技术一种电商评论多类目多客户快速定制化模型的方法和装置目前还未见报道。
技术实现思路
本专利技术的目的是在于帮助商家定制化和快速建模。商家希望通过客户反馈来有针对性的的迭代产品,然而现有解决方案都是一个问题一个解决方案,开发周期较长,不能快速有效的解决用户少量的定制化需求,本专利技术要解决的课题就是快速帮助不同用户建模,例如:运动类目定义为外观漂亮,服饰类目对其中一部分定义为设计好,另一部分依旧是外观漂亮;A客户认为脱胶需要单独标签,B客户认为统一放到做工粗糙;A客户关注“踩屎感”标签,B客户根本没有关注该标签;这些不同的客户不同的要求,本专利技术可以满足各个客户不同的要求。为实现上述目的,本专利技术采取的技术方案是:所述的电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤:第一:最低粒度标签的构建:S11.根据实际情况将训练集拆分成最低粒度标签,任意类目店铺需要的标签都可由最低粒度的标签组合而成,若不能组合,说明非最低粒度,需要继续拆分;S12.根据新类目的引入会提出新的需求,导致原先最低粒度的标签不再是最低粒度,需按照11的方式拆分成最低粒度,例:AB是配送快,当前最低粒度;新用户提出发货快和送货快的概念,则需要将原AB分拆成A发货快,B送货快;A和B就是新的最低粒度,AB不是;第二:深度神经网络模型训练模块的构建:S21.将S12的数据使用卷积神经网络进行训练,使用训练好的词向量,将分词结果转换为词向量;S22.将转换后的词向量,使用2,3,4,5四种过滤器,分别做卷积与最大池化;S23.定义损失函数,做全连接层进行sigmoid回归输出多分类概率;S24.使用Adam优化算法训练,保存模型;第三:深度神经网络模型标注模块的构建:S31.将评论数据分句,每个子句做为输入文本;S32.读取训练模型,将子句文本转化为标签分类概率,取大于0.5概率的标签;S33.将子句组合成原句,并保存子句标签;第四:标签聚合模块的构建:S41.根据类目按图2所示构建pool表,通过最低粒度汇聚成标签。通过flag表示哪些是类目通用标签,包含所有店铺的,flag为N表示辅助标签不显示;S42.构建change_name表,根据不同店铺需要设定转换需要改名的标签;S43.构建label_hide表,根据不同店铺,隐藏非本店关注的类目通用标签。所述步骤S12中,根据新增的定制化标签,检测是否含有当前最低粒度不可汇聚而成的标签,有则需要将原有粒度拆分至最低粒度至可汇聚成新标签。所述步骤S41中,设计了一个方法,按每个类目设定具体的标签汇总方案,并显示通用标签模型,隐藏辅助标签。所述步骤S42中,设计了一个方法,通过change_name表找到哪些客户需要对通用标签改名成符合自己的名字。所述步骤S43中,设计了一个方法,通过label_hide表找到哪些标签对客户隐藏。本专利技术优点在于:1、本专利技术为商家定制模型时中遇到的问题,按照本专利技术的方法处理,满足了商家对自有品牌定制化的需求,高效的解决了快速训练,标注,标签命名不同等问题。2、一次模型训练,适用多个定制化模型,而不是建立多个训练模型,简化了训练过程,不同类目使用不同的类目标签,更贴合类目现状,能给消费者一个方向的保证,也能给消费商家减少更多的商品纠纷。3、解决了不同客户提出不同的命名方式,无需让客户强制接受当前命名,使客户想要的名字更加多元化,使客户和商家更容易接受的命名。4、店铺有自己独有的标签,其他店铺隐藏不可见,反映出商品的本质特性,对于深入了解商品的特性有着重要意义,节省了大量开支,从而减低了商品的成本。5、层次性好,逻辑性强,符合传统应用的习惯,使消费者更容易接受,又便于计算机处理,使用过范围最为广泛。附图说明附图1是一种电商评论多类目多客户快速定制化模型方法和装置的整体流程图。附图2是一种电商评论多类目多客户快速定制化模型方法和装置的pool表。具体实施方式下面结合附图对本专利技术提供的具体实施方式作详细说明。附图中涉及的附图标记和组成部分如下所示:实施例1请参照附图1、2,附图1是一种电商评论多类目多客户快速定制化模型方法和装置的整体流程图,附图2是一种电商评论多类目多客户快速定制化模型方法和装置的pool表。本专利技术提供的一种电商评论多类目多本文档来自技高网
...

【技术保护点】
1.一种电商评论多类目多客户快速定制化模型的方法和装置,其特征在于,所述的一种电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤:第一:最低粒度标签的构建:S11.根据实际情况将训练集拆分成最低粒度标签,任意类目店铺需要的标签都可由最低粒度的标签组合而成,若不能组合,说明非最低粒度,需要继续拆分;S12.根据新类目的引入会提出新的需求,导致原先最低粒度的标签不再是最低粒度,需按照S11的方式拆分成最低粒度,例:AB是配送快,当前最低粒度;新用户提出发货快和送货快的概念,则需要将原AB分拆成A发货快,B送货快;A和B就是新的最低粒度,AB不是;第二:深度神经网络模型训练模块的构建:S21.将S12的数据使用卷积神经网络进行训练,使用训练好的词向量,将分词结果转换为词向量;S22.将转换后的词向量,使用2,3,4,5四种过滤器,分别做卷积与最大池化;S23.定义损失函数,做全连接层进行sigmoid回归输出多分类概率;S24.使用Adam优化算法训练,保存模型;第三:深度神经网络模型标注模块的构建:S31.将评论数据分句,每个子句做为输入文本;S32.读取训练模型,将子句文本转化为标签分类概率,取大于0.5概率的标签;S33.将子句组合成原句,并保存子句标签;第四:标签聚合模块的构建:S41.根据类目按图2所示构建pool表,通过最低粒度汇聚成标签。通过flag表示哪些是类目通用标签,包含所有店铺的,flag为N表示辅助标签不显示;S42.构建change_name表,根据不同店铺需要设定转换需要改名的标签;S43.构建label_hide表,根据不同店铺,隐藏非本店关注的类目通用标签。...

【技术特征摘要】
1.一种电商评论多类目多客户快速定制化模型的方法和装置,其特征在于,所述的一种电商评论多类目多客户快速定制化模型方法和装置包括以下主要步骤:第一:最低粒度标签的构建:S11.根据实际情况将训练集拆分成最低粒度标签,任意类目店铺需要的标签都可由最低粒度的标签组合而成,若不能组合,说明非最低粒度,需要继续拆分;S12.根据新类目的引入会提出新的需求,导致原先最低粒度的标签不再是最低粒度,需按照S11的方式拆分成最低粒度,例:AB是配送快,当前最低粒度;新用户提出发货快和送货快的概念,则需要将原AB分拆成A发货快,B送货快;A和B就是新的最低粒度,AB不是;第二:深度神经网络模型训练模块的构建:S21.将S12的数据使用卷积神经网络进行训练,使用训练好的词向量,将分词结果转换为词向量;S22.将转换后的词向量,使用2,3,4,5四种过滤器,分别做卷积与最大池化;S23.定义损失函数,做全连接层进行sigmoid回归输出多分类概率;S24.使用Adam优化算法训练,保存模型;第三:深度神经网络模型标注模块的构建:S31.将评论数据分句,每个子句做为输入文本;S32.读取训练模型,将子句文本转化为标签分类概率,取大于0.5概率的标签;S33.将子句组合成原句,并保存子...

【专利技术属性】
技术研发人员:李平章王航丁丁郑圆
申请(专利权)人:上海宝尊电子商务有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1