评价标签生成方法和装置、存储介质及电子设备制造方法及图纸

技术编号:26972567 阅读:40 留言:0更新日期:2021-01-06 00:04
本发明专利技术公开了一种评价标签生成方法和装置、存储介质及电子设备。其中,该方法包括:获取多个用户账号在网络平台中发布的评价文本集合;对评价文本集合中的每条评价文本分别进行分词处理,以得到评价词组集;对评价词组集中的每个评价词组进行转化,以得到评价词组匹配的评价词向量;从评价词组集中确定第一当前评价词组和第二当前评价词组;获取第一当前评价词组与第二当前评价词组之间的目标相似度,根据目标相似度与第一阈值的比对结果,得到更新后的评价词组集,在更新后的评价词组集达到标签生成条件的情况下,从更新后的评价词组集中提取用于在网络平台展示的评价标签。本发明专利技术解决了由于评价标签不准确导致的评价归属混乱的技术问题。

【技术实现步骤摘要】
评价标签生成方法和装置、存储介质及电子设备
本专利技术涉及网络
,具体而言,涉及一种评价标签生成方法和装置、存储介质及电子设备。
技术介绍
随着网络购物的发展,为便于用户对商品的评价进行有筛选的浏览,网络购物平台通常会在评价页面设置评价标签,以使用户能够通过点击标签进行相应分类的评价浏览,快速获取对应的评价信息。在现有技术中,通常会为评价标签设置固定的分类,从而将包含有该标签分类的评价归属到该评价标签中。但随着评价数目的增多,评论内容的新颖化,评价标签的生成受限,会导致评价只能归于某一类现有的评价标签中,使得评价标签的分类不够准确,从而导致评价归属混乱的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种评价标签生成方法和装置、存储介质及电子设备,以至少解决由于评价标签不准确导致的评价归属混乱的技术问题。根据本专利技术实施例的一个方面,提供了一种评价标签生成方法,包括:获取多个用户账号在网络平台中发布的评价文本集合;对上述评价文本集合中的每条评价文本分别进行分词处本文档来自技高网...

【技术保护点】
1.一种评价标签生成方法,其特征在于,包括:/n获取多个用户账号在网络平台中发布的评价文本集合;/n对所述评价文本集合中的每条评价文本分别进行分词处理,以得到评价词组集;/n对所述评价词组集中的每个评价词组进行转化,以得到所述评价词组匹配的评价词向量;/n重复执行以下步骤,直至达到标签生成条件:/n从所述评价词组集中确定出两个评价词组,作为第一当前评价词组和第二当前评价词组;/n获取所述第一当前评价词组与所述第二当前评价词组之间的目标相似度,其中,所述目标相似度根据用于指示评价词组之间的相似性的第一相似度和用于指示评价词向量之间的相似性的第二相似度来确定;/n根据所述目标相似度与第一阈值的比对...

【技术特征摘要】
1.一种评价标签生成方法,其特征在于,包括:
获取多个用户账号在网络平台中发布的评价文本集合;
对所述评价文本集合中的每条评价文本分别进行分词处理,以得到评价词组集;
对所述评价词组集中的每个评价词组进行转化,以得到所述评价词组匹配的评价词向量;
重复执行以下步骤,直至达到标签生成条件:
从所述评价词组集中确定出两个评价词组,作为第一当前评价词组和第二当前评价词组;
获取所述第一当前评价词组与所述第二当前评价词组之间的目标相似度,其中,所述目标相似度根据用于指示评价词组之间的相似性的第一相似度和用于指示评价词向量之间的相似性的第二相似度来确定;
根据所述目标相似度与第一阈值的比对结果,更新所述评价词组集,得到更新后的所述评价词组集,并从更新后的所述评价词组集中确定出下一组所述第一当前评价词组和所述第二当前评价词组;
在更新后的所述评价词组集达到所述标签生成条件的情况下,从更新后的所述评价词组集中提取用于在所述网络平台展示的所述评价标签。


2.根据权利要求1所述的方法,其特征在于,所述根据所述目标相似度与第一阈值的比对结果,更新所述评价词组集,得到更新后的所述评价词组集,并从更新后的所述评价词组集中确定出下一组所述第一当前评价词组和所述第二当前评价词组包括:
在所述目标相似度大于等于所述第一阈值的情况下,将所述第一当前评价词组与所述第二当前评价词组合并,作为评价词组子集,以更新所述评价词组集,得到更新后的所述评价词组集;从更新后的所述评价词组集中确定出下一组所述第一当前评价词组和所述第二当前评价词组;
在所述目标相似度小于所述第一阈值的情况下,保留所述第一当前评价词组与所述第二当前评价词组,并从所述评价词组集中获取下一个评价词组作为新的所述第二当前评价词组,继续获取所述第一当前评价词组与新的所述第二当前评价词组之间的所述目标相似度。


3.根据权利要求1所述的方法,其特征在于,所述获取所述第一当前评价词组与所述第二当前评价词组之间的目标相似度包括:
获取所述第一相似度及所述第二相似度,其中,所述第一相似度包括:用于指示所述第一当前评价词组与所述第二当前评价词组之间的编辑距离的编辑相似度,和用于指示所述第一当前评价词组与所述第二当前评价词组中共同出现的字符的数量的共现相似度,所述第二相似度包括:用于指示所述第一当前评价词组对应的第一当前评价词向量和所述第二当前评价词组对应的第二当前评价词向量之间的余弦距离的向量相似度;
根据所述编辑相似度、所述共现相似度及所述向量相似度的加权求和结果,确定所述目标相似度。


4.根据权利要求1所述的方法,其特征在于,所述在更新后的所述评价词组集达到所述标签生成条件的情况下,从更新后的所述评价词组集中提取用于在所述网络平台展示的所述评价标签包括:
从更新后的所述评价词组集中确定出评价对象,其中,所述评价对象包括所述评价词组子集中的目标评价词组和所述评价词组集中未被合并的对象评价词组,所述目标评价词组为所述评价词组子集中词频最大的评价词组;
在更新后的所述评价词组集中的各个评价对象之间的所述目标相似度均小于所述第一阈值的情况下,确定达到所述标签生成条件;
将所述评价对象作为所述评价标签。


5.根据权利要求1所述的方法,其特征在于,所述对所述评价文本集合中的每条评价文本分别进行分词处理,以得到评价词组集包括:
对所述评价文本集合中的评价文本进行清洗处理,以得到统一为目标格式的评价文本;
对所述目标格式的评价文本进行分词处理得到所述评价词组集。


...

【专利技术属性】
技术研发人员:王千
申请(专利权)人:上海风秩科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1