【技术实现步骤摘要】
一种用户新建议实时发现方法、装置、设备及介质
[0001]本专利技术涉及数据处理
,尤其涉及一种用户新建议实时发现方法、装置、设备及介质。
技术介绍
[0002]在随着互联网技术的不断发展,人们越来越喜欢在电商平台购物,此购物方式为我们的生活提供了很大的便捷性。一般完成一次购物后,会把自己的购物体验、产品使用感受以及对产品的建议发布到电商平台,以表达自己对该产品的观点。而这些用户反馈文本,作为用户问题、建议、态度的载体,对产品评估和改进优化极具价值。因此品牌方可以从这些用户反馈中搜集用户对产品的建议,从而研究用户建议的可行性、应用性及盈利点,让产品变得更好。
[0003]目前已经有相关技术方法,可以从用户评论中抽取对产品的用户建议。常见方法是通过对文本数据直接进行聚类,得到用户对产品的建议。由于每次有新的用户建议,就会对所有文本做全量聚类,存在聚类结果生成时间比较长且发现新的用户建议所用时间比较长的问题。
技术实现思路
[0004]本专利技术提供了一种用户新建议实时发现方法、装置、设备及介质,以 ...
【技术保护点】
【技术特征摘要】
1.一种用户新建议实时发现方法,其特征在于,包括:获取用户评论文本数据和规则文件,所述规则文件包括预设的句式规则;根据预设的句式规则对所述用户评论文本数据进行抽取,得到待聚类建议文本片段;将多个所述待聚类建议文本片段进行聚类,得到若干个待测聚类中心;分别判断若干个所述待测聚类中心与预存的聚类中心是否相似;若当前所述待测聚类中心与所述预存的聚类中心不相似,则在所述预存的聚类中心上新建一类聚类中心,同时判定检测到新的用户建议,所述待测聚类中心即为新建的一类聚类中心;若当前所述待测聚类中心与所述预存的聚类中心相似,则将所述待测聚类中心合并至所述预存的聚类中心中;判断当前所述待测聚类中心是否属于若干个所述待测聚类中心中的最后一个待测聚类中心;若否,则返回分别判断若干个所述待测聚类中心与预存的聚类中心是否相似的步骤。2.根据权利要求1所述的用户新建议实时发现方法,其特征在于,所述获取用户评论文本数据和规则文件之前,还包括:对所述用户评论文本数据进行数据清洗处理,以过滤掉噪声数据。3.根据权利要求1所述的用户新建议实时发现方法,其特征在于,所述将多个所述待聚类建议文本片段进行聚类,得到若干个待测聚类中心,包括:将所述待聚类建议文本片段进行预处理得到多个文本特征词;将所述文本特征词一一转换成对应的词向量,得到多个词向量;将所述多个词向量进行叠加求平均值得到文本向量;利用预设的聚类算法对多个所述文本向量进行聚类,得到若干个所述待测聚类中心以及每个文本向量的所属聚类编号。4.根据权利要求1所述的用户新建议实时发现方法,其特征在于,所述待测聚类中心包括聚类中心向量,所述预存的聚类中心包括预存聚类中心向量,所述分别判断若干个所述待测聚类中心与所述预存的聚类中心是否相似,包括:获取当前所述待测聚类中心中的聚类...
【专利技术属性】
技术研发人员:李赟扬,叶永龙,刘宝强,
申请(专利权)人:深圳视界信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。