【技术实现步骤摘要】
【专利摘要】本专利技术公开一种,包括下述步骤:(1)评论典型性挖掘建模,对评论典型性计算和最小代表评论集合挖掘问题进行建模和形式化定义;(2)典型性评论原型自动构建;(3)最小评论集合挖掘,采用最小评论集合挖掘算法,筛选出一个最小评论集合;(4)采用BigSimDet并行计算方法,通过调用分布式集群中的计算节点以并行的方式处理相似性评论检测任务。本专利技术从认知心理学和观点挖掘这两个角度出发,去研究用户评论的典型性衡量方法,基于此方法来挖掘具有代表性的最小评论集合;从而,帮助商品潜在客户可以更全面、多角度地了解某个商品,帮助用户更准确地筛选其所需的商品,提升用户的购买体验。【专利说明】
本专利技术涉及数据挖掘的研宄领域,特别涉及一种基于典型性的评论大数据挖掘方 法。
技术介绍
随着我国物联网的高速发展,发布在电子商务网站、社交网络及各种在线论坛上 的评论呈现出爆炸性的增长,这些数以Petabytes (PB)计的评论大数据(Big Data)揭示了 用户对诸如消费产品、组织、人员和社会事件等一系列广泛主题的个人观点。这些商品评论 不仅可 ...
【技术保护点】
基于典型性的评论大数据挖掘方法,其特征在于,包括下述步骤:(1)评论典型性挖掘建模,对评论典型性计算和最小代表评论集合挖掘问题进行建模和形式化定义;(2)典型性评论原型自动构建,基于认知心理学的“基层概念”理论和多原型理论来设计评论典型性计算方法,用“基层概念”理论中的类别效用来指导评论原型的生成;(3)最小评论集合挖掘,采用最小评论集合挖掘算法,筛选出一个最小评论集合,该集合具有如下特点:集合里的每一条评论都不同且都能代表相当一部分用户的观点,该最小评论集合里的所有评论能涵盖和代表该商品所有评论的观点,用户只需要浏览该最小评论集合里的评论,就可以了解所有该商品评论的用户观 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。