基于互联网的厂商口碑自动排序系统技术方案

技术编号:3921359 阅读:226 留言:0更新日期:2012-04-11 18:40
基于互联网的厂商口碑自动排序系统,本发明专利技术涉及一种厂商口碑自动排序系统。它解决了消费者无从检索到对相关商品评价信息的缺陷。本发明专利技术用于厂商口碑的排序工作。它包括:一号服务器,接受网上访问者的请求,从互联网上识别和收集对相关商品的评价信息;二号服务器,对收集到的相关商品评价信息进行结构化和规范化处理,从而得出对同一商品各个生产厂家的口碑排序;三号服务器,向网上访问者发布相关商品的不同生产厂家的口碑排序结果。

【技术实现步骤摘要】

本专利技术涉及一种厂商口碑自动排序系统。
技术介绍
买卖商品是一种经常性且重要的活动,无论对于生产者还是消费者都具有重要意 义。如何使消费者在最短的时间内,了解到其所关心商品的比较全面的信息是非常重要的。 将充斥于网络的、产品使用后大量评论信息进行结构化和量化的展示,对于促进生产者了 解使用者意见和消费者对同类产品进行比较都具有极为重要的实用价值。消费者为买到适 合心意的产品,一般会对不同生产厂家进行对比和了解;而对于生产者或商家来说,通过与 竞争者的对比也有利于发现自己的优势、劣势及用户的兴趣点和偏好,从而为生产决策提 供参考和依据。随着网络的普及和信息资讯建设取得的极大进步,越来越多的人们倾向于 通过搜索引擎获取关于产品的各种相关信息,如用户使用后意见、厂家信誉和口碑、价格信 息等,从而为其消费决策提供支持。事实上,在互联网上存在着大量关于产品的评论和意 见。这些产品使用者的反馈相对于厂家提供的产品介绍网页对于潜在购买者来说更容易接 受,因此提供了购买产品的重要参考。目前了解产品信息途径存在的问题是无法进行不同产品及其诸多特征的横向、迅 速、直观的比较。通用的搜索引擎难以进行专门的意见搜索,会返回大量无关信息等。即使 能准确收集到有关某项产品的相关评论,也会由于数量庞杂众多,使得用户耗费较多的阅 读时间。现有的搜索引擎在搜索上比较有效,但在资讯的整理特别是结构化处理上就显得 相对不足。尽管很多厂家通过 设计反馈表的方式收集用户意见,但是其表格数据项一般相 对固定且消费者参与较少。此外由生产者自行设计的产品统计对比信息可信度也难以保 证。产品比较一度是非常费时费力的工作,人们往往事先对产品特征了解甚少(如部 件、功能、外观、售后服务、价格等),此外,同类产品往往有多种不同厂家、不同型号的选择。 或者用户不知道某产品都有哪些品牌和生产厂家,不知道有哪些相关服务和相关配套产 品。这些导致消费者常常会买到不符合需求的产品,或者有着用不到的功能,造成金钱上的 浪费。总而言之,人们缺乏事先全面了解产品特征及使用情况的信息。
技术实现思路
本专利技术的目的是提供一种基于互联网的厂商口碑自动排序系统,以解决消费者无 从检索到对相关商品评价信息的缺陷。它包括一号服务器,接受网上访问者的请求,从互联网上识别和收集对相关商品的评价 fn息;二号服务器,对收集到的相关商品评价信息进行结构化和规范化处理,从而得出 对同一商品各个生产厂家的口碑排序;三号服务器,向网上访问者发布相关商品的不同生产厂家的口碑排序结果。本专利技术提供一种自动挖掘用户对产品意见的技术。依托在互联网上的形形色色的 产品意见评论文档为处理对象,进行相应的结构化、量化处理,从而形成清晰的口碑对比结 果。通过将大量无结构化的、表达方式多样的评论转化成清晰有意义的规律性结构化信息, 使人们可以从宏观的角度来观察数据。这种技术能够提供导航和浏览机制,从而极大地方 便分析和决策。其结果可用于为有购买产品意向的潜在用户辅助决策,也可以供生成商家 了解市场上用户反映和意见,并对产品做进一步改进提供参考。本专利技术的特点在于1)设 计量化和结构化技术,实现口碑对比的快速浏览;2)信息源来自互联网,使信息量较大,且 信息的评价范围也非常广泛。附图说明图1是本专利技术工作过程示意图,图2是实施方式一工作过程第四步骤中评价对象 与上下文极性关联的获取方法,图3是实施方式二中量化二维表的示意图。具体实施方式 具体实施方式一下面结合图1具体说明本实施方式。本实施方式包括一号服务器,接受网上访问者的请求,从互联网上识别和收集对相关商品的评价 fn息;二号服务器,对收集到的相关商品评价信息进行结构化和规范化处理,从而得出 对同一商品各个生产厂家的口碑排序;在二号服务器中构造一个具有一定规模的通用情感倾向性词典;针对需要进行挖 掘用户意见的产品,构造相应的专业极性词词典;获取和识别若干评价该产品的句子;对 评论句子进行句法分析,在此基础上识别评价的对象、评价对象与观点的对应关系;根据所 有句子的识别结果,利用该产品的部件和属性特征,获得结构化和量化的直观结果。三号服务器,向网上访问者发布相关商品的不同生产厂家的口碑(即大众对该厂 家生产的产品的某项质量指标或整体性价比的)排序结果。本专利技术的工作工程如下一、产品评论信息的准确识别与及时全面获取。利用产品评论领域相对确定、主题 与特征相对确定的特点,事先分领域收集大量产品评论相关的语料,从中统计出可以用于 描述产品评论的特征词集或模式对,并定期检索网络或者重点关注若干网络站点,用于主 动发现相关信息。利用网络主题爬虫技术和人工收集整理相结合,获得足够规模的多领域、 不同主题的产品评论语料库;对获得的产品评论语料库按重要性进行主题分级,并为每个 主题人工标注产品评论关键词及关键词模式对。人工标注关键词及关键词模式对的效果可 以利用通用搜索引擎或者设计单独的评价系统来进行评价。如果某一关键词及关键词模式 对被输入给通用搜索引擎或者设计单独的评价系统后,能返回所期望的信息,则认为标注 成功。而人工标注的关键词及关键词模式对的评分也可以通过其返回所期望的信息的数量 和质量而进行量化。利用产品评论语料库及人工标注的关键词及关键词模式对,对人工标 注的关键词及关键词模式对进行重要性评价,并进行冗余消除等处理,从而获得最终的产 品评论特征集。利用最终的产品评论特征集检索网络,获得潜在的产品评论信息文档流。二、产品评论信息的的快速分类和聚类整理。产品评论信息的组织与整理非常关键。文本分类和文本聚类是两种非常重要的技术,且二者相互补充。文本分类是一种按照经验分类体系和历史训练的结果对信息组织 的手段,其类别体系是先组的、有系统的,类目和文献之间具有相对独立性。因而文本分类 适合根据预案和领域专家的经验知识对产品评论信息类型、性质及所属领域的大致迅速判 定,有助于减少搜索空间。相比于文本分类,文本聚类则是先有文本信息后有类,类的性质及整个类目体系 完全由需要处理的产品评论信息内容所决定;从类目形成过程上看,分类是从总到分,聚类 是从分到总。相比之下,聚类处理更加细化,更能发现产品评论信息的方方面面、新线索、新 主题乃至各种谣言,平常容易被忽略的信息主题在聚类后将被识别,因而更容易被发现,因 为聚类提供了一种直观、可视化的产品评论信息查看和管理方法。聚类系统需要在达到一 定聚类质量的前提下,达到较高的效率。此外考虑到产品评论信息的实际特点,聚类需要具 有处理动态文本的能力,因为信息的获取是渐进的,信息量将随着时间的递进而逐渐增加。 可见,为了能够适应产品评论对信息处理的要求,聚类系统应该具有较强的动态自适应能 力、快速处理能力且便于检索。三、产品评论信息的消费者关注焦点特征识别。所谓焦点特征,重点是指被消费者广泛关注的、能够反映和描述产品评论方方面 面的特征。将产品特征分为5种,即属性、部件、部件的特征,相关概念,相关部件等。提取 焦点特征的意义还在于可以通过语言分析的手段计算消费者对大多数特征的态度和意见。 因而可以实现特征的参数化,并进一步计算其量化的取值。因此焦点特征及相应公众意见 的量化是反映产品评论的重要指标和描述。从网络上发表的与产品评论有关的评论意见等本文档来自技高网
...

【技术保护点】
基于互联网的厂商口碑自动排序系统,其特征在于它包括:一号服务器,接受网上访问者的请求,从互联网上识别和收集对相关商品的评价信息;二号服务器,对收集到的相关商品评价信息进行结构化和规范化处理,从而得出对同一商品各个生产厂家的口碑排序;三号服务器,向网上访问者发布相关商品的不同生产厂家的口碑排序结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘远超王晓龙刘秉权林磊单丽莉孙承杰刘铭
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:93[中国|哈尔滨]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1