【技术实现步骤摘要】
一种面向汽车垂直网站的产品信息检索方法
本专利技术涉及信息检索领域,尤其涉及一种面向汽车垂直网站的产品信息检索方法。
技术介绍
2017年8月4日,中国互联网络信息中心(CNNIC)发布的第40次《中国互联网络发展状况统计报告》显示[1],截至2017年6月,中国网民规模达到7.51亿,占全球网民总数的五分之一。互联网普及率为54.3%,超过全球平均水平4.6个百分点。以互联网为代表的电子商务技术正在加速促进我国消费升级、经济社会转型,也深刻地促进了人们消费习惯的变革。产品的使用者通过商家的网站、购物门户网站、相关垂直网站和交流社区所发表的对产品的评价,一方面对于其他消费者的消费意愿具有相当程度的影响作用[2],产品的购买者和使用者通过发表对产品在不同使用状况、不同使用周期的真实状态,能够影响处于观望期间的潜在消费者的购买欲望,使其消费更趋理性化[3];另一方面,用户对产品的评论反馈深刻地影响着消费者和企业之间的关系,是企业了解用户需求的重要资源。总是能生产口碑良好产品的公司,更能培育与消费者之间的良好关系并发展为品牌忠诚度[4]。因此,挖掘隐含在产品评论背后的用 ...
【技术保护点】
一种面向汽车垂直网站的产品信息检索方法,其特征在于,所述产品信息检索方法包括以下步骤:利用爬虫技术抓取多个汽车类垂直网站数据,并以网站—车型—口碑的树形结构存入数据库;对数据库中的数据格式进行规整及预处理操作,使得来自不同网站的数据格式、命名方式统一;考虑数据的来源网站、口碑等级、口碑内容、用户等级,构建检索结果评价体系,为检索结果评价体系分配指标权重;根据检索结果评价体系构建口碑特征向量,并结合情感分析得分,综合口碑的所属网站、口碑等级以及发表信息的用户等级,得到汽车产品信息的检索结果。
【技术特征摘要】
1.一种面向汽车垂直网站的产品信息检索方法,其特征在于,所述产品信息检索方法包括以下步骤:利用爬虫技术抓取多个汽车类垂直网站数据,并以网站—车型—口碑的树形结构存入数据库;对数据库中的数据格式进行规整及预处理操作,使得来自不同网站的数据格式、命名方式统一;考虑数据的来源网站、口碑等级、口碑内容、用户等级,构建检索结果评价体系,为检索结果评价体系分配指标权重;根据检索结果评价体系构建口碑特征向量,并结合情感分析得分,综合口碑的所属网站、口碑等级以及发表信息的用户等级,得到汽车产品信息的检索结果。2.根据权利要求1所述的一种面向汽车垂直网站的产品信息检索方法,其特征在于,所述多个汽车类垂直网站数据具体为:1)垂直网站数据,包括:网站的反链数、发帖用户数量、以及包含的车型数量;2)车型数据,包括:垂直网站内的车型类别、车型品牌、以及车型价格区间;3)口碑数据,包括:用户针对不同汽车属性的评分、用户级别、购车时间、购车地点、口碑内容、口碑等级。3.根据权利要求1所述的一种面向汽车垂直网站的产品信息检索方法,其特征在于,所述对数据库中的数据格式进行规整及预处理操作具体为:建立车型命名映射表:将不同汽车网站中同一车...
【专利技术属性】
技术研发人员:邱泽成,郭伟,梁若愚,安蔚瑾,
申请(专利权)人:天津大学,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。