【技术实现步骤摘要】
一种汽车垂直网站水军甄别方法
本专利技术涉及汽车垂直网站信息处理
,尤其涉及一种汽车垂直网站水军甄别方法。
技术介绍
随着互联网的迅速发展和普及,越来越多的人选择在线上浏览和购买汽车,所以会常常查看其它买主对已购车型的评价。另一方面,汽车产品的研发团队也会从用户评论中挖掘用户的使用体验。因此汽车类垂直网站的用户评论无论是从汽车产品改进迭代方面还是顾客购买决策方面都有着重要参考作用。然而,这些评论的发出者却并不都是正常用户,夹杂了很多的水军,发出大量的异常评论混淆视听、干扰买主。李异平[1]等人分析了网络水军的产生、扩散特点以及影响,但并未提出具体的识别方法。但随着这一群体逐渐深入人们的视野,网络水军具体识别的研究也在逐步深入,范秀珍[2]最先明确提出对于水军影响事件的防范要从源头出发,即防范的对象是“水军”而不是“网络”。网络水军通过大量的评论加回复来刻意的引导舆论方向,其结果使得部分人群收益,其评论内容缺乏客观性和真实性,是在利益操控下的商业行为,造成了对设计研究机构的误导。再例如,莫倩[3]等人针对网络水军 ...
【技术保护点】
1.一种汽车垂直网站水军甄别方法,其特征在于,所述方法包括:/n采集汽车垂直网站的用户信息;/n深入分析正常用户和水军的区别,构建由用户名特征、粉丝关注比、精华帖特征、活跃度特征、车主特征、文本内容特征组成的六元组特征模型;/n在六元组特征模型的基础上结合逻辑回归对水军进行检测识别。/n
【技术特征摘要】
1.一种汽车垂直网站水军甄别方法,其特征在于,所述方法包括:
采集汽车垂直网站的用户信息;
深入分析正常用户和水军的区别,构建由用户名特征、粉丝关注比、精华帖特征、活跃度特征、车主特征、文本内容特征组成的六元组特征模型;
在六元组特征模型的基础上结合逻辑回归对水军进行检测识别。
2.根据权利要求1所述的一种汽车垂直网站水军甄别方法,其特征在于,
所述用户名特征:
其中,len(number)表示用户昵称中数字的个数或长度,len(name)表示用户昵称的整体字符个数或长度。
3.根据权利要求1所述的一种汽车垂直网站水军甄别方法,其特征在于,
所述粉丝关注比:
其中,num(fans)为用户所拥有的粉丝数目,num(observe)为用户的关注数,abs为差值的绝对值。
4.根据权利要求1所述的一种汽...
【专利技术属性】
技术研发人员:娄子安,王磊,郭伟,陈晓帅,
申请(专利权)人:天津大学,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。