虚假账号的识别方法及装置制造方法及图纸

技术编号：12067556 阅读：83 留言：0更新日期：2015-09-18 01:45

本发明专利技术公开了一种虚假账号的识别方法及装置，能够解决逐一对每个账号进行虚假账号识别时，识别所需的时间成本高及准确度低的问题，方法包括：查找预设时长内满足第一预设规则的至少一个用户标识，第一预设规则用于描述虚假账号的行为特征；从至少一个用户标识中选取目标用户标识，将目标用户标识分别与每个第一簇心进行相关性运算，得到相关系数，目标用户标识为第一簇心以外的用户标识；如果相关系数大于或等于预设阈值，则将目标用户标识合并到第一簇心所在的簇中；如果相关系数小于预设阈值，则将目标用户标识确定为第二簇心；根据第一簇心或第二簇心对应的簇中用户标识的数量确定虚假账号。本发明专利技术主要应用于网络安全运维的过程中。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网通信技术，尤其涉及一种虚假账号的识别方法及装置。
技术介绍
微博（Weibo)，微型博客（MicroBlog)的简称，即一句话博客，是一个基于用户关系信息分享、传播W及获取的平台。用户可W通过肥B、WAP等各种客户端组建个人社区，W 140字的文字更新信息，并实现即时分享。与传统的社交媒体产品（如即时聊天软件、短信等）相比，微博是一种差异化的社交和社会化媒体的互联网产品。它的弱关系链特性，决定了任何时候用户都可W随意收听任何陌生人；同时，由于它具有极强的扩散性，消息在粉丝圈与粉丝圈之间的传播与扩散极其容易。由于微博具有弱关系链特性和极强的扩散性，因此黑客可通过自动化工具恶意注册大批虚假账号，通过使用网络爬虫等工具爬取相关内容和资料来进行运营，或者通过该些账号为外界提供刷粉服务，或者批量发送垃圾广告。因而，需要通过一些方式来识别出该些使用自动化工具的虚假账号。现有技术中提供了一种基于IP聚集的方式实现虚假账号的识别，具体的；若一批账号同时聚集在一个IP上，则通过其它一些行为特征基本对聚集在一个IP上的多个账号进行识别。但是，当黑客逐渐使用大量的无规律的代理IP来操控虚假账号时，使用上述通过聚集方式较难对虚假账号进行识别。现有技术中还提供了一种通过对同一账号的多个维度的行为特征进行总和判断，确定某个账号是否为虚假账号。例如：从某账号的产生动作的时间间隔、登陆的特征、W及动作序列H个维度的特征进行判断该账号是否为虚假账号。然而，通过多维特征进行识别时，可能将正常用户的行为特征判别为可W特征，导致判别...

【技术保护点】
一种虚假账号的识别方法，其特征在于，所述方法包括：查找预设时长内满足第一预设规则的至少一个用户标识，所述第一预设规则用于描述虚假账号的行为特征；从所述至少一个用户标识中选取目标用户标识，将所述目标用户标识分别与每个第一簇心进行相关性运算，得到相关系数，所述目标用户标识为所述第一簇心以外的用户标识；如果所述相关系数大于或等于预设阈值，则将所述目标用户标识合并到所述第一簇心所在的簇中；如果所述相关系数小于所述预设阈值，则将所述目标用户标识确定为第二簇心；根据所述第一簇心或所述第二簇心对应的簇中用户标识的数量确定虚假账号。

【技术特征摘要】

【专利技术属性】
技术研发人员：王俊乐，
申请(专利权)人：腾讯科技北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人