【技术实现步骤摘要】
识别机器人账号的方法、装置、电子设备及计算机可读存储介质
本专利技术涉及计算机
,特别是涉及一种识别机器人账号的方法、装置、电子设备及计算机可读存储介质。
技术介绍
每一个视频平台都需要优质的内容,特别在互联网2.0时代,更多优质的内容都是用户上传的。但是,也难免有一些内容是机器人操作的内容,这部分机器人账号对于视频平台保护原创用户、原创内容构成了干扰和影响。所以,需要识别机器人账号。其中,机器人账号往往直接搬运原创内容上传到视频平台,因而,现有技术一般通过账号上传的视频画面来识别机器人账号。但是,某些机器人账号有时还会对搬运的原创内容进行简单处理,例如滤镜、添加标志,这时仅仅通过上传的视频画面则无法识别出机器人账号。由此可见,现有技术中,识别机器人账号的准确度较低。
技术实现思路
本专利技术实施例的目的在于提供一种识别机器人账号的方法、装置、电子设备及计算机可读存储介质,以在一定程度上提升识别机器人账号的准确度。具体技术方案如下:在本专利技术实施的第一方面,首先提供 ...
【技术保护点】
1.一种识别机器人账号的方法,其特征在于,所述方法包括:/n获取待识别账号的头像以作为待识别图像;/n采用第一图像相似度算法,从所述待识别图像中选出候选图像对,其中,所述候选图像对中包括的两个待识别图像的相似度大于第一预设相似度;/n采用第二图像相似度算法,从所述候选图像对中选出相似图像对,所述相似图像对包括的两个待识别图像的相似度大于第二预设相似度;/n获取目标账号在网络平台上传数据的行为信息,所述目标账号为所述相似图像对中包括的待识别图像所属的待识别账号;/n根据所述行为信息,识别所述目标账号中的机器人账号。/n
【技术特征摘要】
1.一种识别机器人账号的方法,其特征在于,所述方法包括:
获取待识别账号的头像以作为待识别图像;
采用第一图像相似度算法,从所述待识别图像中选出候选图像对,其中,所述候选图像对中包括的两个待识别图像的相似度大于第一预设相似度;
采用第二图像相似度算法,从所述候选图像对中选出相似图像对,所述相似图像对包括的两个待识别图像的相似度大于第二预设相似度;
获取目标账号在网络平台上传数据的行为信息,所述目标账号为所述相似图像对中包括的待识别图像所属的待识别账号;
根据所述行为信息,识别所述目标账号中的机器人账号。
2.根据权利要求1所述的识别机器人账号的方法,其特征在于,所述采用第一图像相似度算法,从所述待识别图像中选出候选图像对,包括:
采用预先确定的哈希算法的第一参数,计算每一个所述待识别图像的第一哈希值,得到多个第一哈希值;计算所述多个第一哈希值中每两个第一哈希值之间的汉明距离,并选出汉明距离小于或等于预先确定的第一阈值的第一哈希值,以作为第一目标参数;
将与同一个汉明距离对应的两个所述第一目标参数所属的待识别图像,确定为一个候选图像对。
3.根据权利要求2所述的识别机器人账号的方法,其特征在于,每一个第一哈希值均包括N位数字;
所述计算所述多个第一哈希值之间的汉明距离,并选出汉明距离小于或等于预先确定的第一阈值的第一哈希值,包括:
对所述多个第一哈希值进行分组,其中,第i个分组中的每一个第一哈希值,在所述第i个分组中均存在至少一个与自身的第M*i+1位至第M*(i+1)位数字相同的第一哈希值,i取值为0至n的整数,n=N/M-1,M为整数,N是M的整数倍;
分别在i取值为0至n的每一个整数时,将第i个分组中第M*i+1位至第M*(i+1)位数字为同一组数字的第一哈希值,确定为一类哈希值;
将同一类别的第一哈希值存储在同一个第一集合中;
计算同一个第一集合中的每两个第一哈希值的汉明距离;
从每一个第一集合包括的第一哈希值中,选出汉明距离小于或等于所述第一阈值的第一哈希值。
4.根据权利要求2所述的识别机器人账号的方法,其特征在于,所述第一参数和所述第一阈值的确定过程包括:
采用哈希算法的第一预设初始参数,计算预先确定的样本库中的样本图像的第二哈希值,得到多个第二哈希值;
计算所述多个第二哈希值中每两个第二哈希值之间的汉明距离,并选出汉明距离小于或等于第一预设初始阈值的第二哈希值,以作为第二目标参数;
获取第一类样本图像的第一数量,所述第一类样本图像为所述第二目标参数所属的样本图像;
在所述第一数量与所述样本图像的总数量之比小于第一预设比值的情况下,调整所述第一预设初始参数的大小和/或所述第一预设初始阈值的大小,直到所述第一数量与所述样本图像的总数量之比大于或等于所述第一预设比值时,将此时的第一预设初始参数确定为所述第一参数,并将此时的第一预设初始阈值,确定为所述第一阈值。
5.根据权利要求4所述的识别机器人账号的方法,其特征在于,每一个第二哈希值均包括N位数字;
所述计算所述多个第二哈希值之间的汉明距离,并选出汉明距离小于或等于第一预设初始阈值的第二哈希值,包括:
对所述多个第二哈希值进行分组,其中,第i个分组中的每一个第二哈希值,在所述第i个分组中均存在至少一个与自身的第M*i+1位至第M*(i+1)位数字相同的第二哈希值,i取值为0至n的整数,n=N/M-1,M为整数,N是M的整数倍;
分别在i取值为0至n的每一个整数时,将第i个分组中第M*i+1位至第M*(i+1)位数字为同一组数字的第二哈希值,确定为一类哈希值;
将同一类别的第二哈希值存储在同一个第二集合中;
计算同一个第二集合中的每两个第二哈希值的汉明距离;
从每一个第二集合包括的第二哈希值中,选出汉明距离小于或等于所述第一预设初始阈值的第二哈希值。
6.根据权利要求1所述的识别机器人账号的方法,其特征在于,所述采用第二图像相似度算法,从所述候选图像对中选出相似图像对,包括:
采用预先确定的梯度直方图算法的第二参数,计算每一个所述候选图像对中的两个待识别图像的第一直方图,以作为所述候选图像对对应的两个第一直方图;
计算与同一个候选图像对对应的两个第一直方图的归一化相关系数,并选出归一化相关系数大于第二阈值的第一直方图,以作为第三目标参数;
将与同一个归一化相关系数对应的两个第三目标参数所属的待识别图像,确定为一个相似图像对。
7.根据权利要求6所述的...
【专利技术属性】
技术研发人员:韩立伟,王世明,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。