【技术实现步骤摘要】
一种基于特征模型的刷子检测方法与系统
本专利技术涉及网络
,特别是涉及一种基于特征模型的刷子检测方法与系统。
技术介绍
平台作为内容生产者的平台,当有大量的UGC(用户生成内容)产生时,为净化网络内容安全,需要内容进行对应的合法性审核,通过后才能在平台上流通。但是在黑产、羊毛党横行的前提下,大量的非重复但有一定规律性的内容产生,对平台内容审核造成了巨大的挑战,以至于当刷子来临时审核人手不够,造成任务积压。前面的叙述在于提供一般的背景信息,并不一定构成现有技术。
技术实现思路
本专利技术的目的在于提供一种能对刷子进行初步识别的基于特征模型的刷子检测方法与系统。本专利技术提供一种基于特征模型的刷子检测方法,包括:类型检测,检测输入的数据类型,若为文本数据则进行文本检测;文本检测,获取文本数据,将文本数据去除无关信息,再将文本数据从中文、字母、数字维度上剖析,得出特征形式,将特征数据与模型库数据特征做匹配,匹配符合后输出UID数据。进一步地,所述类型检测包括若为图片数据则进行图片检 ...
【技术保护点】
1.一种基于特征模型的刷子检测方法,其特征在于,包括:类型检测,检测输入的数据类型,若为文本数据则进行文本检测;文本检测,获取文本数据,将文本数据去除无关信息,再将文本数据从中文、字母、数字维度上剖析,得出特征形式,将特征数据与模型库数据特征做匹配,匹配符合后输出UID数据。/n
【技术特征摘要】
1.一种基于特征模型的刷子检测方法,其特征在于,包括:类型检测,检测输入的数据类型,若为文本数据则进行文本检测;文本检测,获取文本数据,将文本数据去除无关信息,再将文本数据从中文、字母、数字维度上剖析,得出特征形式,将特征数据与模型库数据特征做匹配,匹配符合后输出UID数据。
2.如权利要求1所述的刷子检测方法,其特征在于,所述类型检测包括若为图片数据则进行图片检测;所述刷子检测方法还包括:图片检测,获得图片二进制数据,将数据下载到本地,使用感知算法生成特征hash值,将hash值与刷子hash库的hash对比,符合特征后输出UID数据。
3.如权利要求1所述的刷子检测方法,其特征在于,所述图片检测步骤中,设置hash阈值,当hash值与刷子hash库的hash对比的分数达到hash阈值,则认为符合特征。
4.如权利要求1所述的刷子检测方法,其特征在于,所述模型库的建构方法包括:获取文本特征,获取用户端提交的组样本数据;分析样本数据,得出样本的共同特征,将共同特征描述为刷子特征;将刷子特征存入模型库。
5.如权利要求4所述的刷子检测方法,其特征在于,所述将共同特征描述为刷子特征包括:当样本数据符合第一模型特征时,将第一模型特征作为刷子特征;当样本数据符合第二模型特征时,将第二模型特征作为刷子特征;所述第一模型特征是指对词组所有的词进行打散,分隔成单字,由此得出多个数组,随后取这多个数组中的共同交集,所得出的相同单字集合;所述第二模型特征是指对词组所有的词做字类型分析,通过对词组的中文个数、数组个数、字母个数所找到的共同特征点。
6.一种...
【专利技术属性】
技术研发人员:王力,李一文,
申请(专利权)人:湖南映客互娱网络信息有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。