一种试听作弊行为识别方法及系统技术方案

技术编号:15938843 阅读:34 留言:0更新日期:2017-08-04 21:44
本发明专利技术公开了一种音乐试听作弊行为识别方法:用户独立试听事件的试听行为数据的采集和互联网热门排行数据的采集;对采集到独立试听事件中的用户试听行为数据进行疑似违规歌曲的挖掘:对采集互联网热门排行数据参照评价基准进行分数的计算和评价;对挖掘的疑似违规歌曲以及进行评价后的互联网热门排行数据进行独立试听事件违规事件指标的评分判定:根据评分判定后的结果,所有歌曲试听事件中若某一事件得分总和超过限定值H,则判定该试听事件判定为试听作弊事件,并输出所述作弊事件相关指标信息。本发明专利技术提高了用户歌曲试听情况判断的准确性,并根据用户的试听行为合理准确地为客户推荐歌曲。

Listening fraud behavior identification method and system

The invention discloses a music audition cheating behavior recognition method: collection and Internet hot data, user behavior data, independent events in the collection; the collected user behavior data in the event of audition audition independent by mining suspected illegal Songs: Calculation and evaluation on the acquisition of popular Internet ranking data reference evaluation benchmark scores the Internet; top ranking data for evaluation of suspected illegal mining songs and after independent events of audition violations index score to judge: according to the results of the score after the judgment, all the songs in the event of an event, if the total score exceeds the limit value of H, it is judged that the audition event judged as cheating and audition. The output of the relevant indicators of cheating information. The invention improves the accuracy of the judgment of the user's song audition, and recommends songs reasonably and accurately according to the user's audition behavior.

【技术实现步骤摘要】
一种试听作弊行为识别方法及系统
本专利技术涉及音乐试听系统领域,具体涉及一种试听作弊行为识别方法及系统。
技术介绍
目前歌曲供应商通过作弊手段,模拟用户编码进行试听,以推高自己所提供歌曲的排名,影响到对用户真实歌曲试听行为的判断,导致无法合理的为用户推荐歌曲。现有规则多从用户行为特点进行判断,如短时间内频繁试听等,判断用户是否作弊。缺乏对试听歌曲本身热门程度,以及对歌曲背后歌曲供应商批量违规行为的判断。因此有待提供一种对用户歌曲试听情况判断更加准确的试听作弊行为识别方法及系统。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种对用户歌曲试听情况判断更加准确的试听作弊行为识别方法。本专利技术的另一目的是提供一种对用户歌曲试听情况判断更加准确的试听作弊行为识别系统。为达到上述目的,本专利技术采用的技术方案如下:一种试听作弊行为识别方法,其包括以下步骤:S1:首先进行用户独立试听事件的试听行为数据的采集和独立试听事件中互联网热门排行数据的采集;S2:对采集到独立试听事件中的用户试听行为数据进行疑似违规歌曲的挖掘:S2-1:疑似歌曲判定;S2-2:构建疑似违规歌曲集;S2-3:判断独立试听事件是否属于某个违规歌曲集;S3:对采集的独立试听事件中互联网热门排行数据参照评价基准进行分数的计算和评价;S4:对步骤S2挖掘的疑似违规歌曲以及步骤S3进行评价后的互联网热门排行数据进行独立试听事件违规事件指标的评分判定:1)当天作弊事件次数评分:同一天内,属于同一违规歌曲集的独立试听事件数量为m1次及m1以下记A1分,m1(不含)至m2次记A2分,m2(不含)至m3次记A3分,m3次以上记A4分,其中m1<m2<m3,A1<A2<A3<A4;2)同时间段评分:某一段试听时间开始前后1小时范围内,属于同一违规歌曲集的独立试听事件数量n1次及n1以下记B1分,n1(不含)至n2记B2分,n2(不含)至n3记B3分,n3次以上记B4分,其中n1<n2<n3,且B1<B2<B3<B4;3)一分钟试听次数评分:一分钟内试听次数超过P次的分钟数,占某次试听总分钟数比例为p1及p1以下记C1分,p1(不含)至p2记C2分,p2以上记C3分,其中p1<p2<p3<1,C1<C2<C3;4)疑似违规歌曲占比评分:该项得分D=D’*d,其中D’为某一固定分数,d为该试听事件中在任意疑似违规歌曲集中出现的歌曲的总数量占该试听事件全部歌曲数量的百分比;5)试听事件中供应商权重均值评分:将事件中所有歌曲所属供应商权重得分之和除以事件歌曲数量得到该事件的供应商权重均值,均值得分最高的事件记E分,之后按某事件均值与最高均值事件的均值比例乘以E计算每个事件得分;6)试听事件中歌曲权重均值评分:将事件中所有歌曲分级得分之和除以事件歌曲数量,得到试听事件歌曲权重均值,均值得分最高的事件记F分,之后按某事件均值与最高均值事件的均值比例乘以F计算每个事件得分。S5:根据步骤S4评分判定后的结果,所有歌曲试听事件中某一试听事件总得分超过限定值H,则判定该试听事件判定为试听作弊事件,并输出所述作弊事件相关指标信息。优选地,所述独立试听事件的判定步骤包括:a.从用户某次试听事件开始计算,后一次试听开始时间与前一次试听开始时间的间隔小于等于特定时长M分钟的,将后一次试听行为并入上一次试听行为所属的试听事件中,并记为一次独立试听事件;b.当后一次试听开始时间与后一次试听开始时间间隔大于特定时长M分钟时,将后一次试听行为作为下一个独立试听事件的起始行为,然后重复步骤a来继续判定独立试听事件。优选地,所述步骤S2-1中疑似歌曲判定包括:将每次独立试听事件中的歌曲,进行关联规则挖掘:通过对不同试听事件中出现的歌曲进行统计,计算当某一试听事件中,出现某一首歌或某几首歌时,其他一首或几首歌曲也出现的可能性;几首同时出现在多个试听事件中的歌曲构成一个频繁项集;该频繁项集内全部歌曲定义为为疑似违规歌曲,且将每一组符合上述条件的疑似违规频繁项集定义为a1,a2……an(n为自然数)。其中,当包含某个频繁项集的试听事件数量单日超过T个,或超过当天全部独立试听事件数量1%,且频繁项集内的歌曲提升度(即在某首歌曲A(或多首歌曲组合A’)出现的独立试听事件中出现B歌曲的概率,与含有B歌曲(或多首歌曲组合B’)的独立试听事件数量在当日全部独立试听事件的概率只比)大于特定值X时,定义该频繁项集为疑似违规频繁项集。优选地,所述步骤S2-2中构建疑似违规歌曲集包括步骤:(1)当两个疑似违规频繁项集ai,aj(i、j为大于等于1小于等于n的自然数,且i<>j)中有一首或以上相同歌曲时,对上述两个项集进行合并,形成疑似违规歌曲集Ai(i为小于n的自然数);(2)将其他疑似违规频繁项集ap(p<=n,且p<>i,p<>j)与Ai进行比对,只要有一首或以上歌曲与Ai中歌曲相同的,将该疑似违规频繁项集ap中歌曲并入Ai;(3)当没有其他疑似违规频繁项集aq中的歌曲与Ai中歌曲相同时,则将aq建立为新的疑似违规歌曲集Aj(j为小于n的自然数,且i<>j)(4)参考步骤(2),将没有合并到Ai的疑似违规频繁项集ax与Aj进行对比合并,当没有相同歌曲时,重复步骤(3),新建新的疑似违规歌曲集Ak(i为小于n的自然数,且k<>i,k<>j)(5)重复以上步骤(1)-(5),直到全部疑似频繁项集都归入疑似违规歌曲集,得到疑似违规歌曲集A1~Am(m为小于等于n的自然数)。优选地,所述步骤S2-3中判断独立试听事件是否属于某个违规歌曲集包括:当某次独立试听事件中,将试听歌曲与某个疑似违规歌曲集进行匹配,匹配到的歌曲,占该次独立试听事件的歌曲比例超过特定比例值Y时,判断该次试听事件,属于该违规歌曲集。一种试听作弊行为识别系统,包括以下模块:试听数据采集模块:首先进行用户独立试听事件的试听行为数据的采集和独立试听事件中互联网热门排行数据的采集;挖掘模块:对采集到独立试听事件中的用户试听行为数据进行疑似违规歌曲的挖掘:包括疑似歌曲判定,构建疑似违规歌曲集,判断独立试听事件是否属于某个违规歌曲集。计算模块:对采集的独立试听事件中互联网热门排行数据参照评价基准进行分数的计算和评价;评分模块:对所述挖掘模块挖掘的疑似违规歌曲以及所述计算模块进行评价后的互联网热门排行数据进行独立试听事件违规事件指标的评分判定:1)当天作弊事件次数评分:同一天内,属于同一违规歌曲集的独立试听事件数量为m1次及以下记A1分,m1(不含)至m2次记A2分,m2(不含)至m3次记A3分,m3次以上记A4分,其中m1<m2<m3,A1<A2<A3<A4;2)同时间段评分:某一段试听时间开始前后1小时范围内,属于同一违规歌曲集的独立试听事件数量n1次及以下记B1分,n1(不含)至n2记B2分,n2(不含)至n3记B3分,n3次以上记B4分,其中n1<n2<n3,且B1<B2<B3<B4;3)一分钟试听次数评分:一分钟内试听次数超过P本文档来自技高网...
一种试听作弊行为识别方法及系统

【技术保护点】
一种试听作弊行为识别方法,其特征在于,包括以下步骤:S1:首先进行用户独立试听事件的试听行为数据的采集和互联网热门排行数据的采集;S2:对采集到独立试听事件中的用户试听行为数据进行疑似违规歌曲的挖掘:S2‑1:疑似歌曲判定;S2‑2:构建疑似违规歌曲集;S2‑3:判断独立试听事件是否属于某个违规歌曲集;S3:对采集的互联网热门排行数据参照评价基准进行分数的计算和评价;S4:对步骤S2挖掘的疑似违规歌曲以及步骤S3进行评价后的互联网热门排行数据进行独立试听事件违规事件指标的评分判定:1)当天作弊事件次数评分:同一天内,属于同一违规歌曲集的独立试听事件数量为m1次及m1以下记A1分,m1至m2次记A2分,m2至m3次记A3分,m3次以上记A4分,其中m1<m2<m3,A1<A2<A3<A4;2)同时间段评分:某一段试听时间开始前后1小时范围内,属于同一违规歌曲集的独立试听事件数量n1次及n1次以下记B1分,n1至n2次记B2分,n2至n3次记B3分,n3次以上记B4分,其中n1<n2<n3,且B1<B2<B3<B4;3)一分钟试听次数评分:一分钟内试听次数超过P次的分钟数,占某次试听总分钟数比例为p1次及p1次以下记C1分,p1至p2次记C2分,p2次以上记C3分,其中p1<p2<p3<1,C1<C2<C3;4)疑似违规歌曲占比评分:该项得分D=D’*d,其中D’为某一固定分数,d为该试听事件中在任意疑似违规歌曲集中出现的歌曲的总数量占该试听事件全部歌曲数量的百分比;5)试听事件中供应商权重均值评分:将事件中所有歌曲所属供应商权重得分之和除以事件歌曲数量得到该事件的供应商权重均值,均值得分最高的事件记E分,之后按某事件均值与最高均值事件的均值比例乘以E计算每个事件得分;6)试听事件中歌曲权重均值评分:将事件中所有歌曲分级得分之和除以事件歌曲数量,得到试听事件歌曲权重均值,均值得分最高的事件记F分,之后按某事件均值与最高均值事件的均值比例乘以F计算每个事件得分。S5:根据步骤S4评分判定后的结果,所有歌曲试听事件中某一试听事件总得分超过限定值H,则判定该试听事件判定为试听作弊事件,并输出所述作弊事件相关指标信息。...

【技术特征摘要】
1.一种试听作弊行为识别方法,其特征在于,包括以下步骤:S1:首先进行用户独立试听事件的试听行为数据的采集和互联网热门排行数据的采集;S2:对采集到独立试听事件中的用户试听行为数据进行疑似违规歌曲的挖掘:S2-1:疑似歌曲判定;S2-2:构建疑似违规歌曲集;S2-3:判断独立试听事件是否属于某个违规歌曲集;S3:对采集的互联网热门排行数据参照评价基准进行分数的计算和评价;S4:对步骤S2挖掘的疑似违规歌曲以及步骤S3进行评价后的互联网热门排行数据进行独立试听事件违规事件指标的评分判定:1)当天作弊事件次数评分:同一天内,属于同一违规歌曲集的独立试听事件数量为m1次及m1以下记A1分,m1至m2次记A2分,m2至m3次记A3分,m3次以上记A4分,其中m1<m2<m3,A1<A2<A3<A4;2)同时间段评分:某一段试听时间开始前后1小时范围内,属于同一违规歌曲集的独立试听事件数量n1次及n1次以下记B1分,n1至n2次记B2分,n2至n3次记B3分,n3次以上记B4分,其中n1<n2<n3,且B1<B2<B3<B4;3)一分钟试听次数评分:一分钟内试听次数超过P次的分钟数,占某次试听总分钟数比例为p1次及p1次以下记C1分,p1至p2次记C2分,p2次以上记C3分,其中p1<p2<p3<1,C1<C2<C3;4)疑似违规歌曲占比评分:该项得分D=D’*d,其中D’为某一固定分数,d为该试听事件中在任意疑似违规歌曲集中出现的歌曲的总数量占该试听事件全部歌曲数量的百分比;5)试听事件中供应商权重均值评分:将事件中所有歌曲所属供应商权重得分之和除以事件歌曲数量得到该事件的供应商权重均值,均值得分最高的事件记E分,之后按某事件均值与最高均值事件的均值比例乘以E计算每个事件得分;6)试听事件中歌曲权重均值评分:将事件中所有歌曲分级得分之和除以事件歌曲数量,得到试听事件歌曲权重均值,均值得分最高的事件记F分,之后按某事件均值与最高均值事件的均值比例乘以F计算每个事件得分。S5:根据步骤S4评分判定后的结果,所有歌曲试听事件中某一试听事件总得分超过限定值H,则判定该试听事件判定为试听作弊事件,并输出所述作弊事件相关指标信息。2.如权利要1所述的一种试听作弊行为识别方法,其特征在于,所述独立试听事件的判定步骤包括:a.从用户某次试听事件开始计算,后一次试听开始时间与前一次试听开始时间的间隔小于等于特定时长M分钟的,将后一次试听行为并入上一次试听行为所属的试听事件中,并记为一次独立试听事件;b.当后一次试听开始时间与后一次试听开始时间间隔大于特定时长M分钟时,将后一次试听行为作为下一个独立试听事件的起始行为,然后重复步骤a来继续判定独立试听事件。3.如权利要1所述的一种试听作弊行为识别方法,其特征在于,所述步骤S2-1中疑似歌曲判定包括:将每次独立试听事件中的歌曲,进行关联规则挖掘:通过对不同试听事件中出现的歌曲进行统计,计算当某一试听事件中,出现某一首歌或某几首歌时,其他一首或几首歌曲也出现的可能性;几首同时出现在多个试听事件中的歌曲构成一个频繁项集;该频繁项集内全部歌曲定义为疑似违规歌曲,且将每一组符合上述条件的疑似违规频繁项集定义为a1,a2……an。其中,当包含某个频繁项集的试听事件数量单日超过T个,或超过当天全部独立试听事件数量1%,且频繁项集内的歌曲提升度大于特定值X时,定义该频繁项集为疑似违规频繁项集。4.如权利要求3所述的一种试听作弊行为识别方法,其特征在于,所述步骤S2-2中构建疑似违规歌曲集包括步骤:(1)当两个疑似违规频繁项集ai,aj(i、j为大于等于1小于等于n的自然数,且i<>j)中有一首或以上相同歌曲时,对上述两个项集进行合并,形成疑似违规歌曲集Ai(i为小于n的自然数);(2)将其他疑似违规频繁项集ap(p<=n,且p<>i,p<>j)与Ai进行比对,只要有一首或以上歌曲与Ai中歌曲相同的,将该疑似违规频繁项集ap中歌曲并入Ai;(3)当没有其他疑似违规频繁项集aq中的歌曲与Ai中歌曲相同时,则将aq建立为新的疑似违规歌曲集Aj(j为小于n的自然数,且i<>j)(4)参考步骤(2),将没有合并到Ai的疑似违规频繁项集ax与Aj进行对比合并,当没有相同歌曲时,重复步骤(3),新建新的疑似违规歌曲集Ak(i为小于n的自然数,且k<>i,k<>j)(5)重复以上步骤(1)-(5),直到全部疑似频繁项集都归入疑似违规歌曲集,得到疑似违规歌曲集A1~Am(m为小于等于n的自然数)。5.如权利要4所述的一种试听作弊行为识别方法,其特征在于,所述步骤S2-3中判断独立试听事件是否属于某个疑似违规歌曲集包括:当某次独立试听事件中,将试听歌曲与某个疑似违规歌曲集进行匹配,匹配到的歌曲,占该次独立试听事件的歌曲比例超过特定比例值Y时,判断该次试听事件,属于该违规歌曲集。6.一种音乐试听作弊行为识别系统,其特征在于,包括以下模块:试听数据采集模块:首先进行用户独立试听事件的试听行为数据的采集和互联网热门排行数据的...

【专利技术属性】
技术研发人员:陈韬
申请(专利权)人:中国联合网络通信有限公司广东省分公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1