一种识别目标团体的方法及系统技术方案

技术编号:28633410 阅读:24 留言:0更新日期:2021-05-28 16:30
本发明专利技术公开了一种识别目标团体的方法,将目标与直播间互动的关系以矩阵形式表达,并在布尔化后,利用奇异值分解获得特征向量最高的两个左奇异矩阵,生成二维向量空间,以此提取矩阵中的最主要互动信息要素,并转换成向量,然后以极坐标中的半径和角度的分布来获得向量的聚集情况,最后采取3sigma原则得到聚集与直播间互动的第一目标集;并分别对每个直播间,根据阈值,获得满足条件的有目标团体聚集互动的目标直播间,而与所述目标直播间互动的目标团体就是本发明专利技术要识别的团体。因此,上述方法可识别出目标团体,对其进行屏蔽,从而避免占用直播平台过多的资源,保证直播的流畅。

【技术实现步骤摘要】
一种识别目标团体的方法及系统
本专利技术涉及网络直播
,尤其涉及一种识别目标团体的方法及系统。
技术介绍
在网络直播平台上,主播为了提升自己的热度值和曝光量,往往借助第三方的黑产帮助自己提升观看量和时长。这些目标团体通过接单的方式,会在一段时间内为若干主播完成观看量的任务。这些目标团体的行为,会造成对直播平台过多的资源占用,从而导致直播卡顿。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的识别目标团体的方法及系统。第一方面,本申请通过本申请的一实施例提供如下技术方案:一种识别目标团体的方法,用于网络直播平台,所述方法包括:S101、获取预设时间段内在所述网络直播平台上的目标基础数据;S102、基于所述目标基础数据,获得目标矩阵;其中,所述目标矩阵包括数据集wij,wij表示目标i与直播间j的互动次数wij,i=1,2,...,M,M表示目标数量,j=1,2,...,N,N表示直播间数量;S103、对所述目标矩阵进行布尔化处理,获得布尔矩阵;S104、对所述布尔矩阵进行奇异值分解,获得多个左奇异矩阵;S105、从所述多个左奇异矩阵中选取特征向量排名前两位的两个左奇异矩阵,生成二维向量;S106、将目标i在所述二维向量所在的空间中的坐标转化为极坐标,获得目标i的极坐标;S107、基于所述目标i的极坐标,获得目标的极坐标半径概率p(r)和极坐标角度概率p(θ);S108、基于p(r)和p(θ),获得所述极坐标半径概率的均值和标准差,以及所述极坐标角度概率的均值和标准差;S109、基于3sigma原则以及所述极坐标半径概率的均值和标准差,或,基于3sigma原则以及所述极坐标角度概率的均值和标准差,获得第一目标集;S110、判断与直播间j互动的所述第一目标集中的目标数量MSr是否大于第一阈值,MSr/Mr是否大于第二阈值,以及所述布尔矩阵中与所述直播间j相关的互动次数形成的第一子矩阵的矩阵密度是否大于第一密度阈值;其中,Mr表示与所述直播间j互动的总目标数量;S111、若同时满足MSr大于第一阈值,MSr/Mr大于第二阈值,以及所述第一子矩阵的矩阵密度大于第一密度阈值,则将所述直播间j识别为第一目标直播间集;S112、将与第一目标直播间互动的第一目标识别为第一目标团体;其中,所述第一目标直播间属于第一目标直播间集,所述第一目标属于第一目标集。可选的,所述将与所述第一目标直播间集中的第一目标直播间互动的第一目标识别为第一目标团体之后,所述方法还包括:S113、判断与目标i互动的所述第一目标直播间的数量NSu是否大于第三阈值,NSu/Nu是否大于第四阈值,以及所述布尔矩阵中与所述目标i相关的互动次数形成的第二子矩阵的矩阵密度是否大于第二密度阈值;其中,Nu表示与所述目标i互动的总直播间数量;S114、若同时满足NSu大于第三阈值,NSu/Nu大于第四阈值,以及所述第二子矩阵的矩阵密度大于第二密度阈值,则将所述目标i识别为第二目标集;S115、将所述第二目标集与所述第一目标团体合并,获得一级目标团体集。可选的,在获得初级目标团体集之后,所述方法还包括:S116、以所述一级目标团体集代替所述第一目标集,并返回执行S110-S111,获得第二目标直播间集;S117、以所述第二目标直播间集集代替所述第一目标直播间集后,执行S113-S114,获得第三目标集;S118、将所述第二目标集与所述第三目标集合并,获得二级目标团体集;按照S116-S118,循环迭代至第h目标直播间集与第h-1目标直播间集相同,且k级目标团体集与k-1级目标团体集相同,获得第h目标直播间集和k级目标团体集;其中,k大于等于二,h大于等于二。可选的,所述对所述目标矩阵进行布尔化处理,获得布尔矩阵,包括:判断所述目标矩阵中的wij是否满足wij>0;若满足,则将该wij替换为bij=1,否则替换为bij=0,获得所述布尔矩阵。可选的,所述奇异值分解的方法,包括:B=P∑Q其中,B是布尔矩阵,P是左奇异矩阵,∑是对角矩阵,Q是右奇异矩阵。可选的,所述基于3sigma原则以及所述极坐标半径概率的均值和标准差,或,基于3sigma原则以及所述极坐标角度概率的均值和标准差,获得第一目标集,包括:判断目标i是否满足ui,r>E(p(r))+1.645σ(p(r)),或满足ui,θ>E(p(θ))+1.645σ(p(θ)),若满足,则将满足ui,r>E(p(r))+1.645σ(p(r)),或满足ui,θ>E(p(θ))+1.645σ(p(θ))的目标i形成所述第一目标集;其中,E(p(r))是目标极坐标半径分布p(r)的均值;E(p(θ))是目标极坐标角度分布p(θ)的均值;σ(p(r))是目标极坐标半径分布p(r)的标准差;σ(p(θ)是目标极坐标角度分布p(θ)的标准差;ui,r是目标i在所述极坐标中半径的取值;ui,θ是目标i在所述极坐标中角度的取值。可选的,所述矩阵密度的表达式,包括:其中,d是矩阵密度;D是所述布尔矩阵中bij=1的元素个数之和除以所述布尔矩阵中所有元素个数获得的值;m和n是所述第一子矩阵或第二子矩阵的维度。可选的,在所述将与第一目标直播间互动的第一目标识别为第一目标团体之后,所述方法还包括:S213、对所述第一目标团体进行屏蔽。第二方面,本申请通过本申请的另一实施例提供一种识别目标团体的系统,所述系统包括:数据获取模块,用于获取预设时间段内在所述网络直播平台上的目标基础数据;第一获得模块,用于基于所述目标基础数据,获得目标矩阵;其中,所述目标矩阵包括数据集wij,wij表示目标i与直播间j的互动次数wij,i=1,2,...,M,M表示目标数量,j=1,2,...,N,N表示直播间数量;第二获得模块,用于对所述目标矩阵进行布尔化处理,获得布尔矩阵;第三获得模块,用于对所述布尔矩阵进行奇异值分解,获得多个左奇异矩阵;向量生成模块,用于从所述多个左奇异矩阵中选取特征向量排名前两位的两个左奇异矩阵,生成二维向量;第四获得模块,用于将目标i在所述二维向量所在的空间中的坐标转化为极坐标,获得目标i的极坐标;第五获得模块,用于基于所述目标i的极坐标,获得目标的极坐标半径概率p(r)和极坐标角度概率p(θ);第六获得模块,用于基于p(r)和p(θ),获得所述极坐标半径概率的均值和标准差,以及所述极坐标角度概率的均值和标准差;第七获得模块,用于基于3sigma原则以及所述极坐标半径概率的均值和标准差,或,基于3sigma原则以及所述极坐标角度概率的均值和标准差,获得第一目标集;...

【技术保护点】
1.一种识别目标团体的方法,用于网络直播平台,其特征在于,所述方法包括:/nS101、获取预设时间段内在所述网络直播平台上的目标基础数据;/nS102、基于所述目标基础数据,获得目标矩阵;其中,所述目标矩阵包括数据集w

【技术特征摘要】
1.一种识别目标团体的方法,用于网络直播平台,其特征在于,所述方法包括:
S101、获取预设时间段内在所述网络直播平台上的目标基础数据;
S102、基于所述目标基础数据,获得目标矩阵;其中,所述目标矩阵包括数据集wij,wij表示目标i与直播间j的互动次数wij,i=1,2,...,M,M表示目标数量,j=1,2,...,N,N表示直播间数量;
S103、对所述目标矩阵进行布尔化处理,获得布尔矩阵;
S104、对所述布尔矩阵进行奇异值分解,获得多个左奇异矩阵;
S105、从所述多个左奇异矩阵中选取特征向量排名前两位的两个左奇异矩阵,生成二维向量;
S106、将目标i在所述二维向量所在的空间中的坐标转化为极坐标,获得目标i的极坐标;
S107、基于所述目标i的极坐标,获得目标的极坐标半径概率p(r)和极坐标角度概率p(θ);
S108、基于p(r)和p(θ),获得所述极坐标半径概率的均值和标准差,以及所述极坐标角度概率的均值和标准差;
S109、基于3sigma原则以及所述极坐标半径概率的均值和标准差,或,基于3sigma原则以及所述极坐标角度概率的均值和标准差,获得第一目标集;
S110、判断与直播间j互动的所述第一目标集中的目标数量MSr是否大于第一阈值,MSr/Mr是否大于第二阈值,以及所述布尔矩阵中与所述直播间j相关的互动次数形成的第一子矩阵的矩阵密度是否大于第一密度阈值;其中,Mr表示与所述直播间j互动的总目标数量;
S111、若同时满足MSr大于第一阈值,MSr/Mr大于第二阈值,以及所述第一子矩阵的矩阵密度大于第一密度阈值,则将所述直播间j识别为第一目标直播间集;
S112、将与第一目标直播间互动的第一目标识别为第一目标团体;其中,所述第一目标直播间属于第一目标直播间集,所述第一目标属于第一目标集。


2.如权利要求1所述的方法,其特征在于,所述将与所述第一目标直播间集中的第一目标直播间互动的第一目标识别为第一目标团体之后,所述方法还包括:
S113、判断与目标i互动的所述第一目标直播间的数量NSu是否大于第三阈值,NSu/Nu是否大于第四阈值,以及所述布尔矩阵中与所述目标i相关的互动次数形成的第二子矩阵的矩阵密度是否大于第二密度阈值;其中,Nu表示与所述目标i互动的总直播间数量;
S114、若同时满足NSu大于第三阈值,NSu/Nu大于第四阈值,以及所述第二子矩阵的矩阵密度大于第二密度阈值,则将所述目标i识别为第二目标集;
S115、将所述第二目标集与所述第一目标团体合并,获得一级目标团体集。


3.如权利要求2所述的方法,其特征在于,在获得初级目标团体集之后,所述方法还包括:
S116、以所述一级目标团体集代替所述第一目标集,并返回执行S110-S111,获得第二目标直播间集;
S117、以所述第二目标直播间集集代替所述第一目标直播间集后,执行S113-S114,获得第三目标集;
S118、将所述第二目标集与所述第三目标集合并,获得二级目标团体集;
按照S116-S118,循环迭代至第h目标直播间集与第h-1目标直播间集相同,且k级目标团体集与k-1级目标团体集相同,获得第h目标直播间集和k级目标团体集;其中,k大于等于二,h大于等于二。


4.如权利要求1所述的方法,其特征在于,所述对所述目标矩阵进行布尔化处理,获得布尔矩阵,包括:
判断所述目标矩阵中的wij是否满足wij>0;
若满足,则将该wij替换为bij=1,否则替换为bij=0,获得所述布尔矩阵。


5.如权利要求4所述的方法,其特征在于,所述基于3sigma原则以及所述极坐标半径概率的均值和标准差...

【专利技术属性】
技术研发人员:王璐
申请(专利权)人:武汉瓯越网视有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1