违规用户识别方法、装置、设备、存储介质以及产品制造方法及图纸

技术编号:39052598 阅读:17 留言:0更新日期:2023-10-12 19:45
本申请实施例提供了一种违规用户识别方法、装置、设备、存储介质以及产品,该方法包括:获取待识别用户的历史违规数据,历史违规数据中记录有待识别用户的违规特征及对应的违规特征值;然后,基于每个违规特征对应的特征权重及违规特征值计算得到待识别用户的第一评估分值,特征权重基于非负线性规划模型的寻优计算过程得到;进而将违规特征及对应的违规特征分值输入至训练完成的目标决策树模型,以得到待识别用户的第二评估分值;最后,根据第一评估分值、第二评估分值及预设检测模型输出的违规分值进行待识别用户的推送,以确定是否为违规用户。本方案通过引入非负线性规划模型及决策树模型进行待识别用户的评估,提高了违规用户的识别准确率。用户的识别准确率。用户的识别准确率。

【技术实现步骤摘要】
违规用户识别方法、装置、设备、存储介质以及产品


[0001]本申请实施例涉及计算机
,尤其涉及一种违规用户识别方法、装置、设备、存储介质以及产品。

技术介绍

[0002]随着网络的发展以及多媒体技术的成熟,网络直播成为了当下用户的主要娱乐方式之一。如主播在直播间进行视频、语音的直播,用户可以访问直播间后,与主播以及直播间的其它用户进行互动。在直播过程中,有些用户会产生一些违规行为,如发送不当言论,进行违规操作等,需要对违规用户进行识别并进行相应的处罚,以保证网络环境的健康、安全。
[0003]相关技术中,通常采用对语音信号或文字进行识别的方式以确定违规用户。针对语音信号识别的情况,通常使用的语音模型需要对一定时长的语音才能给出识别结果,其本身识别能力有限,导致识别准确率低。针对文字识别的情况,通常需要进行语音到文字的转换,会带来一定的运算损耗,同时由于文字的形变特性以及训练样本的缺乏,也导致了语义识别准确率低进而无法及时识别违规用户的问题。

技术实现思路

[0004]本申请实施例提供了一种违规用户识别方法、装置、设备、存储介质以及产品,解决了现有的违规检测方法对于违规用户的识别准确率较低的问题,通过引入非负线性规划模型以及决策树模型进行待识别用户的评估,提高了违规用户的识别准确率。
[0005]第一方面,本申请实施例提供了一种违规用户识别方法,该方法包括:
[0006]获取待识别用户的历史违规数据,所述历史违规数据中记录有所述待识别用户的违规特征以及对应的违规特征值;r/>[0007]基于每个违规特征对应的特征权重以及所述违规特征值计算得到所述待识别用户的第一评估分值,所述特征权重基于非负线性规划模型的寻优计算过程得到;
[0008]将所述违规特征以及对应的违规特征分值输入至训练完成的目标决策树模型,以得到所述待识别用户的第二评估分值;
[0009]根据所述第一评估分值、所述第二评估分值以及预设检测模型输出的违规分值进行所述待识别用户的推送,以确定是否为违规用户。
[0010]第二方面,本申请实施例还提供了一种违规用户识别装置,包括:
[0011]获取模块,配置为获取待识别用户的历史违规数据,所述历史违规数据中记录有所述待识别用户的违规特征以及对应的违规特征值;
[0012]第一分值计算模块,配置为基于每个违规特征对应的特征权重以及所述违规特征值计算得到所述待识别用户的第一评估分值,所述特征权重基于非负线性规划模型的寻优计算过程得到;
[0013]第二分值计算模块,配置为将所述违规特征以及对应的违规特征分值输入至训练
完成的目标决策树模型,以得到所述待识别用户的第二评估分值;
[0014]识别模块,配置为根据所述第一评估分值、所述第二评估分值以及预设检测模型输出的违规分值进行所述待识别用户的推送,以确定是否为违规用户。
[0015]第三方面,本申请实施例还提供了一种违规用户识别设备,该设备包括:
[0016]一个或多个处理器;
[0017]存储装置,配置为存储一个或多个程序,
[0018]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请实施例所述的违规用户识别方法。
[0019]第四方面,本申请实施例还提供了一种存储计算机可执行指令的非易失性存储介质,所述计算机可执行指令在由计算机处理器执行时配置为执行本申请实施例所述的违规用户识别方法。
[0020]第五方面,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中,设备的至少一个处理器从计算机可读存储介质读取并执行计算机程序,使得设备执行本申请实施例所述的违规用户识别方法。
[0021]本申请实施例中,通过获取待识别用户的历史违规数据,历史违规数据中记录有待识别用户的违规特征以及对应的违规特征值,然后,基于每个违规特征对应的特征权重以及违规特征值计算得到待识别用户的第一评估分值,特征权重基于非负线性规划模型的寻优计算过程得到,进而将违规特征以及对应的违规特征分值输入至训练完成的目标决策树模型,以得到待识别用户的第二评估分值,最后,根据第一评估分值、第二评估分值以及预设检测模型输出的违规分值进行待识别用户的推送,以确定是否为违规用户。通过引入非负线性规划模型以及决策树模型分别计算得到评估分值后,以此作为辅助参考,结合预设检测模型输出的违规分值进行待识别用户的推送,提高了违规用户的识别准确率。
附图说明
[0022]图1为本申请实施例提供的一种违规用户识别方法的流程图;
[0023]图2为本申请实施例提供的一种计算得到特征权重的方法的流程图;
[0024]图3为本申请实施例提供的一种构建得到决策树模型的方法的流程图;
[0025]图4为本申请实施例提供的一种违规用户识别装置的结构框图;
[0026]图5为本申请实施例提供的一种违规用户识别设备的结构示意图。
具体实施方式
[0027]下面结合附图和实施例对本申请实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请实施例,而非对本申请实施例的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请实施例相关的部分而非全部结构。
[0028]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可
以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0029]本申请实施例提供的违规用户识别方法,用于在线互动过程中违规用户的识别,有利于净化网络环境。具体应用场景可以包括:室内直播,户外直播,短视频以及语音直播等。以室内直播为示例,可以用于判断用户是否在上麦过程中出现言语违规的行为,也可以用于判断用户是否在公屏输出过程中出现文字违规的行为等。前述罗列的几种应用场景仅是示例性和解释性的,在实际应用中,还可以在其他场景下的违规用户识别中用到该违规用户识别方法,本申请实施例对此不作限定。本申请旨在提供一种违规用户识别方法,解决现有的违规检测方法对于违规用户的识别准确率较低的问题。
[0030]本申请实施例提供的违规用户识别方法,各步骤的执行主体可以是计算机设备,该计算机设备是指任何具备数据计算、处理和存储能力的电子设备,如手机、PC(Personal Computer,个人计算机)、平板电脑等终端设备,也可以是服务器等设备,本申请实施例对此不作限定。
[0031]图1为本申请实施例提供的一种违规用户识别方法的流程图,该违规用户识别方法基于待识别本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.违规用户识别方法,其特征在于,包括:获取待识别用户的历史违规数据,所述历史违规数据中记录有所述待识别用户的违规特征以及对应的违规特征值;基于每个违规特征对应的特征权重以及所述违规特征值计算得到所述待识别用户的第一评估分值,所述特征权重基于非负线性规划模型的寻优计算过程得到;将所述违规特征以及对应的违规特征分值输入至训练完成的目标决策树模型,以得到所述待识别用户的第二评估分值;根据所述第一评估分值、所述第二评估分值以及预设检测模型输出的违规分值进行所述待识别用户的推送,以确定是否为违规用户。2.根据权利要求1所述的违规用户识别方法,其特征在于,在所述获取待识别用户的历史违规数据之前,还包括:获取模型训练样本,所述模型训练样本包括样本违规特征、样本违规特征值以及违规标签值,所述违规标签值表征用户是否违规;基于所述模型训练样本对设置的非负线性规划模型进行寻优计算得到每个所述样本违规特征对应的特征权重。3.根据权利要求2所述的违规用户识别方法,其特征在于,所述非负线性规划模型包括构建的目标函数以及相应的约束条件,所述约束条件包括特征权重的非负性约束和特征权重之和的数值约束。4.根据权利要求1所述的违规用户识别方法,其特征在于,所述将所述违规特征以及对应的违规特征分值输入至训练完成的目标决策树模型,以得到所述待识别用户的第二评估分值,包括:将所述违规特征以及对应的违规特征分值输入至训练完成的目标决策树模型,得到所述待识别用户的分类结果;将所述分类结果对应的匹配分值确定为所述待识别用户的第二评估分值。5.根据权利要求1所述的违规用户识别方法,其特征在于,在所述获取待识别用户的历史违规数据之前,还包括:获取模型训练样本,所述模型训练样本包括样本违规特征、样本违规特征值以及违规标签值,所述违规标签值表征用户是否违规;基于所述模型训练样本进行目标决策树模型的构建。6.根据权利要求5所述的违规用户识别方法,其特征在于,所述基于所述模型训练样本进行目标决策树模型的构建,包括:确定所述模型训练样本中每个样本违规特征对应为预设的数值特征值时所述模型训练样本的基尼系数;根据所述基尼系数对所述模型训练样本中的特征进行筛选得到目标决策树模型的节点,直至所述目标决策树模型建树完成。7.根据权利要求1

6中任一项所述的违规用户识别方法,其特征在于,所述根据所述第一评估分值、所述第二评估分值以及预设检测模型输出的违规分值进行所述待识别用...

【专利技术属性】
技术研发人员:李益永杨晓斌陈德健李聪健项伟
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1