直播间内用户的检测方法和系统、电子设备及存储介质技术方案

技术编号:29412458 阅读:21 留言:0更新日期:2021-07-23 22:54
本发明专利技术实施例提供了一种直播间内用户的检测方法和系统、电子设备及存储介质,其中,方法包括:根据检测规则获取直播间内每个用户的多个第一特征向量,第一特征向量包含与经过筛选的敏感词相关的公屏特征;将第一特征向量输入至第一网络模型,对应输出每个用户的第一检测结果;若第一检测结果满足第一检测条件,则输出第一检测结果对应的用户的标识信息。本发明专利技术实施例对通用敏感词进行筛选,提高了筛选后的敏感词的准确性。利用多个第一特征向量和第一网络模型对用户是否为恋童癖进行评分,根据评分结果判断用户是否为恋童癖,避免仅从公屏发言这一种单一的交互行为判断用户是否为恋童癖,丰富了判断恋童癖的用户特征,提升恋童癖判断的准确性。

【技术实现步骤摘要】
直播间内用户的检测方法和系统、电子设备及存储介质
本专利技术属于计算机
,特别是涉及一种直播间内用户的检测方法和系统、电子设备及存储介质。
技术介绍
随着用户在直播平台中的操作,会与直播平台中的其他用户产生各种交互行为与关联关系。而且,交互行为与关联关系非常复杂,尤其是公屏发言与语境关系密切。恋童癖是指16岁以上的青少年或者成年人对青春期前的儿童拥有强烈且反复的性冲动和幻想,且已就这种性冲动采取行动或受其困扰的人。目前,为了检测直播间内的用户是否为恋童癖,可以判断用户的公屏发言中是否包含了通用敏感词,如果公屏发言包含了通用敏感词,则确定用户为恋童癖。但是,通用敏感词的准确性不高,单一的发送公屏发言的交互行为很难建立与恋童癖的强逻辑关系,因此,现有的检测直播间内的用户是否为恋童癖的方案的准确性不高。
技术实现思路
有鉴于此,本专利技术提供一种直播间内用户的检测方法和系统、电子设备及存储介质,在一定程度上解决了现有的检测直播间内的用户是否为恋童癖的方案的准确性不高的问题。本专利技术实施例的第一方面,提供了一种直播间内用户的检测方法,包括:根据预设的检测规则,获取直播间内每个用户的多个第一特征向量,所述第一特征向量包含与经过筛选的敏感词相关的公屏特征;将所述第一特征向量输入至训练完毕的第一网络模型,对应输出每个所述用户的第一检测结果;若所述第一检测结果满足预设的第一检测条件,则输出所述第一检测结果对应的用户的标识信息。本专利技术实施例的第二方面,提供了一种直播间内用户的检测系统,包括:获取模块,用于根据预设的检测规则,获取直播间内每个用户的多个第一特征向量,所述第一特征向量包含与经过筛选的敏感词相关的公屏特征;输入模块,用于将所述第一特征向量输入至训练完毕的第一网络模型,对应输出每个所述用户的第一检测结果;输出模块,用于若所述第一检测结果满足预设的第一检测条件,则输出所述第一检测结果对应的用户的标识信息。本专利技术实施例的第三方面,提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的直播间内用户的检测方法。本专利技术实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如第一方面所述的直播间内用户的检测方法。本专利技术实施例提供的技术方案,具有以下有益效果:根据预设的检测规则,获取直播间内每个用户的多个第一特征向量。其中,第一特征向量包含与经过筛选的敏感词相关的公屏特征。即第一特征向量包含与对通用敏感词进行筛选操作后得到的敏感词,相关的公屏特征。然后,将第一特征向量输入至训练完毕的第一网络模型,对应输出每个用户的第一检测结果。若第一检测结果满足预设的第一检测条件,则输出第一检测结果对应的用户的标识信息。在恋童癖检测场景下,输出的标识信息可以为恋童癖的标识信息。本专利技术实施例在对直播间内的用户进行恋童癖检测时,并非简单地判断公屏发言中是否包含了通用敏感词,而是获取与检测规则对应的第一特征向量,利用训练完毕的第一网络模型和第一特征向量输出用户的第一检测结果,进而判断第一检测结果是否满足第一检测条件,如果第一检测结果满足第一检测条件,则可以确定第一检测结果对应的用户为恋童癖。本专利技术实施例对通用敏感词进行筛选,提高了筛选后的敏感词的准确性。而且,利用多个第一特征向量和第一网络模型对用户是否为恋童癖进行评分,第一检测结果可以理解为用户的评分结果,根据评分结果判断用户是否为恋童癖,避免仅从公屏发言这一种单一的交互行为判断用户是否为恋童癖,丰富了判断恋童癖的用户特征,从而提升恋童癖判断的准确性。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例提供的一种直播间内用户的检测方法的流程示意图;图2是本专利技术实施例提供的一种直播间内恋童癖的检测方案的流程示意图;图3是本专利技术实施例提供的一种直播间内用户的检测系统的框图;图4是本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。图1是本专利技术实施例提供的一种直播间内用户的检测方法的流程示意图,如图1所示,该直播间内用户的检测方法具体可以包含如下步骤。步骤101,根据预设的检测规则,获取直播间内每个用户的多个第一特征向量。在本专利技术的实施例中,可以为每次用户检测设定对应的检测规则,每个检测规则可以表示检测直播间内的用户是否为未成年用户,或者,检测直播间内的用户是否为恋童癖等等。本专利技术的实施例对检测规则的内容、格式等不做具体限制。在实际应用中,可以根据实际检测需求设定对应的检测规则。在本专利技术的实施例中,获取到的直播间内每个用户的多个第一特征向量,可以与检测规则对应。例如,检测规则为规则a,则获取第一特征向量m1,规则a与第一特征向量m1相对应。又例如,检测规则为规则b,则获取第一特征向量m1和m2,规则b与第一特征向量m1和m2相对应。本专利技术实施例中的第一特征向量可以包含公屏特征,公屏特征用于表示用户在直播间内的公屏发言,而且,公屏发言与经过筛选的敏感词相关,可以理解为,公屏发言中包含了经过筛选的敏感词。步骤102,将所述第一特征向量输入至训练完毕的第一网络模型,对应输出每个所述用户的第一检测结果。在本专利技术的实施例中,将获取到的第一特征向量作为第一网络模型的输入项,从第一网络模型输出第一检测结果,该第一检测结果为第一网络模型的输出项。第一检测结果可以表示按照检测规则对用户进行检测的评分结果。步骤103,若所述第一检测结果满足预设的第一检测条件,则输出所述第一检测结果对应的用户的标识信息。在本专利技术的实施例中,判断第一检测结果是否满足第一检测条件,如果第一检测结果满足第一检测条件,则认为第一检测结果对应的用户符合检测规则的用户,进而,输出第一检测结果对应的用户的标识信息。如果第一检测结果不满足第一检测条件,则认为第一检测结果对应的用户不符合检测规则的用户,不需要输出第一检测结果对应的用户的标识信息。在实际应用中,判断第一检测结果是否满足第一检测条件时,可以将第一检测结果所表示的评分结果,与第一检测条件所表示的评分阈值进行比较,如果评分结果大于评分阈值,则认为第一检测结果满足第一检测条件;如果评分结果小于或等于评分阈值,则认为第一检测结果不满足第一检测条件。在本专利技术实施例提供的直播间内用户的检测方案中,根据预设的检测规则,获取本文档来自技高网...

【技术保护点】
1.一种直播间内用户的检测方法,其特征在于,包括:/n根据预设的检测规则,获取直播间内每个用户的多个第一特征向量,所述第一特征向量包含与经过筛选的敏感词相关的公屏特征;/n将所述第一特征向量输入至训练完毕的第一网络模型,对应输出每个所述用户的第一检测结果;/n若所述第一检测结果满足预设的第一检测条件,则输出所述第一检测结果对应的用户的标识信息。/n

【技术特征摘要】
1.一种直播间内用户的检测方法,其特征在于,包括:
根据预设的检测规则,获取直播间内每个用户的多个第一特征向量,所述第一特征向量包含与经过筛选的敏感词相关的公屏特征;
将所述第一特征向量输入至训练完毕的第一网络模型,对应输出每个所述用户的第一检测结果;
若所述第一检测结果满足预设的第一检测条件,则输出所述第一检测结果对应的用户的标识信息。


2.根据权利要求1所述的方法,其特征在于,所述敏感词的筛选步骤,包括:
获取通用敏感词集合;
针对所述通用敏感词集合中的每个通用敏感词,在预设类型的直播间进行敏感词筛选。


3.根据权利要求2所述的方法,其特征在于,所述针对所述通用敏感词集合中的每个通用敏感词,在预设类型的直播间进行敏感词筛选,包括:
针对每个所述通用敏感词,获取所述通用敏感词在第一用户集合中的第一使用次数、在第二用户集合中的第二使用次数和在所述预设类型的直播间中的数量;
根据所述第一使用次数、所述第二使用次数、所述数量和预设的阈值对所述通用敏感词进行筛选。


4.根据权利要求3所述的方法,其特征在于,所述第二用户集合从第三用户集合中抽样得到,所述预设的阈值包含第一阈值、第二阈值、第三阈值和第四阈值;
所述根据所述第一使用次数、所述第二使用次数、所述数量和预设的阈值对所述通用敏感词进行筛选,包括:
根据所述第一使用次数、所述第二使用次数、所述数量、所述第二用户集合占所述第三用户集合的抽样比、所述第一阈值、所述第二阈值、所述第三阈值和所述第四阈值,对所述通用敏感词进行筛选。


5.根据权利要求4所述的方法,其特征在于,所述根据所述第一使用次数、所述第二使用次数、所述数量、所述第二用户集合占所述第三用户集合的抽样比、所述第一阈值、所述第二阈值、所述第三阈值和所述第四阈值,对所述通用敏感词进行筛选,包括:
将所述第二使用次数和所述抽样比的乘积,与所述第一使用次数相加,得到和值;
将所述第一使用次数与所述和值相除得到第一比值;
当所述第一比值大于或等于所述第二阈值,且小于所述第一阈值时,将所述第一使用次数与所述第一使用次数和所述数量的和值相除,得到第二比值,若所述第二比值小于所述第三阈值,则将所述通用敏感词作为可疑敏感词;
当所述第一比值小于所述第二阈值时,若所述第二比值大于或等于所述第四阈值,且小于所述第三阈值,则将所述通用敏感词作为可疑敏感词。


6.根据权利要求1所述的方法,其特征在于,所述第一网络模型的训练步骤,包括:
根据所述检测规则对所述第一特征向量的权重进行调整。


7.根...

【专利技术属性】
技术研发人员:李益永孙准黄秋实井雪项伟
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:新加坡;SG

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1