直播间内用户的检测方法和系统、电子设备及存储介质技术方案

技术编号：29412458 阅读：21 留言：0更新日期：2021-07-23 22:54

本发明专利技术实施例提供了一种直播间内用户的检测方法和系统、电子设备及存储介质，其中，方法包括：根据检测规则获取直播间内每个用户的多个第一特征向量，第一特征向量包含与经过筛选的敏感词相关的公屏特征；将第一特征向量输入至第一网络模型，对应输出每个用户的第一检测结果；若第一检测结果满足第一检测条件，则输出第一检测结果对应的用户的标识信息。本发明专利技术实施例对通用敏感词进行筛选，提高了筛选后的敏感词的准确性。利用多个第一特征向量和第一网络模型对用户是否为恋童癖进行评分，根据评分结果判断用户是否为恋童癖，避免仅从公屏发言这一种单一的交互行为判断用户是否为恋童癖，丰富了判断恋童癖的用户特征，提升恋童癖判断的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
直播间内用户的检测方法和系统、电子设备及存储介质
本专利技术属于计算机
，特别是涉及一种直播间内用户的检测方法和系统、电子设备及存储介质。
技术介绍
随着用户在直播平台中的操作，会与直播平台中的其他用户产生各种交互行为与关联关系。而且，交互行为与关联关系非常复杂，尤其是公屏发言与语境关系密切。恋童癖是指16岁以上的青少年或者成年人对青春期前的儿童拥有强烈且反复的性冲动和幻想，且已就这种性冲动采取行动或受其困扰的人。目前，为了检测直播间内的用户是否为恋童癖，可以判断用户的公屏发言中是否包含了通用敏感词，如果公屏发言包含了通用敏感词，则确定用户为恋童癖。但是，通用敏感词的准确性不高，单一的发送公屏发言的交互行为很难建立与恋童癖的强逻辑关系，因此，现有的检测直播间内的用户是否为恋童癖的方案的准确性不高。
技术实现思路
有鉴于此，本专利技术提供一种直播间内用户的检测方法和系统、电子设备及存储介质，在一定程度上解决了现有的检测直播间内的用户是否为恋童癖的方案的准确性不高的问题。本专利技术实施例的第一方面，提供了一种直播间内用户的检测方法，包括：根据预设的检测规则，获取直播间内每个用户的多个第一特征向量，所述第一特征向量包含与经过筛选的敏感词相关的公屏特征；将所述第一特征向量输入至训练完毕的第一网络模型，对应输出每个所述用户的第一检测结果；若所述第一检测结果满足预设的第一检测条件，则输出所述第一检测结果对应的用户的标识信息。本专利技术实施例的第二方面，提供了一种直播间内用户的检测...

【技术保护点】
1.一种直播间内用户的检测方法，其特征在于，包括：/n根据预设的检测规则，获取直播间内每个用户的多个第一特征向量，所述第一特征向量包含与经过筛选的敏感词相关的公屏特征；/n将所述第一特征向量输入至训练完毕的第一网络模型，对应输出每个所述用户的第一检测结果；/n若所述第一检测结果满足预设的第一检测条件，则输出所述第一检测结果对应的用户的标识信息。/n

【技术特征摘要】
1.一种直播间内用户的检测方法，其特征在于，包括：
根据预设的检测规则，获取直播间内每个用户的多个第一特征向量，所述第一特征向量包含与经过筛选的敏感词相关的公屏特征；
将所述第一特征向量输入至训练完毕的第一网络模型，对应输出每个所述用户的第一检测结果；
若所述第一检测结果满足预设的第一检测条件，则输出所述第一检测结果对应的用户的标识信息。

2.根据权利要求1所述的方法，其特征在于，所述敏感词的筛选步骤，包括：
获取通用敏感词集合；
针对所述通用敏感词集合中的每个通用敏感词，在预设类型的直播间进行敏感词筛选。

3.根据权利要求2所述的方法，其特征在于，所述针对所述通用敏感词集合中的每个通用敏感词，在预设类型的直播间进行敏感词筛选，包括：
针对每个所述通用敏感词，获取所述通用敏感词在第一用户集合中的第一使用次数、在第二用户集合中的第二使用次数和在所述预设类型的直播间中的数量；
根据所述第一使用次数、所述第二使用次数、所述数量和预设的阈值对所述通用敏感词进行筛选。

4.根据权利要求3所述的方法，其特征在于，所述第二用户集合从第三用户集合中抽样得到，所述预设的阈值包含第一阈值、第二阈值、第三阈值和第四阈值；
所述根据所述第一使用次数、所述第二使用次数、所述数量和预设的阈值对所述通用敏感词进行筛选，包括：
根据所述第一使用次数、所述第二使用次数、所述数量、所述第二用户集合占所述第三用户集合的抽样比、所述第一阈值、所述第二阈值、所述第三阈值和所述第四阈值，对所述通用敏感词进行筛选。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一使用次数、所述第二使用次数、所述数量、所述第二用户集合占所述第三用户集合的抽样比、所述第一阈值、所述第二阈值、所述第三阈值和所述第四阈值，对所述通用敏感词进行筛选，包括：
将所述第二使用次数和所述抽样比的乘积，与所述第一使用次数相加，得到和值；
将所述第一使用次数与所述和值相除得到第一比值；
当所述第一比值大于或等于所述第二阈值，且小于所述第一阈值时，将所述第一使用次数与所述第一使用次数和所述数量的和值相除，得到第二比值，若所述第二比值小于所述第三阈值，则将所述通用敏感词作为可疑敏感词；
当所述第一比值小于所述第二阈值时，若所述第二比值大于或等于所述第四阈值，且小于所述第三阈值，则将所述通用敏感词作为可疑敏感词。

6.根据权利要求1所述的方法，其特征在于，所述第一网络模型的训练步骤，包括：
根据所述检测规则对所述第一特征向量的权重进行调整。

7.根...

【专利技术属性】
技术研发人员：李益永，孙准，黄秋实，井雪，项伟，
申请(专利权)人：百果园技术新加坡有限公司，
类型：发明
国别省市：新加坡;SG

全部详细技术资料下载我是这个专利的主人