人员识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：40600270 阅读：4 留言：0更新日期：2024-03-12 22:04

本申请提供了一种人员识别方法、装置、计算机设备和存储介质。该方法包括：获取媒体数据集；媒体数据集包括至少一种模态的媒体数据；对于媒体数据集中的每种模态，基于该模态对应的识别手段，对媒体数据进行识别，得到该模态对应的待决策识别结果；若模态的数量为一个，则将该模态对应的待决策识别结果作为最终识别结果；若模态的数量为两个，则将该两个模态中识别准确率高的模态对应的待决策识别结果作为最终识别结果；若模态的数量为至少三个，则以多数决的方式从不同类的待决策识别结果中确定最终识别结果。该方法在多模态数据均可用的情况下，可结合不同模态信息进行决策判断，有效提升了未成年人识别的准确率和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，尤其涉及一种人员识别方法、装置、计算机设备和存储介质。

技术介绍

1、随着5g和人工智能的快速发展，随着社会的发展，互联网技术的日益普及，网络上的多媒体数据也越来越多。与此同时，青少年的上网时间也越来越长，网络环境也越来越复杂。在这种情况下，保护未成年人的合法权益就变得非常重要。其中一个方面就是防止未成年人接触不适宜的内容，包括限制未成年人看到违禁内容，同时要对未成年人进行记录和识别等。传统技术会通过单一模态的媒体数据进行判别，但存在着算法准确率低，易受终端和环境干扰等问题。

技术实现思路

1、本申请的目的旨在至少能解决上述的技术缺陷之一，特别是现有技术中单一模态的未成年人识别技术的识别准确率不高的问题。

2、第一方面，本申请提供了一种人员识别方法，包括：

3、获取媒体数据集；媒体数据集包括至少一种模态的媒体数据；

4、对于媒体数据集中的每种模态，基于该模态对应的识别手段，对媒体数据进行识别，得到该模态对应的待决策识别结果；

5、若模态的数量为一个，则将该模态对应的待决策识别结果作为最终识别结果；

6、若模态的数量为两个，则将该两个模态中识别准确率高的模态对应的待决策识别结果作为最终识别结果；

7、若模态的数量为至少三个，则以多数决的方式从不同类的待决策识别结果中确定最终识别结果。

8、在其中一个实施例中，识别准确率的获取过程包括：

9、以需要获取识别准确率的模态为目

10、基于目标模态对应的识别手段，对测试数据集进行识别，得到待验证识别结果；

11、将待验证识别结果与测试数据集的标注进行比较，以确定目标模态的识别准确率。

12、在其中一个实施例中，若模态的数量为至少三个，则以多数决的方式从不同类的待决策识别结果中确定最终识别结果，还包括：

13、若每类待决策识别结果中的模态数量均相同，则分别确定每类待决策识别结果中各模态的平均识别准确率；

14、将平均识别准确率高的一类待决策识别结果确定为最终识别结果。

15、在其中一个实施例中，媒体数据集中存在的模态包括文本模态，对于文本模态，基于该模态对应的识别手段，对媒体数据进行识别，包括：

16、将文本模态对应的媒体数据与关键词库中的关键词进行匹配；

17、若命中白名单关键词，则文本模态对应的待决策识别结果为非未成年人；

18、若命中强匹配关键词，则文本模态对应的待决策识别结果为未成年人；

19、若命中弱匹配关键词，则将媒体数据输入文本判别模型，并根据文本判别模型的判别结果，得到文本模态对应的待决策识别结果。

20、在其中一个实施例中，将文本模态对应的媒体数据与关键词库中的关键词进行匹配，包括：

21、将文本模态对应的媒体数据进行数据清洗和分词处理，得到多个分词；

22、确定每个分词的重要程度；

23、按照重要程度由高至低的顺序，依次将各分词与关键词库中的关键词进行匹配。

24、在其中一个实施例中，确定每个分词的重要程度，包括：

25、计算每个分词的tf-idf值，以得到重要程度。

26、在其中一个实施例中，在得到最终识别结果后，还包括：

27、获取用户对最终识别结果的反馈信息；

28、在反馈信息与最终识别结果不一致的情况下，提示用户提交补充信息。

29、第二方面，本申请还提供了一种人员识别装置，包括：

30、数据获取模块，用于获取媒体数据集；媒体数据集包括至少一种模态的媒体数据；

31、结果获取模块，用于对于媒体数据集中的每种模态，基于该模态对应的识别手段，对媒体数据进行识别，得到该模态对应的待决策识别结果；

32、第一决策模块，用于在模态的数量为一个时，则将该模态对应的待决策识别结果作为最终识别结果；

33、第二决策模块，用于在模态的数量为两个时，则将该两个模态中识别准确率高的模态对应的待决策识别结果作为最终识别结果；

34、第三决策模块，用于在模态的数量为至少三个时，则以多数决的方式从不同类的待决策识别结果中确定最终识别结果。

35、第三方面，本申请还提供了一种计算机设备，包括一个或多个处理器，以及存储器，存储器中存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时，执行上述任一实施例中的人员识别方法的步骤。

36、第四方面，本申请还提供了一种存储介质，存储介质中存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述任一实施例中的人员识别方法的步骤。

37、从以上技术方案可以看出，本申请实施例具有以下优点：

38、基于上述任一实施例，首先获取至少一种模态的媒体数据集。然后，针对每种模态设计专属的识别手段，对每个模态的数据进行识别，得到每个模态的初步判断结果。根据模态的数量，设计了不同的决策方式：如果只有单一模态，直接输出该模态的判断。如果有两种模态，选择识别准确率更高的模态结果。如果有三种或更多模态，则进行多数决，即统计各模态在不同类别判断结果下的数量，选择数量更多的类别作为最终判断结果。该方法在多模态数据均可用的情况下，可结合不同模态信息进行决策判断，有效提升了未成年人识别的准确率和可靠性。

本文档来自技高网...

【技术保护点】

1.一种人员识别方法，其特征在于，包括：

2.根据权利要求1所述的人员识别方法，其特征在于，所述识别准确率的获取过程包括：

3.根据权利要求1所述的人员识别方法，其特征在于，所述若所述模态的数量为至少三个，则以多数决的方式从不同类的所述待决策识别结果中确定所述最终识别结果，还包括：

4.根据权利要求1所述的人员识别方法，其特征在于，所述媒体数据集中存在的模态包括文本模态，对于所述文本模态，所述基于该所述模态对应的识别手段，对所述媒体数据进行识别，包括：

5.根据权利要求4所述的人员识别方法，其特征在于，所述将所述文本模态对应的所述媒体数据与关键词库中的关键词进行匹配，包括：

6.根据权利要求5所述的人员识别方法，其特征在于，所述确定每个所述分词的重要程度，包括：

7.根据权利要求1所述的人员识别方法，其特征在于，在得到所述最终识别结果后，还包括：

8.一种人员识别装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括一个或多个处理器，以及存储器，所述存储器中存储有计算机可读指令

10.一种存储介质，其特征在于，所述存储介质中存储有计算机可读指令，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如权利要求1至7任一项所述的人员识别方法的步骤。

...

【技术特征摘要】

1.一种人员识别方法，其特征在于，包括：

2.根据权利要求1所述的人员识别方法，其特征在于，所述识别准确率的获取过程包括：

5.根据权利要求4所述的人员识别方法，其特征在于，所述将所述文本模态对应的所述媒体数据与关键词库中的关键词进行匹配，包括：

6.根...

【专利技术属性】
技术研发人员：马金龙，邓其春，吴文亮，张政统，王伟喆，熊佳，盘子圣，黄祥康，周阳，曾锐鸿，黎子骏，兰翔，廖艳冰，马飞，徐志坚，谢睿，陈光尧，
申请(专利权)人：广州趣研网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人