一种人数统计方法、系统及相关装置制造方法及图纸

技术编号:20916901 阅读:37 留言:0更新日期:2019-04-20 09:46
本申请所提供的一种人数统计方法,包括:在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;利用声纹特征信息,计算各个目标语音之间的相似度;根据各个目标语音之间的相似度,对各个目标语音进行聚类处理,得到各个语音类别;统计语音类别的数量以确定各个目标语音所属的人的数量。可见,该方法对各个目标语音进行聚类处理,能够避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率。本申请还提供一种人数统计系统、设备及计算机可读存储介质,均具有上述有益效果。

A Method, System and Related Device for Number Statistics

This application provides a method for counting the number of people, including: obtaining the voiceprint feature information of each target voice after voice verification; calculating the similarity of each target voice by using the voiceprint feature information; clustering each target voice according to the similarity of each target voice to get each voice category; and counting the voice categories. Other numbers are used to determine the number of people to whom each target voice belongs. It can be seen that this method can cluster each target speech and avoid the same person being repeatedly counted when the number of statisticians is counted, thus saving statistical costs and improving statistical efficiency. The application also provides a population statistics system, equipment and computer readable storage medium, all of which have the above beneficial effects.

【技术实现步骤摘要】
一种人数统计方法、系统及相关装置
本申请涉及人数统计
,特别涉及一种人数统计方法、系统、设备及计算机可读存储介质。
技术介绍
目前,一些网站需要对访问人数进行统计,在语音验证过程中存在同一人多次验证的情况,造成最终验证人数统计重复的问题。也就是说,相关技术是统计通过语音验证的语音的数量作为需统计的人数,但是这些语音中可能有多个语音是同一个人发出的,同一个人被重复统计,浪费了统计成本,降低了统计效率。因此,如何避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率是本领域技术人员需要解决的技术问题。
技术实现思路
本申请的目的是提供一种人数统计方法、系统、设备及计算机可读存储介质,能够避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率。为解决上述技术问题,本申请提供一种人数统计方法,包括:在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;利用所述声纹特征信息,计算各个所述目标语音之间的相似度;根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别;统计所述语音类别的数量以确定各个所述目标语音所属的人的数量。优选地,所述根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别,包括:根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行AHC层次聚类处理,得到各个所述语音类别。优选地,所述在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息,包括:利用ASR技术将各个所述语音转化为对应的字符;根据各个所述语音对应的字符与预设字符匹配情况,筛选出各个所述目标语音;获取各个所述目标语音的所述声纹特征信息。优选地,利用ASR技术将各个所述语音转化为对应的字符之前,还包括:利用TTS检测模型检测各个所述语音的发出者是否具有生命特征信息;若是,则执行所述利用ASR技术将各个所述语音转化为对应的字符的步骤。本申请还提供一种人数统计系统,包括:声纹特征信息获取模块,用于在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;相似度计算模块,用于利用所述声纹特征信息,计算各个所述目标语音之间的相似度;聚类处理模块,用于根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别;数量统计模块,用于统计所述语音类别的数量以确定各个所述目标语音所属的人的数量。优选地,所述聚类处理模块,包括:AHC层次聚类处理单元,用于根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行AHC层次聚类处理,得到各个所述语音类别。优选地,所述声纹特征信息获取模块,包括:语音识别单元,用于利用ASR技术将各个所述语音转化为对应的字符;目标语音筛选单元,用于根据各个所述语音对应的字符与预设字符匹配情况,筛选出各个所述目标语音;声纹特征信息获取单元,用于获取各个所述目标语音的所述声纹特征信息。优选地,该人数统计系统还包括:检测单元,用于利用TTS检测模型检测各个所述语音的发出者是否具有生命特征信息;所述语音识别单元具体为当各个所述语音的所述发出者具有所述生命特征信息时,利用所述ASR技术将各个所述语音转化为对应的字符的单元。本申请还提供一种设备,包括:存储器和处理器;其中,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述所述的人数统计方法的步骤。本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的人数统计方法的步骤。本申请所提供的一种人数统计方法,包括:在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;利用所述声纹特征信息,计算各个所述目标语音之间的相似度;根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别;统计所述语音类别的数量以确定各个所述目标语音所属的人的数量。该方法先是在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息,然后利用所述声纹特征信息,计算各个所述目标语音之间的相似度,再根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别,最后统计所述语音类别的数量以确定各个所述目标语音所属的人的数量。可见,该方法对各个目标语音进行聚类处理,能够避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率。本申请还提供一种人数统计系统、设备及计算机可读存储介质,均具有上述有益效果,在此不再赘述。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例所提供的一种人数统计方法的流程图;图2为本申请实施例所提供的一种人数统计系统的结构框图。具体实施方式本申请的核心是提供一种人数统计方法,能够避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率。本申请的另一核心是提供一种人数统计系统、设备及计算机可读存储介质。为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。目前,一些网站需要对访问人数进行统计,在语音验证过程中存在同一人多次验证的情况,造成最终验证人数统计重复的问题。也就是说,相关技术是统计通过语音验证的语音的数量作为需统计的人数,但是这些语音中可能有多个语音是同一个人发出的,同一个人被重复统计,浪费了统计成本,降低了统计效率。本申请实施例能够避免统计人数时同一个人被重复统计,进而节省统计成本,提高统计效率,具体请参考图1,图1为本申请实施例所提供的一种人数统计方法的流程图,该人数统计方法具体包括:S101、在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;本申请实施例在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息。在此对语音验证的方式不作具体限定,应由本领域技术人员根据实际情况作出相应的设定,通常利用语音识别技术识别出语音的内容,再将识别出的内容与预设的内容进行匹配。进一步地,对于上述语音的内容在此不作具体限定,应由本领域技术人员根据实际情况作出相应的设定,例如可以为语音验证码。进一步地,对于该语音验证码的字符位数也不作具体限定,例如可以为4位,还可以为6位。在此对上述进行语音验证的语音的数量不作具体限定,应由本领域技术人员根据实际情况作出相应的设定。这些语音中通过语音验证的即为上述目标语音,在此对目标语音的数量也不作具体限定,需根据实际情况而定。每一个目标语音都有一个声纹特征信息,因为本申请实施例对目标语音的数量不作具体限定,故本申请实施例对声纹特征信息的数量也不作具体限定。在此对每一个声纹特征信息的内容也不作具体限定,一个声纹特征信息至少包括该目标语音的波长信息、频率信息及强度信息等信息中的一种。进一步地,本文档来自技高网...

【技术保护点】
1.一种人数统计方法,其特征在于,包括:在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;利用所述声纹特征信息,计算各个所述目标语音之间的相似度;根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别;统计所述语音类别的数量以确定各个所述目标语音所属的人的数量。

【技术特征摘要】
1.一种人数统计方法,其特征在于,包括:在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;利用所述声纹特征信息,计算各个所述目标语音之间的相似度;根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别;统计所述语音类别的数量以确定各个所述目标语音所属的人的数量。2.根据权利要求1所述的人数统计方法,其特征在于,所述根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行聚类处理,得到各个语音类别,包括:根据各个所述目标语音之间的所述相似度,对各个所述目标语音进行AHC层次聚类处理,得到各个所述语音类别。3.根据权利要求1所述的人数统计方法,其特征在于,所述在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息,包括:利用ASR技术将各个所述语音转化为对应的字符;根据各个所述语音对应的字符与预设字符匹配情况,筛选出各个所述目标语音;获取各个所述目标语音的所述声纹特征信息。4.根据权利要求3所述的人数统计方法,其特征在于,利用ASR技术将各个所述语音转化为对应的字符之前,还包括:利用TTS检测模型检测各个所述语音的发出者是否具有生命特征信息;若是,则执行所述利用ASR技术将各个所述语音转化为对应的字符的步骤。5.一种人数统计系统,其特征在于,包括:声纹特征信息获取模块,用于在将各个语音进行语音验证后,获取各个目标语音的声纹特征信息;相似度计算模块,用于利用所述声纹特征信息,计算各个所述目标语音之间的相似度;聚类处理...

【专利技术属性】
技术研发人员:郑棉洲陈昊亮
申请(专利权)人:广州势必可赢网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1