收音结束的判断方法、装置以及储存装置制造方法及图纸

技术编号:23485627 阅读:19 留言:0更新日期:2020-03-10 12:53
本申请公开了一种收音结束的判断方法、装置以及存储装置,其中方法包括:对当前声音片段进行语音活动检测获取第一值;通过深度学习对当前声音片段与下一条声音片段进行语义相关检测获取第二值;对第一值与所第二值进行加权计算以获取第三值;将第三值与预设阈值进行比较;根据所述比较的结果确定所述当前声音片段是否收音结束。通过上述方式,本申请提供的一种收音结束的判断方法、装置以及存储装置中,采用多检测方式获得第一值、第二值,并进一步采用权重算法获得第三值,最后进行比较判断是否收音结束,大大提升了准确率。

Judgment method, device and storage device of end of radio

【技术实现步骤摘要】
收音结束的判断方法、装置以及储存装置
本申请涉及收音结束判断领域,特别是涉及一种收音结束的判断方法、装置以及存储装置。
技术介绍
目前,智能设备与人之间的语言交互越来越频繁,如对话机器人,现有的对话机器人中,由于无法直接了解到对人类一段语言的语义,所以需要将采集到声音分成多个独立的语句,并分别对每个语句进行处理以执行相应的命令,因此如何将采集的声音进行识别并准确分成多个独立的语句显得较为重要,但是现有对话机器人仅仅通过人类说话中是否进行停顿来判断其说话是否结束,然后才执行或处理其结束的语言,这样可能会漏掉其后续的一些信息,导致执行上的失败与错误,准确率较差,且用户体验感不佳。且这样对于多人声(如人声,或电视人声等)的场景而言,由于是连续的,无法判断下指令的人类的语音是否结束,从而无法正确的识别出人类的指令信息。
技术实现思路
本申请提供一种收音结束的判断方法、装置以及存储装置,能够解决现有含有人声的声音片段中对于语言收音结束判断准确率不高的问题。本申请采用的一个技术方案是:提供一种收音结束的判断方法,其方法包括:对当前声音片段进行语音活动检测获取第一值;通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值;对所述第一值与所述第二值进行加权计算以获取第三值;将所述第三值与预设阈值进行比较;根据所述比较的结果确定所述当前声音片段是否收音结束。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种收音结束的判断装置,所述装置包括存储器及连接所述存储器的处理器;其中,所述处理器对当前声音片段进行语音活动检测获取第一值;所述处理器通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值;所述处理器对所述第一值与所述第二值进行加权计算以获取第三值;将所述第三值与预设阈值进行比较;根据所述比较的结果确定所述当前声音片段是否收音结束。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种存储装置,包括能实现上述方法的程序文件。本申请的有益效果是:区别于现有技术,本申请提供一种收音结束的判断方法、装置以及存储装置,通过采用语音活动检测来获取当前声音片段的第一值,通过深度学习对当前声音片段与下一条声音片段进行语义相关检测获取第二值,并将第一值与第二值的权重计算结果与预设阈值进行比较,如果小于预设阈值,则确定当前声音片段已经收音结束,相比现有仅仅采用语音活动检测方式来判断是否收音结束而言,本申请引入了深度学习的方法,对语义进行释义与相关性的计算,从而增加了整个收音结束判断的准确性。附图说明图1是本申请收音结束的判断方法一实施方式的结构示意图;图2是本申请收音结束的判断的装置一实施方式的结构示意框图;图3是本申请存储装置一实施方式的结构示意图。实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。另外,若本申请实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。请参阅图1,图1是本申请一种收音结束的判断方法的流程示意图,其具体包括如下步骤:S11,对当前声音片段进行语音活动检测获取第一值。在一具体应用场景中,首先对当前所采集的声音片段进行语音活动检测,获得其声音片段中关于语言的端点值,其具体也就是语言活动的一个结束标识,由于声音本身是一种波,具有一定能量,包括了频率和振幅的特征,因此在检测过程中可将声音片段分成多个数据帧,然后判断其中的数据帧中是否有能量骤然下降的情况,或者频率、振幅等突然发生了改变等等来判断声音片段中的语音活动是否存在了停止现象,也就声音片段中的语音活动是否结束,从而获得第一值,这里的第一值即端点值或声音片段的语言结束标识,例如其可以是0或者1来表示,如果声音片段中的语音活动存在停止现象,则其第一值可以为0,如果不存在则第一值为可以1,也可以是存在为1,不存在为0。这里还可以采用其他常用的方法进行判断声音片段中的语音活动是否停止,这里不做限定。S12,通过深度学习对当前声音片段与下一条声音片段进行语义相关检测获取第二值。深度学习能够通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,虽然对于人类语言而言,一般计算机只能将其转换成机器语言,只能做最简单的处理,然而采用深度学习可以对人类语言进行进一步的学习了解,进行释义解析,从而得到其大概的语义意思,并进行深度的完善,虽然计算机本身不具有理解功能,但还是并不妨碍计算机根据相关的语义进行扩展而进行处理与执行。因此通过深度学习的方法对当前声音片段中的语音进行释义以获得其大概的语义,随后对下一条声音片段中的语音进行释义以获得其大概的语义,随后判断当前声音片段中的语音与下一条声音片段中的语音是否存在语义上的关联,及语义是否相关,语句是否连贯或者通顺,如当前声音片段的语音的语义可能是我需要,下一条声音片段中的语义是音量加大,因此其符合人类说话的习惯,通过深度学习可以认为其两个片段是具有一定相关性的,其相关性决定了第二值,相关性越强,则第二值越大,例如其相关性可以为0%至100%,第二值所对应的取值可以为0至1,如上述两个片段的第二值例如可以为0.5,如当前声音片段的语音的语义可能是跳舞,下一条声音片段中的语义是开灯,这两个具有不同的释义,且其不符合人类说话的连贯性,且比较难认为两个片段是相关联,所以认为其两个片段是无相关性或弱相关性的,或者在另一场景中,如当前声音片段的语音的语义可能是跳舞,下一条声音片段中并没有语言,只有部分环境噪音,因此可以认为两个片段是无相关性,其第二值例如可以为0。这里也可以对当前声音片段中语言的末端字词和下一条声音片段的开端字词进行释义、拼写的解析对两个声音片段的相关性进行完善,从而提高相关性判断的准确率。同时,还可以进行增加通过语调等其他语言特征等来对相关性进行判断,或者作为机器人或者其他计算机智能设备,如家用机器人,可以进一步针对当前用户的语言习惯进行多次学习,了解用户的语言特点,并根据其语言特性对相关性、预设阈值、预设权重等进行修改,以提高判断的准确性。S13,对所述第一值与所述第二值进行加权计算以获取第三值。上述已经获得第一值与第二值,为了达到更好的准确性,需要对第一值与第二值进行加权计算来获得第三值作为两个片段的总相关性。本文档来自技高网...

【技术保护点】
1.一种收音结束的判断方法,其特征在于,所述方法包括:/n对当前声音片段进行语音活动检测获取第一值;/n通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值;/n对所述第一值与所述第二值进行加权计算以获取第三值;/n将所述第三值与预设阈值进行比较;/n根据所述比较的结果确定所述当前声音片段是否收音结束。/n

【技术特征摘要】
1.一种收音结束的判断方法,其特征在于,所述方法包括:
对当前声音片段进行语音活动检测获取第一值;
通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值;
对所述第一值与所述第二值进行加权计算以获取第三值;
将所述第三值与预设阈值进行比较;
根据所述比较的结果确定所述当前声音片段是否收音结束。


2.根据权利要求1所述的判断方法,其特征在于,所述通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值包括:
对所述当前声音片段与所述下一条声音片段进行学习性解析其语义之间的相关性以获得所述当前声音片段与所述下一条声音片段的第二值。


3.根据权利要求1所述的判断方法,其特征在于,所述对所述第一值与所述第二值进行加权计算以获取第三值包括:
给所述第一值赋予第一预设权重获得第一权重值;
给所述第二值赋予第二预设权重获得第二权重值;
对所述第一权重值与所述第二权重值进行计算获取所述第三值。


4.根据权利要求1所述的判断方法,其特征在于,所述对当前声音片段进行语音活动检测获取第一值包括:
将所述当前声音片段分成多个数据帧,对所述多个数据帧进行处理获取到所述当前声音片段的第一值。


5.根据权利要求1所述的判断方法,其特征在于,所述第一值为所述声音片段的语言结束标识,所述第一值用于标识所述声音片段的语音活动是否存在停止现象。

【专利技术属性】
技术研发人员:熊友军李浩明夏严辉李利阳温品秀
申请(专利权)人:深圳市优必选科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1