收音结束的判断方法、装置以及储存装置制造方法及图纸

技术编号：23485627 阅读：19 留言：0更新日期：2020-03-10 12:53

本申请公开了一种收音结束的判断方法、装置以及存储装置，其中方法包括：对当前声音片段进行语音活动检测获取第一值；通过深度学习对当前声音片段与下一条声音片段进行语义相关检测获取第二值；对第一值与所第二值进行加权计算以获取第三值；将第三值与预设阈值进行比较；根据所述比较的结果确定所述当前声音片段是否收音结束。通过上述方式，本申请提供的一种收音结束的判断方法、装置以及存储装置中，采用多检测方式获得第一值、第二值，并进一步采用权重算法获得第三值，最后进行比较判断是否收音结束，大大提升了准确率。

Judgment method, device and storage device of end of radio

全部详细技术资料下载

【技术实现步骤摘要】
收音结束的判断方法、装置以及储存装置
本申请涉及收音结束判断领域，特别是涉及一种收音结束的判断方法、装置以及存储装置。
技术介绍
目前，智能设备与人之间的语言交互越来越频繁，如对话机器人，现有的对话机器人中，由于无法直接了解到对人类一段语言的语义，所以需要将采集到声音分成多个独立的语句，并分别对每个语句进行处理以执行相应的命令，因此如何将采集的声音进行识别并准确分成多个独立的语句显得较为重要，但是现有对话机器人仅仅通过人类说话中是否进行停顿来判断其说话是否结束，然后才执行或处理其结束的语言，这样可能会漏掉其后续的一些信息，导致执行上的失败与错误，准确率较差，且用户体验感不佳。且这样对于多人声(如人声，或电视人声等)的场景而言，由于是连续的，无法判断下指令的人类的语音是否结束，从而无法正确的识别出人类的指令信息。
技术实现思路
本申请提供一种收音结束的判断方法、装置以及存储装置，能够解决现有含有人声的声音片段中对于语言收音结束判断准确率不高的问题。本申请采用的一个技术方案是：提供一种收音结束的判断方法，其方法包括：对当前声音片段进行语音活动检测获取第一值；通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值；对所述第一值与所述第二值进行加权计算以获取第三值；将所述第三值与预设阈值进行比较；根据所述比较的结果确定所述当前声音片段是否收音结束。为解决上述技术问题，本申请采用的另一个技术方案是：提供一种收音结束的判断装置，所述装置包括存储器及连接所述存储器的处理器；其中...

【技术保护点】
1.一种收音结束的判断方法，其特征在于，所述方法包括：/n对当前声音片段进行语音活动检测获取第一值；/n通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值；/n对所述第一值与所述第二值进行加权计算以获取第三值；/n将所述第三值与预设阈值进行比较；/n根据所述比较的结果确定所述当前声音片段是否收音结束。/n

【技术特征摘要】
1.一种收音结束的判断方法，其特征在于，所述方法包括：
对当前声音片段进行语音活动检测获取第一值；
通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值；
对所述第一值与所述第二值进行加权计算以获取第三值；
将所述第三值与预设阈值进行比较；
根据所述比较的结果确定所述当前声音片段是否收音结束。

2.根据权利要求1所述的判断方法，其特征在于，所述通过深度学习对所述当前声音片段与下一条声音片段进行语义相关检测获取第二值包括：
对所述当前声音片段与所述下一条声音片段进行学习性解析其语义之间的相关性以获得所述当前声音片段与所述下一条声音片段的第二值。

3.根据权利要求1所述的判断方法，其特征在于，所述对所述第一值与所述第二值进行加权计算以获取第三值包括：
给所述第一值赋予第一预设权重获得第一权重值；
给所述第二值赋予第二预设权重获得第二权重值；
对所述第一权重值与所述第二权重值进行计算获取所述第三值。

4.根据权利要求1所述的判断方法，其特征在于，所述对当前声音片段进行语音活动检测获取第一值包括：
将所述当前声音片段分成多个数据帧，对所述多个数据帧进行处理获取到所述当前声音片段的第一值。

5.根据权利要求1所述的判断方法，其特征在于，所述第一值为所述声音片段的语言结束标识，所述第一值用于标识所述声音片段的语音活动是否存在停止现象。

【专利技术属性】
技术研发人员：熊友军，李浩明，夏严辉，李利阳，温品秀，
申请(专利权)人：深圳市优必选科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人