语言模型语音端点确定制造技术

技术编号:17490914 阅读:50 留言:0更新日期:2018-03-17 13:51
一种自动语音辨识(ASR)系统使用在解码器考虑中的活动假设来检测话语的端点。所述ASR系统计算由多个假设检测到的非语音的量,并通过每个假设的概率对非语音持续时间进行加权。当聚合加权非语音超过阈值时,可以声明端点。

Speech endpoint determination of language model

An automatic speech recognition (ASR) system uses the activity hypothesis in the decoder to detect the endpoint of the speech. The ASR system calculates the amount of non speech detected by multiple hypotheses and weighs the non speech duration by each hypothesis. When the aggregated weighted non speech exceeds the threshold, the endpoint can be declared.

【技术实现步骤摘要】
【国外来华专利技术】语言模型语音端点确定
技术介绍
语音辨识系统已经发展到人类可以完全依靠语音与计算设备交互的程度。这样的系统基于接收到的音频输入的各种质量,使用多种技术来识别由人类用户说出的词语。语音辨识结合自然语言理解处理技术,实现对计算设备的基于语音的用户控制,以基于用户的口头命令来执行任务。语音辨识和自然语言理解处理技术的组合通常被称为语音处理。语音处理还可以将用户的语音转换成文本数据,然后,可以将文本数据提供给各种基于文本的软件应用程序。语音处理可由计算机、手持设备、电话计算机系统、公共电话亭和多种其他设备用来改进人机交互。附图说明为了更全面地理解本公开,现在结合附图参考以下描述。图1示出了根据本公开的实施方案的用于自动语音辨识(ASR)的系统。图2是根据本公开的实施方案的可如何处理口头话语的概念图。图3示出了根据本公开的一个方面的音素处理和文字处理。图4示出了根据本公开的一个方面的语音辨识网格。图5示出了根据本公开的一个方面的语音辨识网格。图6示出了与图4的网格相关联的多个假设。图7示出了可由语音辨识系统考虑的多个假设。图8是概念性地示出了根据本公开的实施方案的设备的示例部件的框图。图9是概念性地本文档来自技高网...
语言模型语音端点确定

【技术保护点】
一种计算机实现的方法,其包括:对音频数据执行语音辨识处理以确定多个假设;确定至少一个假设的暂停,所述至少一个假设包括来自所述多个假设当中的具有最高概率的最高得分假设,其中所述暂停紧接在所述音频数据中的第一点前面;以及确定所述语音的端点出现在所述音频数据中的所述第一点处。

【技术特征摘要】
【国外来华专利技术】2015.06.29 US 14/753,8111.一种计算机实现的方法,其包括:对音频数据执行语音辨识处理以确定多个假设;确定至少一个假设的暂停,所述至少一个假设包括来自所述多个假设当中的具有最高概率的最高得分假设,其中所述暂停紧接在所述音频数据中的第一点前面;以及确定所述语音的端点出现在所述音频数据中的所述第一点处。2.根据权利要求1所述的计算机实现的方法,其还包括:针对所述多个假设中的每一个,确定紧接在所述第一点前面的相应的暂停持续时间;通过对所述多个假设中的每一个的所述暂停持续时间求和来确定对应于所述第一点的所述音频数据的预期暂停持续时间;以及将所述预期暂停持续时间与阈值进行比较。3.根据权利要求2所述的计算机实现的方法,其还包括:针对所述多个假设中的每一个,确定对应于每个相应假设的概率;以及在确定所述预期暂停持续时间之前,将每一暂停持续时间乘以所述对应假设的所述概率。4.根据权利要求3所述的计算机实现的方法,所述一组动作还包括:确定第二多个假设,其中:所述第二多个假设是所述多个假设的子集,以及所述第二多个假设中的每一个均在相应的结束状态下;通过对所述第二多个假设中的每一个的所述暂停持续时间求和来确定第二预期暂停持续时间;以及确定所述第二预期暂停持续时间超过第二阈值。5.根据权利要求1所述的计算机实现的方法,其中确定所述暂停包括确定紧接在所述第一点前面的连续非语音帧的数量。6.根据权利要求5所述的计算机实现的方法,其中确定非语音音频帧的所述数量包括保持紧接在所述第一点之前的连续非语音帧的数量的计数器。7.根据权利要求5所述的计算机实现的方法,其中确定非语音音频帧的所述数量包括确定紧接在所述第一点之前的连续非语音节点的数量。8.一种计算系统,其包括:至少一个处理器;存储器,...

【专利技术属性】
技术研发人员:比约恩·霍夫迈斯特阿利亚·莱斯路刘白杨
申请(专利权)人:亚马逊技术公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1