一种语音结束端点检测方法及装置制造方法及图纸

技术编号:23100701 阅读:63 留言:0更新日期:2020-01-14 20:54
本申请实施例提供一种语音结束端点检测方法及装置,其中方法包括:获取用户输入的语音信号,并将所述语音信号转换为文本信息;确定所述文本信息对应的语境类型,和/或所述语音信号中的非语言特征信息;根据所述语境类型和/或所述非语言特征信息确定检测时长;识别所述文本信息中的每个字在所述语音信号中对应的发音区间,当确定所述文本信息中的第一字的发音区间之后的所述检测时长内,不包括第二字的发音区间,则将所述第一字在所述语音信号中对应的发音区间的结束时间点作为第一端点;当确定所述第一字所处的句子的语义结构完整时,将第一端点作为所述第一字所处的句子在所述语音信号中的语音结束端点。

A voice end point detection method and device

【技术实现步骤摘要】
一种语音结束端点检测方法及装置
本申请涉及语音检测
,尤其涉及一种语音结束端点检测方法及装置。
技术介绍
随着科技的进步,人们的工作、生活几乎每天都应用到计算机以及网络,为了更便捷、高效的为工作、生活服务,语音识别在各个领域里的应用日益广泛,比如,人机交互式的语音识别,人与人之间沟通交流时以语音识别的方式记录两者的对话内容,亦或是随时随地的以语音的方式记录自己的所思所想等等,这一识别方式已逐渐成为语音应用发展的趋势。语音识别的过程主要包括4个步骤,分别是:语音信号采集、语音信号的特征参数提取、声学模型与模式匹配、语言模型与语言处理。其中,在第一步骤中的语音信号采集时,首先要对用户输入的语音信号进行判断,准确找出语音信号的起始点和终止点,从而知晓用户的这句话是否已说完,这就应用到端点检测技术(voiceactivitydetection,VAD),VAD技术作为语音识别系统与处理阶段遇到的第一个关键技术,其准确性在某种程度上直接决定了语音识别系统的成败。现有技术中的VAD技术主要是获取用户的语音信号,根据过零率和声音量级等指本文档来自技高网...

【技术保护点】
1.一种语音结束端点检测方法,其特征在于,包括:/n获取用户输入的语音信号,并将所述语音信号转换为文本信息;/n确定所述文本信息对应的语境类型,和/或所述语音信号中的非语言特征信息;/n根据所述语境类型和/或所述非语言特征信息确定检测时长;/n识别所述文本信息中的每个字在所述语音信号中对应的发音区间,当确定所述文本信息中的第一字的发音区间之后的所述检测时长内,不包括第二字的发音区间,则将所述第一字在所述语音信号中对应的发音区间的结束时间点作为第一端点;所述第一字为所述文本信息中的任一字,所述第二字位于所述第一字之后且与所述第一字相邻;/n当确定所述第一字所处的句子的语义结构完整时,将所述第一端...

【技术特征摘要】
1.一种语音结束端点检测方法,其特征在于,包括:
获取用户输入的语音信号,并将所述语音信号转换为文本信息;
确定所述文本信息对应的语境类型,和/或所述语音信号中的非语言特征信息;
根据所述语境类型和/或所述非语言特征信息确定检测时长;
识别所述文本信息中的每个字在所述语音信号中对应的发音区间,当确定所述文本信息中的第一字的发音区间之后的所述检测时长内,不包括第二字的发音区间,则将所述第一字在所述语音信号中对应的发音区间的结束时间点作为第一端点;所述第一字为所述文本信息中的任一字,所述第二字位于所述第一字之后且与所述第一字相邻;
当确定所述第一字所处的句子的语义结构完整时,将所述第一端点作为所述第一字所处的句子在所述语音信号中的语音结束端点。


2.如权利要求1所述的方法,其特征在于,所述方法还包括:
当确定所述第一字所处的句子的语义结构不完整时,采用自然语言理解NLU技术确定所述句子是否结束;
若确定所述句子结束,则将所述第一端点作为所述句子在所述语音信号中的语音结束端点;否则,请求所述用户重新输入所述语音信号或者向所述用户发送指示信息,所述指示信息用于提示所述用户确认所述句子是否结束。


3.如权利要求1或2所述的方法,其特征在于,所述根据所述语境类型和/或当所述非语言特征信息确定检测时长,包括:
当所述语境类型为疑问语境时,和/或当所述非语言特征信息包括拖音信息、犹豫信息以及延迟信息中的至少一种时,将第一时长作为所述检测时长;
当所述语境类型不为所述疑问语境时,且所述非语言特征信息不包括拖音信息、犹豫信息以及延迟信息时,将第二时长作为所述检测时长,所述第一时长大于所述第二时长。


4.如权利要求3所述的方法,其特征在于,所述第一时长大于200毫秒且小于2秒;
所述第二时长小于或等于200毫秒。


5.如权利要求1所述的方法,其特征在于,所述确定所述文本信息对应的语境类型,包括:
预先收集不同的疑问句;分析所述疑问句的语言成分构成,提取出具有疑问特征的词组,存储为词组集;当获取所述文本...

【专利技术属性】
技术研发人员:龙嘉裕
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1