问句识别方法及装置制造方法及图纸

技术编号:26531029 阅读:21 留言:0更新日期:2020-12-01 14:11
本申请实施例提供一种问句识别方法及装置,该方法包括:对输入语音内容进行语音识别处理,得到输入语音内容对应的输入文本内容。对输入文本内容进行特征提取处理,得到输入文本特征向量,以及对输入语音内容进行特征提取处理,得到输入音频特征向量,其中,输入文本特征向量包括至少一个文本特征,输入音频特征向量包括至少一个音频特征。根据分类器模型对输入文本特征向量和输入音频特征向量进行识别处理,得到输入语音内容是否为问句的识别结果,其中,分类器模型用于识别输入语音内容是否为问句。本实施例通过分类器根据各特征向量进行处理,以得到最终的问句识别结果,能提升问句识别的准确率。

【技术实现步骤摘要】
问句识别方法及装置
本申请实施例涉及计算机技术,尤其涉及一种问句识别方法及装置。
技术介绍
在实现人机对话的过程中,智能设备通常是根据用户输入的语音内容或者文本内容在预设的知识库中进行查找,从而获取到与用户输入内容相匹配的回答信息,通过将预设的知识库划分为问句知识库与非问句知识库能够有效提升匹配效率,因此需要预先识别用户输入的语音内容或者文本内容是否为问句。目前,现有技术在进行识别的过程中,通常是将用户输入的语音内容转化为文本,或者直接对用户输入的文本进行从句切分得到多个从句内容,其次基于规则库对每个从句内容进行问句检测,如检测从句中是否包含疑问词等,若有一个从句内容为问句,则确定用户输入的语音内容或者文本内容为问句。然而,规则库的定义复杂度较高,若是规则库定义的内容不全面,则会导致问句识别的准确率降低。
技术实现思路
本申请实施例提供一种问句识别方法及装置,以克服问句识别的准确率较低的问题。第一方面,本申请实施例提供一种问句识别方法,包括:首先对输入语音内容进行语音识别处理,得到所述输入语音本文档来自技高网...

【技术保护点】
1.一种问句识别方法,其特征在于,包括:/n对输入语音内容进行语音识别处理,得到所述输入语音内容对应的输入文本内容;/n对所述输入文本内容进行特征提取处理,得到输入文本特征向量,以及对所述输入语音内容进行特征提取处理,得到输入音频特征向量,其中,所述输入文本特征向量包括至少一个文本特征,所述输入音频特征向量包括至少一个音频特征;/n根据分类器模型对所述输入文本特征向量和输入音频特征向量进行识别处理,得到所述输入语音内容是否为问句的识别结果,其中,所述分类器模型用于识别所述输入语音内容是否为问句。/n

【技术特征摘要】
1.一种问句识别方法,其特征在于,包括:
对输入语音内容进行语音识别处理,得到所述输入语音内容对应的输入文本内容;
对所述输入文本内容进行特征提取处理,得到输入文本特征向量,以及对所述输入语音内容进行特征提取处理,得到输入音频特征向量,其中,所述输入文本特征向量包括至少一个文本特征,所述输入音频特征向量包括至少一个音频特征;
根据分类器模型对所述输入文本特征向量和输入音频特征向量进行识别处理,得到所述输入语音内容是否为问句的识别结果,其中,所述分类器模型用于识别所述输入语音内容是否为问句。


2.根据权利要求1所述的方法,其特征在于,所述根据分类器模型对所述输入文本特征向量和输入音频特征向量进行处理,得到所述输入语音内容是否为问句的识别结果,包括:
对所述输入文本特征向量和输入音频特征向量进行向量拼接处理,得到包括各文本特征和各音频特征的融合向量;
获取各所述文本特征以及各所述音频特征的权重信息,其中,所述权重信息用于指示各所述文本特征和各所述音频特征的权重;
根据所述融合向量和各所述权重信息,得到所述输入语音内容是否为问句的识别结果。


3.根据权利要求2所述的方法,其特征在于,所述根据所述融合向量和各所述权重信息,得到所述语音内容的识别结果,包括;
对所述融合向量进行归一化处理,得到归一化处理后的各所述文本特征和各所述音频特征;
根据归一化处理后的各所述文本特征和各所述音频特征,得到各所述文本特征和各所述音频特征对应的指标信息,其中,所述指标信息用于指示所述输入语音内容是否为问句;
根据各所述指标信息和各所述指标信息对应的权重信息,确定所述输入语音内容是否为问句的识别结果。


4.根据权利要求1所述的方法,其特征在于,所述对所述输入文本内容和所述输入语音内容分别进行特征提取处理,分别得到输入文本特征向量和输入音频特征向量之前,还包括:
对所述输入文本内容进行文本预处理,其中,所述文本预处理包括如下中的至少一种:分词处理、去停用词处理、同义词替换处理;
对所述输入语音内容进行音频预处理,其中,所述音频预处理包括如下中的至少一种:预加重处理、分帧处理、加窗处理。


5.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述输入文本内容进行特征提取处理,得到输入文本特征向量,以及对所述输入语音内容进行特征提取处理,得到输入音频特征向量之后,还包括:
获取输入语音内容的时间帧信息,其中,所述时间帧信息用于指示所述输入语音内容的时间序列;
根据所述时间帧信息,将所述输入文本特征向量和所述音频特征向量进行帧对齐处理。


6.根据权利要求1所述的方法,其特征在于,所述对输入语音内容进行语音识别处理,得到所述语音内容对应的文本内容之前,还包括:
对训练语音内容进行语音识别处理,得到所述训练语音内容对应的训练文本内容;
对所述训练文本内容进行特征提取处理,得到训练文本特征向量,以及对所述训练语音内容进行特征提取处理,得到训练音频特征向量;
根据所述训练语音内容以及训练语音内容的问句标签,对所述分类器模型进行模型训练处理,得到训练后的分类器模型,其中,所述问句标签用于指示所述训练语音内容是否为问句。


7.根据权利要求1所述的方法,其特征在于,所述音频特征包括如下中的至少一种:发音速率、短时能量、短时过零率、基频范围、基频变化特征、基频均值特征。


8.根据权利要求1所述的方法,其特征在于,所述文本特征包括如下中的至少一种:词袋特征、语气词特征、语气词位置特征、问句指示词特征。


9.根据权利要求1所述的方法,其特征在于,所述分类器模型可以为如下中的至少一种:支持向量机模型、随机森林模型、神经网络模型。


10.一种问句识别装置,其特征在于,包括:
识别模块,用于对输入语音内容进行语音识别处理,得到所述输入语音内容对应的输入文本内容;
处理模块,用于对所述输...

【专利技术属性】
技术研发人员:李明磊怀宝兴
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1