一种语音识别方法、装置及终端设备制造方法及图纸

技术编号:18303052 阅读:23 留言:0更新日期:2018-06-28 12:35
本发明专利技术实施例公开了一种语音识别方法、装置及终端设备,该方法包括:接收用户输入的语音信息,确定和所述语音信息对应的主题词以及主题词向量;通过神经网络模型对所述语音信息进行识别以确定识别结果;对所述识别结果进行向量化处理得到识别结果向量;计算所述识别结果向量和所述主题词向量的距离值,对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值,依据所述距离权重值确定所述语音信息最终对应的识别内容。本方案使得语音识别内容和用户的需求匹配度显著提高,识别效率显著增强。

A speech recognition method, device and terminal equipment

An embodiment of the invention discloses a speech recognition method, device and terminal device. The method includes receiving the speech information input by the user, determining the subject word and the subject word vector corresponding to the speech information, identifying the speech information by the neural network model to determine the recognition results; and the recognition of the recognition results. The results are vectored to get the recognition result vector; calculate the distance value of the recognition result vector and the subject word vector, and normalize the distance value to get the distance weight value of the recognition result and the subject word, and determine the final corresponding recognition of the speech information according to the distance weight value. Content. This scheme greatly improves the matching degree of speech recognition content and user needs, and significantly improves the recognition efficiency.

【技术实现步骤摘要】
一种语音识别方法、装置及终端设备
本专利技术实施例涉及语音识别技术,尤其涉及一种语音识别方法、装置及终端设备。
技术介绍
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比做“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的智能技术。现有技术中,在对用户语音进行识别时通常采用云服务语音识别的方式,即用户通过终端设备上传语音信息,语音识别云服务器接收到包含语音信息的文件后对其进行识别以返回相应的文本信息至终端设备。上述方案中,语音识别服务器通过用户上传的语音信息的声音维度进行识别,使得对于同音或近音的语音信息识别效果很差,如用户语音表意为“他有哪些诗”,而最终的识别内容可能是“他有哪些事”。
技术实现思路
本专利技术提供了一种语音识别方法、装置及终端设备,使得语音识别内容和用户的需求匹配度显著提高,识别效率显著增强。第一方面,本专利技术实施例提供了一种语音识别方法,包括:接收用户输入的语音信息,确定和所述语音信息对应的主题词以及主题词向量;通过神经网络模型对所述语音信息进行识别以确定识别结果;对所述识别结果进行向量化处理得到识别结果向量;计算所述识别结果向量和所述主题词向量的距离值,对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值,依据所述距离权重值确定所述语音信息最终对应的识别内容。第二方面,本专利技术实施例还提供了一种语音识别装置,包括:主题确定模块,用于接收用户输入的语音信息,确定和所述语音信息对应的主题词以及主题词向量;识别结果确定模块,用于通过神经网络模型对所述语音信息进行识别以确定识别结果;识别结果向量确定模块,用于对所述识别结果进行向量化处理得到识别结果向量;识别内容确定模块,用于计算所述识别结果向量和所述主题词向量的距离值,对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值,依据所述距离权重值确定所述语音信息最终对应的识别内容。第三方面,本专利技术实施例还提供了一种终端设备,所述终端设备集成了上述描述的装置。本专利技术实施例提供的技术方案,通过将用户输入的语音信息和该语音信息对应的主题词进行关联,依据语音信息和对应的主题词确定最终的语音识别内容,解决了仅通过用户上传的语音信息的声音维度进行识别,带来的对于同音或近音的语音信息识别效果很差问题,使得语音识别内容和用户的需求匹配度显著提高,识别效率显著增强。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术实施例一提供的语音识别方法的流程图;图2是本专利技术实施例二提供的语音识别方法的流程图;图3是本专利技术实施例三提供的语音识别方法的流程图;图4是本专利技术实施例四提供的语音识别方法的流程图;图5是本专利技术实施例五提供的语音识别方法的流程图;图6是本专利技术实施例六提供的语音识别装置的结构框图;图7是本专利技术实施例七提供的终端设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1是本专利技术实施例一提供的语音识别方法的流程图,本实施例可适用于对用户输入的语音信息进行识别的情况,该方法可以由云服务器来执行,如图1所示,本实施例提供的具体方案如下:S101、接收用户输入的语音信息,确定和所述语音信息对应的主题词以及主题词向量。本实施例中,用户可通过终端设备如智能手机、平板电脑、笔记本电脑等进行语音信息的录入,终端设备可通过麦克风采集用户录入的语音信息并上传至云服务器中。其中,云服务器可为其它供应商单独提供语音识别服务,如用户通过携程网的语音识别功能录入语音,携程网服务器将获取到的用户语音信息发送至该云服务器以进行语音识别。本实施例中,当接收到用户输入的语音信息后,进行语音信息主题词的确定,其中主题词表征了该语音信息的应用场景、范围、领域等。示例性的,在语音信息“手掌腰腿区反应什么”中,其主题词可以是“医疗”;在语音信息“李白的诗有哪些”中,对应的主体词可以是“诗人”、“古诗”。本实施例中,主题词向量为表征该主题词的参量,可以是多维数组,即由不同的多维数组来唯一确定对应的主题词。S102、通过神经网络模型对所述语音信息进行识别以确定识别结果。本实施例中,神经网络模型可通过大量样本进行神经网络训练后得到,可以由输入音频样本文件以及对应标注的正确识别内容在结合声学特征、语言特征确定。本实施例中,通过预先训练好的神经网络模型对语音信息进行识别来得到识别结果,其中,该识别结果包括一个或多个。示例性的,用户输入的语音信息为“李白有哪些诗”,通过神经网络模型对该语音进行识别,识别结果可以是“李白有哪些事”和“李白有哪些诗”两个识别结果。S103、对所述识别结果进行向量化处理得到识别结果向量。本实施例中,识别结果向量可以是多维数组,数组维度和主题词向量纬度相同,使得识别结果向量和主题词向量可以进行对应比对。需要说明的是,该识别结果向量用于唯一表征识别结果,还可以是采用多位二进制数据编码的方式来表征该识别结果,本实施例并不限定具体的表征方式。S104、计算所述识别结果向量和所述主题词向量的距离值,对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值,依据所述距离权重值确定所述语音信息最终对应的识别内容。本实施例中,识别结果和主题词的距离权重值表征了识别结果和主题词的接近程度,可以是,权重值越高接近程度越大。距离权重值的计算采取了计算识别结果向量和主题词向量的距离值,对距离值进行归一化处理的方式。即将识别结果分别和主题词的关联程度进行计算,将关联程度最强的识别结果作为最终的识别内容反馈给用户。示例性的,主题词为“诗人”,语音信息的识别结果为“李白有哪些诗”和“李白有哪些事”,通过S104的计算确定出“李白有哪些诗”和主题词“诗人”的距离权重值高于“李白有哪些事”和主题词“诗人”的距离权重值,则将“李白有哪些诗”这一识别结果作为最终和语音信息对应的识别内容反馈给用户。由于在语音识别过程中引入了主题词这一识别纬度,使得语音识别准确率大幅提高,也更加符合用户的真正需求,可一次性得到正确的识别内容避免二次检索带来的效率低下的问题。本实施例提供了一种语音识别方法,通过将用户输入的语音信息和该语音信息对应的主题词进行关联,依据语音信息和对应的主题词确定最终的语音识别内容,解决了仅通过用户上传的语音信息的声音维度进行识别,带来的对于同音或近音的语音信息识别效果很差问题,使得语音识别内容和用户的需求匹配度显著提高,识别效率显著增强。实施例二图2是本专利技术实施例二提供的语音识别方法的流程图,在上述实施例一的基础上,可选的,所述对所述识别结果进行向量化处理得到识别结果向量包括:依据所述识别结果中的识别词向量以及所述识别词向量对应的识别词权重值确定所述识别结果向量。由此,可对语句类型的识别结果确定出识别结果向量,使得由识别结果向量和主题词向量计算得到的距离权重值更加准确,语音识别准确率、效率进一步提高。基于上述优化,如图本文档来自技高网...
一种语音识别方法、装置及终端设备

【技术保护点】
1.一种语音识别方法,其特征在于,包括:接收用户输入的语音信息,确定和所述语音信息对应的主题词以及主题词向量;通过神经网络模型对所述语音信息进行识别以确定识别结果;对所述识别结果进行向量化处理得到识别结果向量;计算所述识别结果向量和所述主题词向量的距离值,对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值,依据所述距离权重值确定所述语音信息最终对应的识别内容。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:接收用户输入的语音信息,确定和所述语音信息对应的主题词以及主题词向量;通过神经网络模型对所述语音信息进行识别以确定识别结果;对所述识别结果进行向量化处理得到识别结果向量;计算所述识别结果向量和所述主题词向量的距离值,对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值,依据所述距离权重值确定所述语音信息最终对应的识别内容。2.根据权利要求1所述的方法,其特征在于,所述对所述识别结果进行向量化处理得到识别结果向量包括:依据所述识别结果中的识别词向量以及所述识别词向量对应的识别词权重值确定所述识别结果向量;或根据所述识别结果构建语法树,依据所述语法树中的结点以及所述结点对应的结点权重值确定所述识别结果向量。3.根据权利要求1或2所述的方法,其特征在于,所述计算所述识别结果向量和所述主题词向量的距离值,对所述距离值进行归一化处理得到所述识别结果和所述主题词的距离权重值包括:计算所述识别结果向量和所述主题词向量的余弦距离值,依据所述余弦距离值确定所述识别结果和所述主题词的距离权重值。4.根据权利要求3所述的方法,其特征在于,所述通过神经网络模型对所述语音信息进行识别以确定识别结果包括:通过神经网络模型对所述语音信息进行识别以确定识别结果和所述识别结果对应的识别结果权重值;相应的,所述依据所述距离权重值确定所述语音信息最终对应的识别内容包括:依据所述距离权重值和所述识别结果权重值确定所述语音信息最终对应的识别内容。5.根据权利要求4所述的方法,其特征在于,所述确定和所述语音信息对应的主题词以及主题词向量包括:将预存的主题词以及主题词向量作为所述语音信息的主题词以及主题词向量;或接收用户输入的或供应商发送的主题词,根据所述主题词确定主题词向量,将接收到的所述主题词以及确定出的所述主题词向量作为...

【专利技术属性】
技术研发人员:李黄海
申请(专利权)人:北京智能管家科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1