一种语音识别方法及装置制造方法及图纸

技术编号：13595784 阅读：52 留言：0更新日期：2016-08-26 12:55

本发明专利技术实施例提供一种语音识别方法及装置，通过接收终端发送的语音信息，获取所述语音信息的声学特征信息；将所述声学特征信息依次输入声学模型和语言模型，获取所述声学模型和所述语音模型对所述语音信息进行识别得到的初始文本信息；根据预存的用户信息，对所述初始文本信息进行修正处理，生成最终文本信息。采用本发明专利技术实施例技术方案，针对已经识别得到的初始文本信息进行修正处理，以对所述初始文本信息中的错误进行修正，将修正后生成的最终文本信息发送至所述终端，使终端能给根据更为准确的最终文本信息，向用户提供更为精准的服务。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及语音信息处理
，尤其涉及一种语音识别方法及装置。
技术介绍
语音识别技术是让机器通过识别和理解过程将语音信号转换为相应的命令或文本的技术。目前，语音识别技术广泛应用于语音操控、语音翻译等语音交互产品。目前，多种终端具备语音输入功能，各种安装在终端上的应用软件均需要基于语音识别结果执行相应的操作，从而生成用户所需要的信息，呈现给用户。当终端的语音识别较佳，能够准确地识别用户输入的语音信息，才能够保证提供给用户的服务更加准确。例如，终端中包含地图应用软件，用户可以通过该地图应用软件获取自当前位置至期望地点之间的路线；例如，当用户想去“北京xx饭店”，终端接收到用户输入的语音信息，即对用户输入的语音信息进行识别，得到“北京xx饭店”的文本信息，地图应用软件在地图上对“北京xx饭店”的文本信息进行搜索，并根据用户当前的位置，规划用户当前的位置至“北京xx饭店”的路线；但是当北京包含至少两个饭店名称，发音均为“xx饭店”对应的拼音时，那么地图应用软件将会呈现多个文本信息的识别结果，或者，地图应用软件将默认呈现距离用户当前位置最近的“xx饭店”，此...

【技术保护点】
一种语音识别方法，其特征在于，包括：接收终端发送的语音数据包；其中，所述语音数据包中包含语音信息；获取所述语音信息的声学特征信息；其中，所述声学特征信息为表征所述语音信息的声音特性的信息；将所述声学特征信息依次输入预设的声学模型和语言模型，获取对所述语音信息进行识别得到的初始文本信息；根据预存的用户信息，对所述初始文本信息进行修正处理，生成最终文本信息；将所述最终文本信息发送至所述终端。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：接收终端发送的语音数据包；其中，所述语音数据包中包含语音信息；获取所述语音信息的声学特征信息；其中，所述声学特征信息为表征所述语音信息的声音特性的信息；将所述声学特征信息依次输入预设的声学模型和语言模型，获取对所述语音信息进行识别得到的初始文本信息；根据预存的用户信息，对所述初始文本信息进行修正处理，生成最终文本信息；将所述最终文本信息发送至所述终端。2.根据权利要求1所述的方法，其特征在于，所述语音数据包中还包含终端标识；所述预存的用户信息的获取方法，包括：从用户信息集合中查找所述终端的标识对应的用户信息；其中，所述用户信息包括历史时间点用户的位置，所述用户的年龄，或者所述用户的性别；所述用户信息集合包含终端的标识及用户信息的对应关系。3.根据权利要求2所述的方法，其特征在于，将所述声学特征信息依次输入预设的声学模型和语言模型，获取对所述语音信息进行识别得到的初始文本信息，具体包括：将所述声学特征信息输入预设的声学模型，获取所述声学模型输出的发音模板标识；将所述发音模板标识输入所述语言模型，获取所述语言模型输出的初始文本信息。4.根据权利要求2或3所述的方法，其特征在于，根据预存的用户信息，对所述初始文本信息进行修正处理，生成最终文本信息，具体包括：对所述初始文本信息进行划分，获取每一个分词；针对所述分词中的位置分词，将所述从所述用户信息中查找与所述当前时间点匹配的历史时间点，并获取查找到的历史时间点所述用户的位置，若所述获取的用户的位置与所述位置分词全部或者部分匹配不成功，且所述位置分词的发音与所述获取的用户的位置发音相似度达到预设阈值，则用所述获取的用户的位置替换
\t所述位置分词；针对所述分词中的特殊分词，根据所述用户信息中包含的用户年龄或者用户性别，对所述特殊分词进行修正处理；其中，所述特殊分词为存在同音不同义的分词。5.根据权利要求4所述的方法，其特征在于，根据预存的用户信息，对所述初始文本信息进行修正处理，生成最终文本信息，还包括：当本地不包含所述终端的标识对应的用户信息时，根据所述声学特征信息，确定提供所述语音信息的用户的年龄和性别；根据确定的提供所述语音信息的用户的年龄和性别，对所述初始文本信息进行修正处理，生成最终文本信息。6.根据权利要求5所述的方法，其特征在于，生成最终文本信息之后，所述方法还包括：对确定的用户的年龄和性别，以及最终文本信息进行分析，并根据分析结果，生成用户信息；建立所述终端的标识，及生成的用户信息之间的对应关系，将所述对应关...

【专利技术属性】
技术研发人员：田伟森，赵恒艺，
申请(专利权)人：乐视致新电子科技天津有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人