基于语音交互的语义识别方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:16755554 阅读:43 留言:0更新日期:2017-12-09 02:05
一种基于语音交互的语义识别方法及装置、存储介质、计算机设备,基于语音交互的语义识别方法包括:将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配的表义词;对所述文字文本进行语义理解处理,以得到所述语音数据的语义。通过本发明专利技术技术方案可以提高语音识别的准确性。

Semantic recognition method and device, storage medium, computer equipment based on voice interaction

Based on the semantic interactive voice recognition method and apparatus, storage medium and computer equipment, including semantic recognition method based on speech interaction: the voice data acquisition to convert audio text, including at least one phonetic word of the voice in the text; for word matching using the text in the phonetic sound the word, to get the text, the text includes words matched with the phonetic word table; semantic understanding processing of the text, in order to obtain the semantics of voice data. The accuracy of speech recognition can be improved by the technical scheme of the invention.

【技术实现步骤摘要】
基于语音交互的语义识别方法及装置、存储介质、计算机设备
本专利技术涉及语音识别
,尤其涉及一种基于语音交互的语义识别方法及装置、存储介质、计算机设备。
技术介绍
随着语音识别技术的发展,语音识别在许多领域都得到了应用。通常基于语音交互的语义理解方法和系统是针对输入的语音输出应答,以便用户进行进一步的操作。在现有技术中,语音识别处理过程与语义理解处理过程串行且相互独立。语音识别负责利用语音识别技术将交互语音识别成为文字文本,语义理解负责利用语义理解技术,根据语音识别的文字文本给出语义理解应答。具体地,在语音识别处理过程中,将语音数据识别为单字,以形成文字文本;然后在语义理解过程中,利用分词词典将文字文本进行词语匹配,再进行语义理解。但是,在现有的基于语音交互的语义理解方法和系统对语音数据的输出结果中,仍然存在语义理解偏差的问题。
技术实现思路
本专利技术解决的技术问题是如何提高语音识别的准确性。为解决上述技术问题,本专利技术实施例提供一种基于语音交互的语义识别方法,基于语音交互的语义识别方法包括:将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配的表义词;对所述文字文本进行语义理解处理,以得到所述语音数据的语义。可选的,所述利用所述音学文本中的表音字进行词语匹配包括:利用所述音学文本中的表音字与包括表音字索引的预设词典进行词语匹配。可选的,所述利用所述音学文本中的表音字进行词语匹配包括:将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配,其中,所述预设词典中包括至少一个表音字、多个表义词,以及每个预设表义词与相应表音字的对应关系;将匹配的预设表义词作为与所述音学文本中的表音字匹配的表义词。可选的,所述将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配包括:按照在所述预设词典中出现频率递减的方式选取预设表义词;将选取的预设表义词的表音字与所述音学文本中的表音字进行匹配,直至所述音学文本中的所有表音字匹配完成。可选的,所述将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配包括:将所述音学文本中的表音字或表音字组合与所述预设词典中各个预设表义词的表音字进行匹配,直至所述音学文本中的所有表音字匹配完成。可选的,所述利用所述音学文本进行词语匹配包括:确定所述音学文本中的表音字在预设词典中所属的近音词类,其中,所述预设词典中包括至少一个表音字、多个表义词、每个预设表义词与相应表音字的对应关系以及至少一个近音词类,每一近音词类包括多个近音表音字以及针对每一近音表音字的预设权重;选取所述音学文本中的表音字所属的近音词类中权重值最大的近音表音字,将其与预设词典中的表音字进行匹配;如果匹配结果为一致,则将匹配的表音字对应的表义词作为与所述音学文本中的表音字匹配的表义词。可选的,所述利用所述音学文本进行词语匹配还包括:如果匹配结果为不一致,则按照权重值递减的方式,在所述音学文本中的表音字所属的近音词类中依次选取近音表音字;将选取的近音表音字与预设词典中的表音字进行匹配,直至匹配结果为一致,并将匹配的表音字对应的表义词作为与所述音学文本中的表音字匹配的表义词。可选的,所述近音表音字包括标准表音字以及与所述标准表音字发音相似的相似表音字。可选的,所述预设词典为分词词典,所述分词词典包括针对所有表义词的表音字。可选的,所述表音字为汉字的拼音,所述预设表义词为汉语词语。可选的,所述基于语音交互的语义识别方法还包括:将所述语音数据的语义与知识库中的知识点进行匹配;输出与所述语音数据的语义相匹配的知识点中的答案。本专利技术实施例还公开了一种基于语音交互的语义识别装置,基于语音交互的语义识别装置包括:转换模块,用以将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;匹配模块,用以利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配的表义词;语义理解模块,用以对所述文字文本进行语义理解处理,以得到所述语音数据的语义。可选的,所述匹配模块利用所述音学文本中的表音字与包括表音字索引的预设词典进行词语匹配。可选的,所述匹配模块包括:表音字匹配单元,用以将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配,其中,所述预设词典中包括至少一个表音字、多个表义词,以及每个预设表义词与相应表音字的对应关系;第一表义词确定单元,用以将匹配的预设表义词作为与所述音学文本中的表音字匹配的表义词。可选的,所述表音字匹配单元包括:表义词选取子单元,用以按照在所述预设词典中出现频率递减的方式,依次选取预设表义词;第一表义词匹配子单元,用以将选取的预设表义词的表音字与所述音学文本中的表音字进行匹配,直至所述音学文本中的所有表音字匹配完成。可选的,所述表音字匹配单元包括:第二表义词匹配子单元,用以将所述音学文本中的表音字或表音字组合与所述预设词典中各个预设表义词的表音字进行匹配,直至所述音学文本中的所有表音字匹配完成。可选的,所述匹配模块包括:词类确定单元,用以确定所述音学文本中的表音字在预设词典中所属的近音词类;其中,所述预设词典中包括至少一个表音字、多个表义词、每个预设表义词与相应表音字的对应关系以及至少一个近音词类,每一近音词类包括多个近音表音字以及针对每一近音表音字的预设权重;第一近音表音字选取单元,用以选取所述音学文本中的表音字所属的近音词类中权重值最大的近音表音字,将其与预设词典中的表音字进行匹配;第二表义词确定单元,用以如果匹配结果为一致,则将匹配的表音字对应的表义词作为与所述音学文本中的表音字匹配的表义词。可选的,所述匹配模块还包括:第二近音表音字选取单元,用以如果匹配结果为不一致,则按照权重值递减的方式,在所述音学文本中的表音字所属的近音词类中依次选取近音表音字;第三表义词确定单元,用以将选取的近音表音字与预设词典中的表音字进行匹配,直至匹配结果为一致,并将匹配的表音字对应的表义词作为与所述音学文本中的表音字匹配的表义词。可选的,所述近音表音字包括标准表音字以及与所述标准表音字发音相似的相似表音字。可选的,所述预设词典为分词词典,所述分词词典包括针对所有表义词的表音字。可选的,所述表音字为汉字的拼音,所述预设表义词为汉语词语。可选的,所述基于语音交互的语义识别装置还包括:知识点匹配模块,用以将所述语音数据的语义与知识库中的知识点进行匹配;答案输出模块,用以输出与所述语音数据的语义相匹配的知识点中的答案。本专利技术实施例还公开了一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述基于语音交互的语义识别方法的步骤。本专利技术实施例还公开了一种计算机设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述基于语音交互的语义识别方法的步骤。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术技术方案将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配本文档来自技高网...
基于语音交互的语义识别方法及装置、存储介质、计算机设备

【技术保护点】
一种基于语音交互的语义识别方法,其特征在于,包括:将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配的表义词;对所述文字文本进行语义理解处理,以得到所述语音数据的语义。

【技术特征摘要】
1.一种基于语音交互的语义识别方法,其特征在于,包括:将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配的表义词;对所述文字文本进行语义理解处理,以得到所述语音数据的语义。2.根据权利要求1所述的基于语音交互的语义识别方法,其特征在于,所述利用所述音学文本中的表音字进行词语匹配包括:利用所述音学文本中的表音字与包括表音字索引的预设词典进行词语匹配。3.根据权利要求2所述的基于语音交互的语义识别方法,其特征在于,所述利用所述音学文本中的表音字进行词语匹配包括:将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配,其中,所述预设词典中包括至少一个表音字、多个表义词,以及每个预设表义词与相应表音字的对应关系;将匹配的预设表义词作为与所述音学文本中的表音字匹配的表义词。4.根据权利要求3所述的基于语音交互的语义识别方法,其特征在于,所述将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配包括:按照在所述预设词典中出现频率递减的方式选取预设表义词;将选取的预设表义词的表音字与所述音学文本中的表音字进行匹配,直至所述音学文本中的所有表音字匹配完成。5.根据权利要求3所述的基于语音交互的语义识别方法,其特征在于,所述将所述音学文本中的表音字与所述预设词典中各个预设表义词的表音字进行匹配包括:将所述音学文本中的表音字或表音字组合与所述预设词典中各个预设表义词的表音字进行匹配,直至所述音学文本中的所有表音字匹配完成。6.根据权利要求1所述的基于语音交互的语义识别方法,其特征在于,所述利用所述音学文本进行词语匹配包括:确定所述音学文本中的表音字在预设词典中所属的近音词类,其中,所述预设词典中包括至少一个表音字、多个表义词、每个预设表义词与相应表音字的对应关系以及至少一个近音词类,每一近音词类包括多个近音表音字以及针对每一近音表音字的预设权重;选取所述音学文本中的表音字所属的近音词类中权重值最大的近音表音字,将其与预设词典中的表音字进行匹配;如果匹配结果为一致,则将匹配的表音字对应的表义词作为与所述音学文本中的表音字匹配的表义词。7.根据权利要求6所述的基于语音交互的语义识别方法,其特征在于,所述利用所述音学文本进行词语匹配还包括:如果匹配结果为不一致,则按照权重值递减的方式,在所述音学文本中的表音字所属的近音词类中依次选取近音表音字;将选取的近音表音字与预设词典中的表音字进行匹配,直至匹配结果为一致,并将匹配的表音字对应的表义词作为与所述音学文本中的表音字匹配的表义词。8.根据权利要求6或7所述的基于语音交互的语义识别方法,其特征在于,所述近音表音字包括标准表音字以及与所述标准表音字发音相似的相似表音字。9.根据权利要求2至7任一项所述的基于语音交互的语义识别方法,其特征在于,所述预设词典为分词词典,所述分词词典包括针对所有表义词的表音字。10.根据权利要求3至7任一项所述的基于语音交互的语义识别方法,其特征在于,所述表音字为汉字的拼音,所述预设表义词为汉语词语。11.根据权利要求1所述的基于语音交互的语义识别方法,其特征在于,还包括:将所述语音数据的语义与知识库中的知识点进行匹配;输出与所述语音数据的语义相匹配的知识点中的答案。12.一种基于语音交互的语义识别装置,其特征在于,包括:转换模块,用以将获取到的语音数据转换为音学文本,所述音学文本中包括至少一个表音字;匹配模块,用以利用所述音学文本中的表音字进行词语匹配,以得到文字文本,所述文字文本中包括与所述表音字匹配的表义...

【专利技术属性】
技术研发人员:韩潼瑜朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1