一种通过语音确定语义的方法及系统技术方案

技术编号:20160556 阅读:34 留言:0更新日期:2019-01-19 00:13
本发明专利技术提供了一种通过语音确定语义的方法及系统,其方法包括:建立关键词对应的音频信息库和层级关系库;获取用户语音信息,将所述用户语音信息与所述音频信息库中的音频信息进行匹配,标记所述用户语音信息中包含的所有的关键词;统计标记的关键词的数量,根据所述层级关系库分析所述标记的关键词之间的层级关系;根据所述数量和/或所述层级关系确定所述用户语音信息的语义。本发明专利技术通过用户语音信息中的关键词确定用户语音信息中的语义,避免语音信息过长时对整条语音信息逐一进行语义解析导致解析时间过长以及语义解析不完整。

【技术实现步骤摘要】
一种通过语音确定语义的方法及系统
本专利技术涉及信息处理
,尤指一种通过语音确定语义的方法及系统。
技术介绍
随着网络技术的迅速发展,智能终端逐渐设计人们生活的方方面面,因此人们也越来越习惯地使用智能终端完成各种需求。而且随着人工智能相关技术的日益成熟,各类终端的智能化程度也越来越高。语音交互作为智能终端应用中主流的交互方式之一,极大地方便了各个用户的使用,例如通过语音控制智能设备的开启关闭以及切换各种使用模式,或者通过语音控制手机满足自身的不同需求,如查天气、查股票、听音乐等,或者用户在开车双手不方便操作时与智能车载设备进行语音交互以完成导航、电台查询、音乐查询等应用需求。各类智能终端在与用户语音交互的过程中,会获取到大量的语音信息,并且需要对获取的语音的语义进行识别解析,从而才能做出相应正确的反馈。现有技术中智能终端接收包含用户需求的语音信息,对该语音信息进行语音识别后得到对应的识别文本,再对识别文本进行语义理解后,系统根据语义理解结果对用户的需求做出相应的反馈,但是当语音信息过长或者过多时,智能终端不仅处理速度较慢,导致需要较长的处理时间,而且对过长的语音信息的语义理解的效果不是很理想。因此,如何正确快速理解语音数据的语义是人机语音交互过程中需要解决的问题。
技术实现思路
本专利技术的目的是提供一种通过语音确定语义的方法及系统,实现通过用户语音信息中的关键词确定用户语音信息中的语义,避免语音信息过长时对整条语音信息逐一进行语义解析导致解析时间过长以及语义解析不完整。本专利技术提供的技术方案如下:本专利技术提供一种通过语音确定语义的方法,其特征在于,包括:建立关键词对应的音频信息库和层级关系库;获取用户语音信息,将所述用户语音信息与所述音频信息库中的音频信息进行匹配,标记所述用户语音信息中包含的所有的关键词;统计标记的关键词的数量,根据所述层级关系库分析所述标记的关键词之间的层级关系;根据所述数量和/或所述层级关系确定所述用户语音信息的语义。优选的,所述的建立关键词对应的音频信息库和层级关系库具体包括:获取关键词的相关信息,所述相关信息包括关键词、关键词音频信息、关键词词义、关键词类别和关键词层级;根据所述关键词音频信息建立所述音频信息库;根据所述关键词词义、所述关键词类别和所述关键词层级建立所述层级关系库。优选的,所述的获取用户语音信息,将所述用户语音信息与所述音频信息库中的音频信息进行匹配,标记所述用户语音信息中包含的所有的关键词具体包括:获取所述用户语音信息;对所述用户语音信息进行分词标注,根据标注结果在所述用户语音信息相应区域标记语音切分标签;根据所述语音切分标签切分所述用户语音信息得到多个用户音频信息,将所述用户音频信息与所述音频信息库中的音频信息进行匹配,标记所述用户音频信息中包含的关键词。优选的,所述的根据所述数量和所述层级关系确定所述用户语音信息的语义:当所述数量为一时,所述标记的关键词的词义为所述用户语音信息的语义;当所述数量大于等于二时,根据所述层级关系确定所述用户语音信息的语义。优选的,所述的当所述数量大于等于二时,根据所述层级关系确定所述用户语音信息的语义具体包括:当所述标记的关键词是同级时,若所述标记的关键词的词义相似,则任一关键词的词义为所述用户语音信息的语义;当所述标记的关键词是同级时,若所述标记的关键词中至少一个关键词的词义与其余关键词的词义不相似,则所述用户语音信息的语义为多重;当所述标记的关键词非同级时,若所述标记的关键词之间存在包含关系,则存在包含关系的关键词中层级关系的最后一级的关键词的词义为所述用户语音信息的语义;当所述标记的关键词非同级时,若所述标记的关键词之间非包含关系,则所述用户语音信息的语义为多重。本专利技术还提供一种通过语音确定语义的系统,其特征在于,包括:数据库建立模块,建立关键词对应的音频信息库和层级关系库;标记模块,获取用户语音信息,将所述用户语音信息与所述数据库建立模块建立的所述音频信息库中的音频信息进行匹配,标记所述用户语音信息中包含的所有的关键词;处理模块,统计所述标记模块标记的关键词的数量,根据所述数据库建立模块建立的所述层级关系库分析所述标记的关键词之间的层级关系;控制模块,根据所述处理模块统计的所述数量和/或所述处理模块分析的所述层级关系确定所述用户语音信息的语义。优选的,所述数据库建立模块具体包括:第一获取单元,获取关键词的相关信息,所述相关信息包括关键词、关键词音频信息、关键词词义、关键词类别和关键词层级;数据库建立单元,根据所述第一获取单元获取的所述关键词音频信息建立所述音频信息库;所述数据库建立单元,根据所述第一获取单元获取的所述关键词词义、所述关键词类别和所述关键词层级建立所述层级关系库。优选的,所述标记模块具体包括:第二获取单元,获取所述用户语音信息;标记单元,对所述第二获取单元获取的所述用户语音信息进行分词标注,根据标注结果在所述用户语音信息相应区域标记语音切分标签;切分单元,根据所述标记单元标记的所述语音切分标签切分所述用户语音信息得到多个用户音频信息;所述标记单元,将所述切分单元切分得到的所述用户音频信息与所述音频信息库中的音频信息进行匹配,标记所述用户音频信息中包含的关键词。优选的,所述控制模块具体包括:识别单元,识别所述处理模块统计的所述数量;处理单元,当所述识别单元识别出所述数量为一时,所述标记的关键词的词义为所述用户语音信息的语义;所述处理单元,当所述识别单元识别出所述数量大于等于二时,根据所述层级关系确定所述用户语音信息的语义。优选的,所述处理单元具体包括:第一识别子单元,识别所述标记的关键词的级别;第二识别子单元,当所述第一识别子单元识别出所述标记的关键词是同级时,识别所述标记的关键词的词义;处理子单元,若所述第二识别子单元识别出所述标记的关键词的词义相似,则任一关键词的词义为所述用户语音信息的语义;所述处理子单元,若所述第二识别子单元识别出所述标记的关键词中至少一个关键词的词义与其余关键词的词义不相似,则所述用户语音信息的语义为多重;第三识别子单元,当所述第一识别子单元识别出所述标记的关键词非同级时,识别所述标记的关键词之间的关系;所述处理子单元,若所述第三识别子单元识别出所述标记的关键词之间存在包含关系,则存在包含关系的关键词中层级关系的最后一级的关键词的词义为所述用户语音信息的语义;所述处理子单元,若若所述第三识别子单元识别出所述标记的关键词之间非包含关系,则所述用户语音信息的语义为多重。通过本专利技术提供的一种通过语音确定语义的方法及系统,能够带来以下至少一种有益效果:1、本专利技术中通过用户语音信息中的关键词确定用户语音信息中的语义,避免需要对用户语音信息逐字逐句地进行解析,一方面降低了对系统解析能力的要求,语音信息越长,越难解析出正确的语义,另一方面提高了语义解析的速度,节省时间。2、本专利技术中将用户语音信息切分成多个用户音频信息,再将用户音频信息和音频信息库中的音频信息进行匹配,匹配速度更快,而且不容易造成遗漏或其它原因导致报错。3、本专利技术中将用户信息中包含的所有关键词根据数量以及相互之间的层级关系的情况进行分类,从而采取对应的确定语义的方式,对于包含关键词较多而且较为复杂的语音信息也能快速确定语义本文档来自技高网...

【技术保护点】
1.一种通过语音确定语义的方法,其特征在于,包括:建立关键词对应的音频信息库和层级关系库;获取用户语音信息,将所述用户语音信息与所述音频信息库中的音频信息进行匹配,标记所述用户语音信息中包含的所有的关键词;统计标记的关键词的数量,根据所述层级关系库分析所述标记的关键词之间的层级关系;根据所述数量和/或所述层级关系确定所述用户语音信息的语义。

【技术特征摘要】
1.一种通过语音确定语义的方法,其特征在于,包括:建立关键词对应的音频信息库和层级关系库;获取用户语音信息,将所述用户语音信息与所述音频信息库中的音频信息进行匹配,标记所述用户语音信息中包含的所有的关键词;统计标记的关键词的数量,根据所述层级关系库分析所述标记的关键词之间的层级关系;根据所述数量和/或所述层级关系确定所述用户语音信息的语义。2.根据权利要求1所述的通过语音确定语义的方法,其特征在于,所述的建立关键词对应的音频信息库和层级关系库具体包括:获取关键词的相关信息,所述相关信息包括关键词、关键词音频信息、关键词词义、关键词类别和关键词层级;根据所述关键词音频信息建立所述音频信息库;根据所述关键词词义、所述关键词类别和所述关键词层级建立所述层级关系库。3.根据权利要求1所述的通过语音确定语义的方法,其特征在于,所述的获取用户语音信息,将所述用户语音信息与所述音频信息库中的音频信息进行匹配,标记所述用户语音信息中包含的所有的关键词具体包括:获取所述用户语音信息;对所述用户语音信息进行分词标注,根据标注结果在所述用户语音信息相应区域标记语音切分标签;根据所述语音切分标签切分所述用户语音信息得到多个用户音频信息,将所述用户音频信息与所述音频信息库中的音频信息进行匹配,标记所述用户音频信息中包含的关键词。4.根据权利要求1所述的通过语音确定语义的方法,其特征在于,所述的根据所述数量和所述层级关系确定所述用户语音信息的语义:当所述数量为一时,所述标记的关键词的词义为所述用户语音信息的语义;当所述数量大于等于二时,根据所述层级关系确定所述用户语音信息的语义。5.根据权利要求4所述的通过语音确定语义的方法,其特征在于,所述的当所述数量大于等于二时,根据所述层级关系确定所述用户语音信息的语义具体包括:当所述标记的关键词是同级时,若所述标记的关键词的词义相似,则任一关键词的词义为所述用户语音信息的语义;当所述标记的关键词是同级时,若所述标记的关键词中至少一个关键词的词义与其余关键词的词义不相似,则所述用户语音信息的语义为多重;当所述标记的关键词非同级时,若所述标记的关键词之间存在包含关系,则存在包含关系的关键词中层级关系的最后一级的关键词的词义为所述用户语音信息的语义;当所述标记的关键词非同级时,若所述标记的关键词之间非包含关系,则所述用户语音信息的语义为多重。6.一种通过语音确定语义的系统,其特征在于,包括:数据库建立模块,建立关键词对应的音频信息库和层级关系库;标记模块,获取用户语音信息,将所述用户语音信息与所述数据库建立模块建立的所述音频信息库中的音频信息进行匹配,标记所述用户语音信息中包含的所有的关键词;处理模块,统计所...

【专利技术属性】
技术研发人员:魏誉荧
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1