一种语音识别方法、装置、存储介质及语音设备制造方法及图纸

技术编号:21399331 阅读:19 留言:0更新日期:2019-06-19 07:05
本发明专利技术提供一种语音识别方法、装置、存储介质及语音设备,所述方法包括:将待识别语音识别为对应的文本,并识别所述文本中是否存在网络热词;若识别出所述文本中存在网络热词,则根据所述网络热词当前的热度和/或预先建立的语义分析模型,确定所述网络热词在所述文本中表达网络含义还是原本含义;根据确定的所述网络热词在所述文本中表达的网络含义或原本含义,解析出所述待识别语音的语义。本发明专利技术提供的方案能够判断出用户想表达的是网络热词的引申含义还是原本含义,提高语音识别的准确性。

【技术实现步骤摘要】
一种语音识别方法、装置、存储介质及语音设备
本专利技术涉及控制领域,尤其涉及一种语音识别方法、装置、存储介质及语音设备。
技术介绍
如今,在语音技术中,普遍采用语音识别与语义理解相结合的方法解析用户语义,其中语义理解是技术难点,我们通过语法、语义、语用分析,获取用户说的话的语义表示。但现今由于社会文化的丰富,出现了很多网络热词与段子,语言的含义变得更加广泛。例如,“pick”本来是挑选的意思,但现在引申为“支持”的意思。当用户语音控制设备的时候,若语音中包含有网络热词,单凭一句语音命令,缺少特定的语境,设备无法确定用户想表达的是词语的原始意思还是引申出的网络含义,尤其当句子结构不完整的时候,对用户语音的理解变得更有歧义,这无疑增加了语义理解的难度。
技术实现思路
本专利技术的主要目的在于克服上述现有技术的缺陷,提供一种语音识别方法、装置、存储介质及语音设备,以解决现有技术中语音中包含有网络热词时语音设备无法识别用户想表达的是词语原义还是引申的网络含义的问题。本专利技术一方面提供了一种语音识别方法,包括:将待识别语音识别为对应的文本,并识别所述文本中是否存在网络热词;若识别出所述文本中存在网络热词,则根据所述网络热词当前的热度和/或预先建立的语义分析模型,确定所述网络热词在所述文本中表达网络含义还是原本含义;根据确定的所述网络热词在所述文本中表达的网络含义或原本含义,解析出所述待识别语音的语义。可选地,识别所述文本中是否存在网络热词,包括:基于预先配置的网络热词库识别所述文本中是否存在网络热词。可选地,还包括:每隔第一预设时间更新所述网络热词库;和/或,每隔第二预设时间更新所述网络热词库中保存的网络热词对应的热度。可选地,根据所述网络热词当前的热度和/或预先建立的语义分析模型,确定所述网络热词在所述文本中表达网络含义还是原本含义,包括:将所述文本输入所述语义分析模型中进行分析,以得到所述网络热词在所述文本中表达网络含义和/或原本含义的第一评分;和/或,根据所述网络热词当前的热度,确定所述网络热词在所述文本中表达网络含义和/或原本含义的第二评分;根据所述第一评分和/或所述第二评分确定所述网络热词在所述文本中表达网络含义还是原本含义。可选地,还包括:建立所述语义分析模型,包括:采集预先标记了句子结构完整程度和/或句意符合逻辑程度的句子样本;将采集的所述句子样本输入预设的神经网络中进行神经网络模型训练,以建立语义分析模型。本专利技术另一方面提供了一种语音识别装置,包括:识别单元,用于将待识别语音识别为对应的文本,并识别所述文本中是否存在网络热词;确定单元,用于若所述识别单元识别出所述文本中存在网络热词,则根据所述网络热词当前的热度和/或预先建立的语义分析模型,确定所述网络热词在所述文本中表达网络含义还是原本含义;解析单元,用于根据确定的所述网络热词在所述文本中表达的网络含义或原本含义,解析出所述待识别语音的语义。可选地,所述识别单元,识别所述文本中是否存在网络热词,包括:基于预先配置的网络热词库识别所述文本中是否存在网络热词。可选地,还包括:更新单元,用于每隔第一预设时间更新所述网络热词库;和/或,每隔第二预设时间更新所述网络热词库中保存的网络热词对应的热度。可选地,所述确定单元,包括:第一评分子单元,用于将所述文本输入所述语义分析模型中进行分析,以得到所述网络热词在所述文本中表达网络含义和/或原本含义的第一评分;和/或,第二评分子单元,用于根据所述网络热词当前的热度,确定所述网络热词在所述文本中表达网络含义和/或原本含义的第二评分;确定子单元,用于根据所述第一评分和/或所述第二评分确定所述网络热词在所述文本中表达网络含义还是原本含义。可选地,还包括:模型建立单元,用于建立所述语义分析模型,包括:采集预先标记了句子结构完整程度和/或句意符合逻辑程度的句子样本;将采集的所述句子样本输入预设的神经网络中进行神经网络模型训练,以建立语义分析模型。本专利技术又一方面提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现前述任一所述方法的步骤。本专利技术再一方面提供了一种语音设备,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述任一所述方法的步骤。本专利技术再一方面提供了一种语音设备,包括前述任一所述的语音识别装置。根据本专利技术的技术方案,根据网络热词当前的热度和/或预先建立的语义分析模型确定网络热词在用户语音对应文本中表达网络含义还是原本含义,从而能够判断出用户想表达的是网络热词的引申含义还是原本含义,能够提高语音识别的准确性。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术提供的语音识别方法的一实施例的方法示意图;图2是根据本专利技术实施例的确定所述网络热词在所述文本中表达网络含义还是原本含义的步骤的一种具体实施方式的流程示意图;图3是本专利技术提供的语音识别方法的一具体实施例的方法示意图;图4是本专利技术提供的语音识别装置的一实施例的结构示意图;图5是根据本专利技术实施例的确定单元的一种具体实施方式的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术具体实施例及相应的附图对本专利技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本专利技术提供一种语音识别方法。所述语音识别方法可以用于语音设备。所述语音设备即是能够通过语音控制的设备。图1是本专利技术提供的语音识别方法的一实施例的方法示意图。如图1所示,根据本专利技术的一个实施例,所述语音设备方法至少包括步骤S110、步骤S120和步骤S130。步骤S110,将待识别语音识别为对应的文本,并识别所述文本中是否存在网络热词。具体地,当用户语音控制设备的时候,接收用户输入的语音作为待识别语音,对所述待识别语音进行识别,得到对应的文本,识别得到的文本中是否存在网络热词。可选地,可以预先配置网络热词库,所述网络热词库中保存网络热词,将待识别语音识别为对应的文本之后,基于预先配置的网络热词库识别所述文本中是否存在网络热词,也就是说,查找所述文本中是否存在所述网络热词库中的网络热词。所述网络热词库中还可以保存网络热词对应的含义和/或热度,所述热度具体可以为网络热词的出现次数和/或出现频率,可以根据其出现次数(例如,包括使用次数和/或搜索次数)和/或出现频率的高低来本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:将待识别语音识别为对应的文本,并识别所述文本中是否存在网络热词;若识别出所述文本中存在网络热词,则根据所述网络热词当前的热度和/或预先建立的语义分析模型,确定所述网络热词在所述文本中表达网络含义还是原本含义;根据确定的所述网络热词在所述文本中表达的网络含义或原本含义,解析出所述待识别语音的语义。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:将待识别语音识别为对应的文本,并识别所述文本中是否存在网络热词;若识别出所述文本中存在网络热词,则根据所述网络热词当前的热度和/或预先建立的语义分析模型,确定所述网络热词在所述文本中表达网络含义还是原本含义;根据确定的所述网络热词在所述文本中表达的网络含义或原本含义,解析出所述待识别语音的语义。2.根据权利要求1所述的方法,其特征在于,识别所述文本中是否存在网络热词,包括:基于预先配置的网络热词库识别所述文本中是否存在网络热词。3.根据权利要求2所述的方法,其特征在于,还包括:每隔第一预设时间更新所述网络热词库;和/或,每隔第二预设时间更新所述网络热词库中保存的网络热词对应的热度。4.根据权利要求1-3任一项所述的方法,其特征在于,根据所述网络热词当前的热度和/或预先建立的语义分析模型,确定所述网络热词在所述文本中表达网络含义还是原本含义,包括:将所述文本输入所述语义分析模型中进行分析,以得到所述网络热词在所述文本中表达网络含义和/或原本含义的第一评分;和/或,根据所述网络热词当前的热度,确定所述网络热词在所述文本中表达网络含义和/或原本含义的第二评分;根据所述第一评分和/或所述第二评分确定所述网络热词在所述文本中表达网络含义还是原本含义。5.根据权利要求4所述的方法,其特征在于,还包括:建立所述语义分析模型,包括:采集预先标记了句子结构完整程度和/或句意符合逻辑程度的句子样本;将采集的所述句子样本输入预设的神经网络中进行神经网络模型训练,以建立语义分析模型。6.一种语音识别装置,其特征在于,包括:识别单元,用于将待识别语音识别为对应的文本,并识别所述文本中是否存在网络热词;确定单元,用于若所述识别单元识别出所述文本中存在网络热词,则根据所述网络热词当前的热度和...

【专利技术属性】
技术研发人员:韩雪张新毛跃辉廖海霖李保水陶梦春郑文成
申请(专利权)人:珠海格力电器股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1