语音语义识别方法、系统、设备及介质技术方案

技术编号:29529187 阅读:20 留言:0更新日期:2021-08-03 15:16
本发明专利技术提供一种语音语义识别方法、系统、设备及介质,包括:获取用户的语音信号;利用自动语音识别技术将语音信号转换为文本数据;判断所述文本数据是否符合预设句式,若是,则根据所述文本数据中的语音信号进行响应;若否,则利用自然语言处理分析文本数据得到命名实体,并对所述文本数据进行语法分析得到意图关键词,根据所述意图关键词与命名实体之间的关系,得到意图识别结果。本发明专利技术通过结合文本数据中语音信息中的命名实体与意图关键词,能够在用户不采用话术体系交互时,也能准确理解用户的意图,从而提高了语义识别的准确率与用户的体验度。

【技术实现步骤摘要】
语音语义识别方法、系统、设备及介质
本专利技术属于语音识别
,特别是涉及一种语音语义识别方法、系统、设备及介质。
技术介绍
目前,语音语义识别技术在电子设备上的应用越来越广泛。其中语音语义识别技术通过利用声学和语言学的方法,事先训练好声学模型,由于声学模型对语音数据进行语音识别。在实际产品中,语音语义识别技术会分成两个阶段,即语音识别(ASR)与自然语言处理(NLP);其中语音识别将音频数据识别成文本数据,并将文本数据作为自然语音处理的输入数据;在NLP过程中,根据设定的词库进行词槽提取,最终达到识别出音频数据的效果。然而,传统的语音功能,智能化程度并不能像真人一样,具体话术及使用方法需要用户学习才能更好的使用语音功能,而用户并不愿意花费时间和精力去阅读说明书,即便愿意阅读说明书,许多话术也难以记住。因此,现有技术中亟需一种准确率较高的语音语义识别方法。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种语音语义识别方法、系统、设备及介质,用于解决现有技术语音语义识别需用户学习话术,才能准确理解语义的问题。为实现上述目的及其他相关目的,本专利技术的第一方面提供一种语音语义识别方法,包括:获取用户的语音信号;利用自动语音识别技术将语音信号转换为文本数据;判断所述文本数据是否符合预设句式,若是,则根据所述文本数据中的语音信号进行响应;若否,则利用自然语言处理分析文本数据得到命名实体,并对所述文本数据进行语法分析得到意图关键词,根据所述意图关键词与命名实体之间的关系,得到意图识别结果。于所述第一方面的一实施例中,所述利用自然语言处理分析文本数据得到命名实体的步骤,包括:将所述文本数据内语音信息所对应的输入序列的每个字符映射成字符向量,根据输入序列相邻字符在词典中进行词组匹配,按照所述字符在词组中的位置生成标签并加权计算得到文本信息;将所述文本信息加入Albert预训练模型得到字符特征表示,得到每个字符的字符增加特征;利用Bi-LSTM对字符的word2vec向量与字符增加特征训练序列模型,基于该序列模型利用条件随机场识别出命名实体。于所述第一方面的一实施例中,所述Albert预训练模型采用双向transformer获取文本的特征表示,所述transformer为编码解码模型,所述编码解码模型包含多个相同的基本层,每个基本层包含两个子网络层,其中,一个多头自注意力机制层与另一个前馈网络层。于所述第一方面的一实施例中,还包括:结合词典信息与Albert预训练模型,将字符特征表示与字符增加特征输入到序列模型中,根据字符之间的依赖关系进行建模,得到基于Bi-LSTM的序列模型。于所述第一方面的一实施例中,还包括:将接收到的所述语音信息转化为至少包含一条文本信息的文本数据;对所述文本信息进行分词,其中,所述分词采用基于词库分词;根据分词后的文本识别所述关键词;根据所述关键词和/或所述关键词的组合获取意图关键词。于所述第一方面的一实施例中,还包括:将所述文本信息以句为单位进行依存句法分析并得到依存句法分析结果;根据预设的用户意图关键词候选集,使用深度学习方法训练词向量,通过词汇相似度进行模糊匹配得到意图关键词。于所述第一方面的一实施例中,还包括:判断所述意图关键词与命名实体关系之间是否存在依存关系,如果是,则根据两者之间的依存关系确定意图识别结果;如果否,则根据意图关键词与命名实体相同或近似关系确定意图识别结果。本专利技术的第二方面提供一种语音语义识别系统,包括:语音采集模块,用于获取用户的语音信号;语音识别模块,利用自动语音识别技术将语音信号转换为文本数据;意图判断模块,用于判断所述文本数据是否符合预设句式,若是,则根据所述文本数据中的语音信号进行响应;若否,则利用自然语言处理分析文本数据得到命名实体,并对所述文本数据进行语法分析得到意图关键词,根据所述意图关键词与命名实体之间的关系,得到意图识别结果。本专利技术的第三方面提供一种语音语义识别设备,包括:一个或多个处理装置;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现上述的语音语义识别方法。本专利技术的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序用于使所述计算机执行上述的语音语义识别方法。如上所述,本专利技术所述的语音语义识别方法、系统、设备及介质的一个技术方案,具有以下有益效果:本专利技术无需用户一定要话术转化才能准确识别用户的语音语义,通过结合文本数据中语音信息中的命名实体与意图关键词,能够在用户不采用话术体系交互时,也能准确理解用户的意图,从而提高了语义识别的准确率与用户的体验度。附图说明图1显示为本专利技术提供的一种语音语义识别方法流程图;图2显示为本专利技术提供的一种语音语义识别系统结构框图;图3显示为本专利技术提供的一种语音语义识别设备的结构示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。本专利技术解决现有技术中,例如,随着智能语音交互,特别是在智能问答系统中,通常采用语音识别、自然语言处理(NaturalLanguageProcessing,NLP)等技术,以对话的方式自动理解用户的语音或文字,在无需人工干预的情况下,分析用户输入的语音或文字并向用户返回合适的答案。作为人工智能的重要落地场景,智能问答系统广泛应用于智能客服等领域,例如,在健康咨询平台、医疗咨询平台,采用智能问答可以极大的降低人工成本,并带来更加友好、丰富的用户体验。请参阅图1,为本专利技术提供的一种语音语义识别方法流程图,包括:步骤S1,获取用户的语音信号;具体地,语音信息可以是用户采用智能终端或计算机或其他智能设备上,通过设备自带的麦克风输入的语音信号。步骤S2,利用自动语音识别技术将语音信号转换为文本数据;其中,语音识别技术,也被称为自动语音识别AutomaticSpeechRecognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列,与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。例如,从语音信本文档来自技高网...

【技术保护点】
1.一种语音语义识别方法,其特征在于,包括:/n获取用户的语音信号;/n利用自动语音识别技术将语音信号转换为文本数据;/n判断所述文本数据是否符合预设句式,若是,则根据所述文本数据中的语音信号进行响应;若否,则利用自然语言处理分析文本数据得到命名实体,并对所述文本数据进行语法分析得到意图关键词,根据所述意图关键词与命名实体之间的关系,得到意图识别结果。/n

【技术特征摘要】
1.一种语音语义识别方法,其特征在于,包括:
获取用户的语音信号;
利用自动语音识别技术将语音信号转换为文本数据;
判断所述文本数据是否符合预设句式,若是,则根据所述文本数据中的语音信号进行响应;若否,则利用自然语言处理分析文本数据得到命名实体,并对所述文本数据进行语法分析得到意图关键词,根据所述意图关键词与命名实体之间的关系,得到意图识别结果。


2.根据权利要求1所述的语音语义识别方法,其特征在于,所述利用自然语言处理分析文本数据得到命名实体的步骤,包括:将所述文本数据内语音信息所对应的输入序列的每个字符映射成字符向量,根据输入序列相邻字符在词典中进行词组匹配,按照所述字符在词组中的位置生成标签并加权计算得到文本信息;将所述文本信息加入Albert预训练模型得到字符特征表示,得到每个字符的字符增加特征;利用Bi-LSTM对字符的word2vec向量与字符增加特征训练序列模型,基于该序列模型利用条件随机场识别出命名实体。


3.根据权利要求2所述的语音语义识别方法,其特征在于,所述Albert预训练模型采用双向transformer获取文本的特征表示,所述transformer为编码解码模型,所述编码解码模型包含多个相同的基本层,每个基本层包含两个子网络层,其中,一个多头自注意力机制层与另一个前馈网络层。


4.根据权利要求3所述的语音语义识别方法,其特征在于,还包括:结合词典信息与Albert预训练模型,将字符特征表示与字符增加特征输入到序列模型中,根据字符之间的依赖关系进行建模,得到基于Bi-LSTM的序列模型。


5.根据权利要求1所述的语音语义识别方法,其特征在于,还包括:将接收到的所述语音信息转化为至少包含...

【专利技术属性】
技术研发人员:姚娟娟钟南山
申请(专利权)人:明品云北京数据科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1