【技术实现步骤摘要】
语音语义识别方法、系统、设备及介质
本专利技术属于语音识别
,特别是涉及一种语音语义识别方法、系统、设备及介质。
技术介绍
目前,语音语义识别技术在电子设备上的应用越来越广泛。其中语音语义识别技术通过利用声学和语言学的方法,事先训练好声学模型,由于声学模型对语音数据进行语音识别。在实际产品中,语音语义识别技术会分成两个阶段,即语音识别(ASR)与自然语言处理(NLP);其中语音识别将音频数据识别成文本数据,并将文本数据作为自然语音处理的输入数据;在NLP过程中,根据设定的词库进行词槽提取,最终达到识别出音频数据的效果。然而,传统的语音功能,智能化程度并不能像真人一样,具体话术及使用方法需要用户学习才能更好的使用语音功能,而用户并不愿意花费时间和精力去阅读说明书,即便愿意阅读说明书,许多话术也难以记住。因此,现有技术中亟需一种准确率较高的语音语义识别方法。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种语音语义识别方法、系统、设备及介质,用于解决现有技术语音语义识别需用 ...
【技术保护点】
1.一种语音语义识别方法,其特征在于,包括:/n获取用户的语音信号;/n利用自动语音识别技术将语音信号转换为文本数据;/n判断所述文本数据是否符合预设句式,若是,则根据所述文本数据中的语音信号进行响应;若否,则利用自然语言处理分析文本数据得到命名实体,并对所述文本数据进行语法分析得到意图关键词,根据所述意图关键词与命名实体之间的关系,得到意图识别结果。/n
【技术特征摘要】
1.一种语音语义识别方法,其特征在于,包括:
获取用户的语音信号;
利用自动语音识别技术将语音信号转换为文本数据;
判断所述文本数据是否符合预设句式,若是,则根据所述文本数据中的语音信号进行响应;若否,则利用自然语言处理分析文本数据得到命名实体,并对所述文本数据进行语法分析得到意图关键词,根据所述意图关键词与命名实体之间的关系,得到意图识别结果。
2.根据权利要求1所述的语音语义识别方法,其特征在于,所述利用自然语言处理分析文本数据得到命名实体的步骤,包括:将所述文本数据内语音信息所对应的输入序列的每个字符映射成字符向量,根据输入序列相邻字符在词典中进行词组匹配,按照所述字符在词组中的位置生成标签并加权计算得到文本信息;将所述文本信息加入Albert预训练模型得到字符特征表示,得到每个字符的字符增加特征;利用Bi-LSTM对字符的word2vec向量与字符增加特征训练序列模型,基于该序列模型利用条件随机场识别出命名实体。
3.根据权利要求2所述的语音语义识别方法,其特征在于,所述Albert预训练模型采用双向transformer获取文本的特征表示,所述transformer为编码解码模型,所述编码解码模型包含多个相同的基本层,每个基本层包含两个子网络层,其中,一个多头自注意力机制层与另一个前馈网络层。
4.根据权利要求3所述的语音语义识别方法,其特征在于,还包括:结合词典信息与Albert预训练模型,将字符特征表示与字符增加特征输入到序列模型中,根据字符之间的依赖关系进行建模,得到基于Bi-LSTM的序列模型。
5.根据权利要求1所述的语音语义识别方法,其特征在于,还包括:将接收到的所述语音信息转化为至少包含...
【专利技术属性】
技术研发人员:姚娟娟,钟南山,
申请(专利权)人:明品云北京数据科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。