【技术实现步骤摘要】
一种N最优口语语义识别方法、装置及电子设备
本专利技术涉及语音智能
,具体而言,涉及一种N最优口语语义识别方法、装置、电子设备及计算机可读介质。
技术介绍
随着人工智能技术的发展,语音机器人的应用也越来越广泛。语音机器人基于语音识别、语音合成、自然语言理解等技术,能够为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。目前,语音机器人已广泛应用于电话销售、智能问答、智能质检、实时演讲字幕、访谈录音等场景。语音机器人首先对用户的语音进行自然语音理解来识别用户意图,再根据用户意图通过自然语音生成技术生成对用户的问答语音,从而完成与用户的语音问答。在自然语音理解过程中语音机器人将用户的语音通过语音识别(AutomaticSpeechRecognition,ASR)技术转化为文字,再通过口语理解(SpokenLanguageUnderstanding,SLU)技术识别用户意图。其中,ASR技术先通过训练数据预先分析出语音特征参数,制作语音模板,并存放在语音参数库中,再将待识语音经过与训练时相同 ...
【技术保护点】
1.一种N最优口语语义识别方法,其特征在于,所述方法包括:/n获取自动语音识别ASR模型对历史音频数据输出的前N个概率值的文本数据和各个文本数据的标签作为训练集;/n通过所述训练集训练口语理解SLU模型;/n将ASR模型对测试音频数据输出的前M个概率值的文本数据输入所述SLU模型中,得到对该M个文本数据的意图识别概率序列;/n将所述意图识别概率序列中概率最大的意图作为所述测试音频数据的意图输出。/n
【技术特征摘要】
1.一种N最优口语语义识别方法,其特征在于,所述方法包括:
获取自动语音识别ASR模型对历史音频数据输出的前N个概率值的文本数据和各个文本数据的标签作为训练集;
通过所述训练集训练口语理解SLU模型;
将ASR模型对测试音频数据输出的前M个概率值的文本数据输入所述SLU模型中,得到对该M个文本数据的意图识别概率序列;
将所述意图识别概率序列中概率最大的意图作为所述测试音频数据的意图输出。
2.根据权利要求1所述的方法,其特征在于,所述ASR模型包括声学模型和语言模型。
3.根据权利要求2所述的方法,其特征在于,所述声学模型为长短记忆LSTM神经网络或者隐马尔可夫模型HMM。
4.根据权利要求2所述的方法,其特征在于,所述语言模型为n-gram模型、神经网络语言模型NNLM、word2vec模型中的任意一种。
5.根据权利要求1所述的方法,其特征在于,所述SLU模型为多任务深度神经网络MT-DNN或者变换器的双向编码表征BERT模型。
6.根据权利要求1所述的方法,其...
【专利技术属性】
技术研发人员:张常睿,李蒙,
申请(专利权)人:北京淇瑀信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。