The embodiment of the invention provides a Chinese spoken language semantic understanding method. This method includes: acquiring the generalized training set of unlabeled text sequence, predicting the training set in forward and backward order, training the two-way language model of word level and word level; receiving the spoken voice audio input from users, segmenting the word sequence, word sequence and word sequence; using the two-way language model of word level and word level respectively to the word sequence and word sequence Decode to get the hidden layer vector of word level and word level; align the hidden layer vector of word sequence and word sequence to get the hidden layer vector of spoken audio input by semantic understanding model; input the hidden layer vector of spoken audio to semantic understanding model to determine the semantic of spoken audio. The embodiment of the invention also provides a Chinese spoken language semantic understanding system. The embodiment of the invention has good generalization ability, combines words and word sequences, and improves the performance of Chinese semantic understanding.
【技术实现步骤摘要】
中文口语语义理解方法及系统
本专利技术涉及智能语音交互领域,尤其涉及一种中文口语语义理解方法及系统。
技术介绍
语义理解在智能语音的交互中有着重要的作用,通常会使用以下几个方法来进行语义理解:1、基于深度学习、有监督学习的口语语义理解:需要在自然文本或者语音识别文本上进行人工的语义标注,结合深度神经网络模型,以数据驱动的方式训练语义理解模型。2、基于深度学习、有监督学习,结合预训练词向量的口语语义理解:需要在自然文本或者语音识别文本上进行人工的语义标注,同时使用外部预训练的词向量初始化输入层网络,训练语义理解模型。3、基于深度学习、半监督学习的口语语义理解:需要在自然文本或者语音识别文本上进行人工的语义标注,同时还有大量未标注的自然文本或者语音识别文本,然后结合半监督学习方法(比如伪标签学习、对抗训练等)训练语义理解模型。4、基于深度学习、多任务学习,利用语言模型和语义理解联合训练的口语语义理解:需要在自然文本或者语音识别文本上进行人工的语义标注,同时还有大量未标注的自然文本或者语音识别文本;利用有标签数据学习语义理解任务,利用无标签数据学习语言模型任务,同时两个任务的底层参数相互共享。5、英文自然语言处理领域,利用预训练语言模型作为输入的自然语言处理技术:利用大量未标注的自然文本训练一个双向语言模型,然后将改语言模型作为后端自然语言处理任务的输入层。在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:1、基于深度学习、有监督学习的口语语义理解:需 ...
【技术保护点】
1.一种中文口语语义理解方法,包括:/n获取泛化的无标注文本序列训练集,依次对所述训练集进行正向预测、反向预测,分别训练字级别的双向语言模型以及词级别的双向语言模型;/n接收用户输入的口语语音音频,对所述语音音频进行序列分词,得到所述语音音频的字序列以及词序列;/n分别使用字级别的双向语言模型以及词级别的双向语言模型对所述字序列以及词序列进行解码,获得字级别的隐层向量以及词级别的隐层向量;/n对所述字序列和词序列的隐层向量进行向量对齐,得到语义理解模型输入的口语语音音频的隐层向量;/n将所述口语语音音频的隐层向量输入至语义理解模型,确定所述口语语音音频的语义。/n
【技术特征摘要】
1.一种中文口语语义理解方法,包括:
获取泛化的无标注文本序列训练集,依次对所述训练集进行正向预测、反向预测,分别训练字级别的双向语言模型以及词级别的双向语言模型;
接收用户输入的口语语音音频,对所述语音音频进行序列分词,得到所述语音音频的字序列以及词序列;
分别使用字级别的双向语言模型以及词级别的双向语言模型对所述字序列以及词序列进行解码,获得字级别的隐层向量以及词级别的隐层向量;
对所述字序列和词序列的隐层向量进行向量对齐,得到语义理解模型输入的口语语音音频的隐层向量;
将所述口语语音音频的隐层向量输入至语义理解模型,确定所述口语语音音频的语义。
2.根据权利要求1所述的方法,其中,所述对所述字序列和词序列的隐层向量进行向量对齐包括:
通过分词定律,将词级别的隐层向量进行复制,使得词级别的隐层向量的个数和所述字级别的隐层向量一样多;
将分词后的两个向量进行序列对齐,将对齐后的两个向量一一拼接,确定语义理解模型输入的口语语音音频的隐层向量。
3.根据权利要求1所述的方法,其中,所述将所述口语语音音频的隐层向量输入至语义理解模型包括:
基于所述语音音频的隐层向量对应的特征序列进行领域分类;
分别预测所述语音音频中每个字对应隐向量的语义槽类别;
根据所述领域分类以及所述语义槽类别确定所述语音音频的语义。
4.根据权利要求1所述的方法,其中,所述依次对所述训练集进行正向预测、反向预测,分别训练字级别的双向语言模型以及词级别的双向语言模型包括:
采用单向长短时记忆网络模型依次对所述训练集进行正向预测、反向预测。
5.根据权利要求1所述的方法,其中,所述依次对所述训练集进行正向预测、反向预测,分别训练字级别的双向语言模型以及词级别的双向语言模型还包括:
采用基于转换器的双向语言编码模型依次对所述训练集进行正向预测、反向预测。
6.一种中文口语语义理...
【专利技术属性】
技术研发人员:朱苏,徐华,俞凯,张瑜,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。