语义拒识方法、语义拒识装置、交通工具及介质制造方法及图纸

技术编号：29586116 阅读：19 留言：0更新日期：2021-08-06 19:45

本申请公开了一种语义拒识方法、语义拒识装置、交通工具和存储介质，语义拒识方法包括：获取语音请求的文本以及文本对应的出词置信度，根据文本以及对应的出词置信度生成置信度特征，置信度特征包括文本和文本对应的分字置信度，将上下文的置信度特征合并生成目标置信度特征，利用训练好的语义拒识模型对目标置信度特征进行预测得到拒识结果，语义拒识模型根据预设多模态模型训练得到。本申请的语义拒识方法通过将文本以及文本对应的出词置信度生成置信度特征并根据以上下文的置信度特征进行预测得到据识结果，提升了语义拒识准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语义拒识方法、语义拒识装置、交通工具及介质
本申请涉及交通领域，特别涉及一种语义拒识方法、语义拒识装置、交通工具及计算机可读存储介质。
技术介绍
随着交通工具的智能化，交通工具的应用程序与用户的交互越来越频繁。目前，在车载语音助手持续倾听的场景，由于实际交互环境时复杂多变，在语音交互过程中经常会存在噪声语音的输入，引起车辆语音助手的误响应，相关技术中，车辆语音助手可通过语义拒识模型根据输入语音的语义对某些语音进行拒识，以提高车载语音助手的识别率。因此，语义拒识模型的错误率直接影响最终指令是否正确理解和执行，如何提高语音拒识率成了亟待解决的问题。
技术实现思路
有鉴于此，本申请实施方式提供了一种语义拒识方法、语义拒识装置、交通工具及计算机可读存储介质。本申请提供了一种语义拒识方法，包括：获取语音请求的文本以及所述文本对应的出词置信度；根据所述文本以及对应的所述出词置信度生成置信度特征，所述置信度特征包括所述文本和所述文本对应的分字置信度；将上下文的所述置信度特征合并生成目标置信度特征；利用训练好的语义拒识模型对所述目标置信度特征进行预测得到拒识结果，所述语义拒识模型根据预设多模态模型训练得到。在某些实施方式中，所述根据所述文本以及对应的所述出词置信度构造生成置信度特征包括：根据所述文本对应的出词置信度确定所述文本的分字置信度；对所述分字置信度进行归一化处理以确定构建置信度词表；根据所述文本和所述置信度词表生成所述置信度特征。r>在某些实施方式中，所述将上下文的所述置信度特征合并生成目标置信度特征包括：根据所述语音请求的设备标识和语音采集时间对对应的所述置信度进行排序；将所述设备标识相同且处于预设倾听时长内的相邻所述置信度特征合并生成所述目标置信度特征。在某些实施方式中，所述利用训练好的语义拒识模型对所述目标置信度特征进行预测得到拒识结果包括：根据所述目标置信度特征确定分字特征向量、分句特征向量、位置特征向量和置信度特征向量；根据所述分字特征向量、所述分句特征向量、所述位置特征向量提取文本编码信息；根据所述置信度特征向量提取置信度编码信息；拼接所述文本编码信息和所述置信度编码信息以做自注意力特征融合；利用激活函数对所述自注意力特征融合的结果进行处理以得到所述目标拒识结果。在某些实施方式中，所述根据所述目标置信度特征确定分字特征向量、分句特征向量、位置特征向量和置信度特征向量包括：确定所述目标置信度特征的起止位；设置所述目标置信度特征的超参数；根据所述起止位和所述超参数对所述目标置信度特征进行补齐操作；根据补齐后的所述目标置信度特征确定所述分字特征向量、所述分句特征向量、所述位置特征向量和所述置信度特征向量。在某些实施方式中，所述根据所述分字特征向量、所述分句特征向量、所述位置特征向量提取文本编码信息包括：通过bert-encoder模型对所述分字特征向量、所述分句特征向量、所述位置特征向量进行特征提取以得到所述文本编码信息，所述bert-encoder模型包括多个muti-head-attention层，dense层和layer_norm层；所述根据所述置信度特征向量提取置信度编码信息，包括：对所述置信度特征向量做单层双向的lstm特征提取以得到所述置信度编码信息。在某些实施方式中，所述语义拒识方法包括：获取训练语音请求的训练文本以及所述训练文本对应的训练出词置信度；根据所述训练文本以及对应的所述训练出词置信度生成训练置信度特征，所述训练置信度特征包括所述训练文本和所述训练文本对应的训练分字置信度；将上下文的所述训练置信度特征合并生成目标训练置信度特征；确定所述目标训练置信度特征的训练识别结果；利用所述目标训练置信度特征和所述训练识别结果对预设多模态模型进行训练以得到训练好的所述语义拒识模型。本申请还提供了一种语义拒识装置，包括：获取模块，用于获取语音请求的文本以及所述文本对应的出词置信度；生成模块，用于根据所述文本以及对应的所述出词置信度生成置信度特征，所述置信度特征包括所述文本和所述文本对应的分字置信度；合并模块，用于将上下文的所述置信度特征合并生成目标置信度特征；处理模块，用于利用训练好的语义拒识模型对所述目标置信度特征进行预测得到拒识结果，所述语义拒识模型根据预设多模态模型训练得到。本申请还提供了一种交通工具，所述交通工具包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述任一项所述的语义拒识方法。本申请还提供一种非易失性计算机可读存储介质，当所述计算机程序被一个或多个处理器执行时，实现上述任一项实施例中所述的语义拒识方法。本申请通过将语音请求生成的文本以及对应的出词置信度生成置信度特征，并根据上下文的置信度特征合并生成目标置信度特征，从而建立了置信度以及上下文，以及再利用训练好的语义拒识模型对目标置信度特征进行预测得到拒识结果，如此，提高了语义拒识准确率。本申请实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。附图说明本申请的上述和/或附加的方面和优点可以从结合下面附图对实施方式的描述中将变得明显和容易理解，其中：图1是本申请某些实施方式的语义拒识方法的流程示意图；图2是本申请某些实施方式的语义拒识装置的模块示意图；图3是本申请某些实施方式的语义拒识方法的流程示例图；图4是本申请某些实施方式的语义拒识方法的流程示意图；图5是本申请某些实施方式的语义拒识方法的流程示意图；图6是本申请某些实施方式的语义拒识方法的场景示意图；图7是本申请某些实施方式的语义拒识方法的流程示意图。具体实施方式下面详细描述本申请的实施方式，实施方式的示例在附图中示出，其中，相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本申请的实施方式，而不能理解为对本申请的实施方式的限制。请参阅图1，本申请提供了一种语义拒识方法，包括：01：获取语音请求的文本以及文本对应的出词置信度；02：根据文本以及对应的出词置信度生成置信度特征，置信度特征包括文本和文本对应的分字置信度；03：将上下文的置信度特征合并生成目标置信度特征；04：利用训练好的语义拒识模型对目标置信度特征进行预测得到拒识结果，语义拒识模型根据预设多模态模型训练得到。相应地，请参阅图2，本申请实施方式还提供了一种语义拒识装置100，本申请实施方式的语义拒识方法可以由语义拒识装置100实现。语义拒识装置100包括获取模块110、生成模块120、合并模块本文档来自技高网...

【技术保护点】
1.一种语义拒识方法，其特征在于，所述语义拒识方法包括：/n获取语音请求的文本以及所述文本对应的出词置信度；/n根据所述文本以及对应的所述出词置信度生成置信度特征，所述置信度特征包括所述文本和所述文本对应的分字置信度；/n将上下文的所述置信度特征合并生成目标置信度特征；/n利用训练好的语义拒识模型对所述目标置信度特征进行预测得到拒识结果，所述语义拒识模型根据预设多模态模型训练得到。/n

【技术特征摘要】
1.一种语义拒识方法，其特征在于，所述语义拒识方法包括：
获取语音请求的文本以及所述文本对应的出词置信度；
根据所述文本以及对应的所述出词置信度生成置信度特征，所述置信度特征包括所述文本和所述文本对应的分字置信度；
将上下文的所述置信度特征合并生成目标置信度特征；
利用训练好的语义拒识模型对所述目标置信度特征进行预测得到拒识结果，所述语义拒识模型根据预设多模态模型训练得到。

2.根据权利要求1所述语义拒识方法，其特征在于，所述根据所述文本以及对应的所述出词置信度构造生成置信度特征包括：
根据所述文本对应的出词置信度确定所述文本的分字置信度；
对所述分字置信度进行归一化处理以构建置信度词表；
根据所述文本和所述置信度词表生成所述置信度特征。

3.根据权利要求1所述语义拒识方法，其特征在于，所述将上下文的所述置信度特征合并生成目标置信度特征包括：
根据所述语音请求的设备标识和语音采集时间对对应的所述置信度特征进行排序；
将所述设备标识相同且处于预设倾听时长内的相邻所述置信度特征合并生成所述目标置信度特征。

4.根据权利要求1所述语义拒识方法，其特征在于，所述利用训练好的语义拒识模型对所述目标置信度特征进行预测得到拒识结果包括：
根据所述目标置信度特征确定分字特征向量、分句特征向量、位置特征向量和置信度特征向量；
根据所述分字特征向量、所述分句特征向量、所述位置特征向量提取文本编码信息；
根据所述置信度特征向量提取置信度编码信息；
拼接所述文本编码信息和所述置信度编码信息以做自注意力特征融合；
利用激活函数对所述自注意力特征融合的结果进行处理以得到所述目标拒识结果。

5.根据权利要求4所述语义拒识方法，其特征在于，所述根据所述目标置信度特征确定分字特征向量、分句特征向量、位置特征向量和置信度特征向量包括：
确定所述目标置信度特征的起止位；
设置所述目标置信度特征的超参数；
根据所述起止位和所述超参数对所述目标置信度特征进行补齐操作；
根据补齐后的所述目标置信度特征确定所述分字特征向量、所述分句特征向量、所述位置特征...

【专利技术属性】
技术研发人员：韩传宇，易晖，翁志伟，
申请(专利权)人：广州小鹏汽车科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人