一种工程化实现自然语义处理的方法、装置、设备及系统制造方法及图纸

技术编号：35189636 阅读：14 留言：0更新日期：2022-10-12 18:06

本发明专利技术公开了一种工程化实现自然语义处理的方法、装置、设备及系统，所述方法包括：获取用户发出的待执行语音指令经语音识别后的文字信息；根据训练后的文本分类模型和训练后的命名实体识别模型对文字信息进行处理，获得待执行语音指令的第一领域信息、第一意图信息和第一槽位信息；对第一领域信息、第一意图信息和第一槽位信息进行归一化映射处理，获得第二领域信息、第二意图信息和第二槽位信息；根据第二领域信息、第二意图信息和第二槽位信息，并利用待执行语音指令的上下文信息，执行待执行语音指令，获得指令执行结果。采用本发明专利技术的技术方案能够适用于不同车型、不同引擎，提高方案的自适应性，保证语音指令执行结果的准确性。准确性。准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种工程化实现自然语义处理的方法、装置、设备及系统

[0001]本专利技术涉及语音
，尤其涉及一种工程化实现自然语义处理的方法、装置、终端设备及系统。

技术介绍

[0002]随着汽车技术的快速发展，用户与汽车之间基于自然语音进行对话的人机交互方式也得到了不断发展，这种人机语音交互方式使得用户在无需手动操作的情况下，就能够轻松完成各种控制和操作，从而提高了驾驶安全性及驾驶乐趣。
[0003]在人机语音交互过程中，对用户向车上的语音助手或者人工智能助手发出的语音指令进行语音识别，是其中的重要一环，因为语音识别结果关系到语音指令是否能够准确执行。但是，现有的语音识别方案一般仅能适用于特定车型或特定引擎，当应用于其他车型或其他引擎时，可能无法保证语音指令执行结果的准确性。

技术实现思路

[0004]本专利技术实施例的目的在于，提供一种工程化实现自然语义处理的方法、装置、终端设备及系统，能够适用于不同车型、不同引擎，提高方案的自适应性，保证语音指令执行结果的准确性。
[0005]为了实现上述目的，本专利技术实施例提供了一种工程化实现自然语义处理的方法，包括：
[0006]获取用户发出的待执行语音指令经语音识别后的文字信息；
[0007]根据训练后的文本分类模型和训练后的命名实体识别模型对所述文字信息进行处理，获得所述待执行语音指令对应的第一领域信息、第一意图信息和第一槽位信息；
[0008]对所述第一领域信息、所述第一意图信息和所述第一槽位信息进行归一化映射处理，对...

【技术保护点】

【技术特征摘要】
1.一种工程化实现自然语义处理的方法，其特征在于，包括：获取用户发出的待执行语音指令经语音识别后的文字信息；根据训练后的文本分类模型和训练后的命名实体识别模型对所述文字信息进行处理，获得所述待执行语音指令对应的第一领域信息、第一意图信息和第一槽位信息；对所述第一领域信息、所述第一意图信息和所述第一槽位信息进行归一化映射处理，对应获得第二领域信息、第二意图信息和第二槽位信息；根据所述第二领域信息、所述第二意图信息和所述第二槽位信息，并利用所述待执行语音指令对应的上下文信息，执行所述待执行语音指令，获得指令执行结果。2.如权利要求1所述的工程化实现自然语义处理的方法，其特征在于，所述方法通过以下步骤获得所述训练后的文本分类模型和所述训练后的命名实体识别模型：生成文本分类语料、命名实体识别语料、词向量文件、目标向量文件和停用词文件；根据所述文本分类语料、所述词向量文件和所述停用词文件，对预设的文本分类模型进行训练，获得所述训练后的文本分类模型；根据所述命名实体识别语料、所述目标向量文件和所述停用词文件，对预设的命名实体识别模型进行训练，获得训练后的命名实体识别模型。3.如权利要求2所述的工程化实现自然语义处理的方法，其特征在于，所述方法通过以下步骤生成所述文本分类语料和所述命名实体识别语料：基于JSGF规则，增加Rule引用、Grammar引用和若干个基础规则，形成HGF规则；对基于HGF规则的HGF语法表达式进行语法解析，获得所述文本分类语料和所述命名实体识别语料；其中，所述文本分类语料中包括至少一个HGF语法表达式所对应的至少一条指令，所述命名实体识别语料中包括至少一个HGF语法表达式所对应的至少一条指令。4.如权利要求3所述的工程化实现自然语义处理的方法，其特征在于，所述方法还包括：对于每一个HGF语法表达式，当同一个HGF语法表达式所对应的指令的数量大于预设数量阈值时，将同一个HGF语法表达式所对应的指令按照8:1:1的比例添加到模型训练的训练集、测试集和开发集中；对于每一个HGF语法表达式，当同一个HGF语法表达式所对应的指令的数量不大于预设数量阈值时，将同一个HGF语法表达式所对应的指令全部添加到模型训练的训练集中。5.如权利要求2所述的工程化实现自然语义处理的方法，其特征在于，所述根据所述文本分类语料、所述词向量文件和所述停用词文件，对预设的文本分类模型进行训练，获得所述训练后的文本分类模型，具体包括：将所述文本分类语料、所述词向量文件和所述停用词文件划分为训练集、开发集和测试集；根据所述训练集、所述开发集和所述测试集对所述预设的文本分类模型进行训练，获得第一文本分类模型；获取训练过程中生成的模型文...

【专利技术属性】
技术研发人员：丁磊，葛超，
申请(专利权)人：华人运通上海云计算科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人