一种工程化实现自然语义处理的方法、装置、设备及系统制造方法及图纸

技术编号:35189636 阅读:14 留言:0更新日期:2022-10-12 18:06
本发明专利技术公开了一种工程化实现自然语义处理的方法、装置、设备及系统,所述方法包括:获取用户发出的待执行语音指令经语音识别后的文字信息;根据训练后的文本分类模型和训练后的命名实体识别模型对文字信息进行处理,获得待执行语音指令的第一领域信息、第一意图信息和第一槽位信息;对第一领域信息、第一意图信息和第一槽位信息进行归一化映射处理,获得第二领域信息、第二意图信息和第二槽位信息;根据第二领域信息、第二意图信息和第二槽位信息,并利用待执行语音指令的上下文信息,执行待执行语音指令,获得指令执行结果。采用本发明专利技术的技术方案能够适用于不同车型、不同引擎,提高方案的自适应性,保证语音指令执行结果的准确性。准确性。准确性。

【技术实现步骤摘要】
一种工程化实现自然语义处理的方法、装置、设备及系统


[0001]本专利技术涉及语音
,尤其涉及一种工程化实现自然语义处理的方法、装置、终端设备及系统。

技术介绍

[0002]随着汽车技术的快速发展,用户与汽车之间基于自然语音进行对话的人机交互方式也得到了不断发展,这种人机语音交互方式使得用户在无需手动操作的情况下,就能够轻松完成各种控制和操作,从而提高了驾驶安全性及驾驶乐趣。
[0003]在人机语音交互过程中,对用户向车上的语音助手或者人工智能助手发出的语音指令进行语音识别,是其中的重要一环,因为语音识别结果关系到语音指令是否能够准确执行。但是,现有的语音识别方案一般仅能适用于特定车型或特定引擎,当应用于其他车型或其他引擎时,可能无法保证语音指令执行结果的准确性。

技术实现思路

[0004]本专利技术实施例的目的在于,提供一种工程化实现自然语义处理的方法、装置、终端设备及系统,能够适用于不同车型、不同引擎,提高方案的自适应性,保证语音指令执行结果的准确性。
[0005]为了实现上述目的,本专利技术实施例提供了一种工程化实现自然语义处理的方法,包括:
[0006]获取用户发出的待执行语音指令经语音识别后的文字信息;
[0007]根据训练后的文本分类模型和训练后的命名实体识别模型对所述文字信息进行处理,获得所述待执行语音指令对应的第一领域信息、第一意图信息和第一槽位信息;
[0008]对所述第一领域信息、所述第一意图信息和所述第一槽位信息进行归一化映射处理,对应获得第二领域信息、第二意图信息和第二槽位信息;
[0009]根据所述第二领域信息、所述第二意图信息和所述第二槽位信息,并利用所述待执行语音指令对应的上下文信息,执行所述待执行语音指令,获得指令执行结果。
[0010]进一步地,所述方法通过以下步骤获得所述训练后的文本分类模型和所述训练后的命名实体识别模型:
[0011]生成文本分类语料、命名实体识别语料、词向量文件、目标向量文件和停用词文件;
[0012]根据所述文本分类语料、所述词向量文件和所述停用词文件,对预设的文本分类模型进行训练,获得所述训练后的文本分类模型;
[0013]根据所述命名实体识别语料、所述目标向量文件和所述停用词文件,对预设的命名实体识别模型进行训练,获得训练后的命名实体识别模型。
[0014]进一步地,所述方法通过以下步骤生成所述文本分类语料和所述命名实体识别语料:
[0015]基于JSGF规则,增加Rule引用、Grammar引用和若干个基础规则,形成 HGF规则;
[0016]对基于HGF规则的HGF语法表达式进行语法解析,获得所述文本分类语料和所述命名实体识别语料;其中,所述文本分类语料中包括至少一个HGF语法表达式所对应的至少一条指令,所述命名实体识别语料中包括至少一个HGF 语法表达式所对应的至少一条指令。
[0017]进一步地,所述方法还包括:
[0018]对于每一个HGF语法表达式,当同一个HGF语法表达式所对应的指令的数量大于预设数量阈值时,将同一个HGF语法表达式所对应的指令按照8:1:1 的比例添加到模型训练的训练集、测试集和开发集中;
[0019]对于每一个HGF语法表达式,当同一个HGF语法表达式所对应的指令的数量不大于预设数量阈值时,将同一个HGF语法表达式所对应的指令全部添加到模型训练的训练集中。
[0020]进一步地,所述根据所述文本分类语料、所述词向量文件和所述停用词文件,对预设的文本分类模型进行训练,获得所述训练后的文本分类模型,具体包括:
[0021]将所述文本分类语料、所述词向量文件和所述停用词文件划分为训练集、开发集和测试集;
[0022]根据所述训练集、所述开发集和所述测试集对所述预设的文本分类模型进行训练,获得第一文本分类模型;
[0023]获取训练过程中生成的模型文件,并根据所述模型文件进行模型预测,获得预测结果;
[0024]当所述预测结果中存在异常预测结果时,将所述异常预测结果添加到所述训练集中,获得添加后的训练集;
[0025]根据所述添加后的训练集、所述开发集和所述测试集对所述第一文本分类模型进行训练及迭代,获得所述训练后的文本分类模型。
[0026]进一步地,每一个语料集中均包括至少一条基于预设的向量映射规则进行映射获得的固定格式指令;其中,所述语料集包括所述训练集、所述开发集和所述测试集;每一条固定格式指令均由目标部分和内容部分组成,所述目标部分包含用户语音指令的领域信息、意图信息和置信度,所述内容部分包含用户语音指令的指令信息。
[0027]进一步地,所述方法还包括:
[0028]基于里程碑管理不同模型的不同版本;
[0029]当在里程碑中构建新模型版本时,设置所述新模型版本对应的领域和意图;
[0030]当用户语音指令中包含版本信息时,查找所述版本信息对应的模型,并根据找到的模型对用户语音指令进行预测,获得指令预测结果。
[0031]为了实现上述目的,本专利技术实施例还提供了一种工程化实现自然语义处理的装置,用于实现上述任一项所述的工程化实现自然语义处理的方法,所述装置包括:
[0032]文字信息获取模块,用于获取用户发出的待执行语音指令经语音识别后的文字信息;
[0033]文字语义理解模块,用于根据训练后的文本分类模型和训练后的命名实体识别模型对所述文字信息进行处理,获得所述待执行语音指令对应的第一领域信息、第一意图信息和第一槽位信息;
[0034]归一化处理模块,用于对所述第一领域信息、所述第一意图信息和所述第一槽位
信息进行归一化映射处理,对应获得第二领域信息、第二意图信息和第二槽位信息;
[0035]语音指令执行模块,用于根据所述第二领域信息、所述第二意图信息和所述第二槽位信息,并利用所述待执行语音指令对应的上下文信息,执行所述待执行语音指令,获得指令执行结果。
[0036]本专利技术实施例还提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的工程化实现自然语义处理的方法。
[0037]本专利技术实施例还提供了一种工程化实现自然语义处理的系统,所述系统包括车端和云端;其中,
[0038]所述车端,用于接收用户发出的待执行语音指令,对所述待执行语音指令进行语音识别,获得文字信息,并将所述文字信息上传到所述云端;
[0039]所述云端,用于根据所述文字信息实现上述任一项所述的工程化实现自然语义处理的方法,获得指令执行结果,并将所述指令执行结果发送至所述车端;
[0040]所述车端,还用于根据所述指令执行结果形成语音信息,并播报所述语音信息。
[0041]与现有技术相比,本专利技术实施例提供了一种工程化实现自然语义处理的方法、装置、终端设备及系统,通过获取用户发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工程化实现自然语义处理的方法,其特征在于,包括:获取用户发出的待执行语音指令经语音识别后的文字信息;根据训练后的文本分类模型和训练后的命名实体识别模型对所述文字信息进行处理,获得所述待执行语音指令对应的第一领域信息、第一意图信息和第一槽位信息;对所述第一领域信息、所述第一意图信息和所述第一槽位信息进行归一化映射处理,对应获得第二领域信息、第二意图信息和第二槽位信息;根据所述第二领域信息、所述第二意图信息和所述第二槽位信息,并利用所述待执行语音指令对应的上下文信息,执行所述待执行语音指令,获得指令执行结果。2.如权利要求1所述的工程化实现自然语义处理的方法,其特征在于,所述方法通过以下步骤获得所述训练后的文本分类模型和所述训练后的命名实体识别模型:生成文本分类语料、命名实体识别语料、词向量文件、目标向量文件和停用词文件;根据所述文本分类语料、所述词向量文件和所述停用词文件,对预设的文本分类模型进行训练,获得所述训练后的文本分类模型;根据所述命名实体识别语料、所述目标向量文件和所述停用词文件,对预设的命名实体识别模型进行训练,获得训练后的命名实体识别模型。3.如权利要求2所述的工程化实现自然语义处理的方法,其特征在于,所述方法通过以下步骤生成所述文本分类语料和所述命名实体识别语料:基于JSGF规则,增加Rule引用、Grammar引用和若干个基础规则,形成HGF规则;对基于HGF规则的HGF语法表达式进行语法解析,获得所述文本分类语料和所述命名实体识别语料;其中,所述文本分类语料中包括至少一个HGF语法表达式所对应的至少一条指令,所述命名实体识别语料中包括至少一个HGF语法表达式所对应的至少一条指令。4.如权利要求3所述的工程化实现自然语义处理的方法,其特征在于,所述方法还包括:对于每一个HGF语法表达式,当同一个HGF语法表达式所对应的指令的数量大于预设数量阈值时,将同一个HGF语法表达式所对应的指令按照8:1:1的比例添加到模型训练的训练集、测试集和开发集中;对于每一个HGF语法表达式,当同一个HGF语法表达式所对应的指令的数量不大于预设数量阈值时,将同一个HGF语法表达式所对应的指令全部添加到模型训练的训练集中。5.如权利要求2所述的工程化实现自然语义处理的方法,其特征在于,所述根据所述文本分类语料、所述词向量文件和所述停用词文件,对预设的文本分类模型进行训练,获得所述训练后的文本分类模型,具体包括:将所述文本分类语料、所述词向量文件和所述停用词文件划分为训练集、开发集和测试集;根据所述训练集、所述开发集和所述测试集对所述预设的文本分类模型进行训练,获得第一文本分类模型;获取训练过程中生成的模型文...

【专利技术属性】
技术研发人员:丁磊葛超
申请(专利权)人:华人运通上海云计算科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1