一种语义理解方法及装置、设备、计算机可读介质制造方法及图纸

技术编号:19009261 阅读:19 留言:0更新日期:2018-09-22 09:07
本申请提供了一种语义理解方法及装置、设备,依据预设的领域分类,将待理解的语句划分为第一类子句,再依据预设的意图分类,将每个第一类子句划分为第二类子句,最后从每个第二类子句中提取槽信息,其中,每个第一类子句属于领域分类中的一个分类,每个第二类子句属于意图分类中的一个分类,可见,本申请所述的语义理解方法及装置,采用不同的划分维度,按照逐级划分子句的方式,能够得到多领域多意图下的槽信息,因此,能够针对多意图的语句,得到准确性较高的多意图的理解结果。

A semantic understanding method and device, device, and computer-readable medium

This application provides a semantic understanding method and device. According to the presupposed domain classification, the sentences to be understood are divided into the first clause, and then according to the presupposed intention classification, each first clause is divided into the second clause. Finally, slot information is extracted from each second clause, in which each first clause is divided into the second clause. Class clauses belong to one category of domain classification, and each second category clause belongs to one category of intention classification. It can be seen that the semantic understanding method and device described in this application can obtain slot information under multi-domain and multi-intention by using different division dimensions and by dividing clauses step by step. For multi intention sentences, we get more accurate and more understanding results.

【技术实现步骤摘要】
一种语义理解方法及装置、设备、计算机可读介质
本申请涉及电子信息领域,尤其涉及一种语义理解方法及装置、设备、计算机可读介质。
技术介绍
随着人工智能技术的不断突破和各种智能终端设备的日益普及,人机交互在人们日常工作和生活中出现的频率越来越高。语音交互作为最便捷的交互方式之一,已经成为人机交互的重要手段。人机交互对话系统被应用在各种智能终端设备中,如:电视、手机、车载、智能家居以及机器人等。而在人机交互对话系统中如何理解用户的意图是最为关键的技术。由于人类语言具有多样性、复杂性和歧义性,一句话往往可以表达多种意图,但当前的人机交互对话系统,只能够给出一种语义理解结果,对于涉及到多意图的语音(多意图可以理解为至少两个事件,例如“打开空调、关闭收音机”),会出现无结果或者只给出一种语义理解结果的问题,如:“先打开空调然后关闭收音机”,可能无输出结果,或者输出结果:“打开空调”,又例如:“导航到万达广场选择一条不堵的路线”可能输出结果:“导航不堵的路线”。可见,现有的语义理解方法,对于多意图的语句的理解不够准确。
技术实现思路
本申请提供了一种语义理解方法及装置、设备、计算机可读介质,目的在于解决对于多意图的语句的理解不够准确的问题。为了实现上述目的,本申请提供了以下技术方案:一种语义理解方法,包括:依据预设的领域分类,将待理解的语句划分为第一类子句,其中,每个所述第一类子句属于所述领域分类中的一个分类;依据预设的意图分类,将每个所述第一类子句划分为第二类子句,其中,每个所述第二类子句属于所述意图分类中的一个分类;从每个所述第二类子句中提取槽信息。可选的,所述依据预设的领域分类,将待理解的语句划分为第一类子句包括:将所述待理解的语句中的每个字作为输入,使用领域判别模型,得到所述待理解的语句中的每个字的领域标签,所述待理解的语句中的任意一个字的所述领域标签包括:该字所属的领域分类的名称以及第一位置信息,所述第一位置信息为该字在满足第一条件的所有字中的位置信息,所述第一条件为所述待理解的语句中与该字属于相同的领域分类的字,所述位置包括起始、中间和结束。可选的,所述领域判别模型的训练过程包括:针对所述预设的领域分类中的每一种分类,分别收集第一预设数量条语句,并对收集的语句标注所述领域标签;收集第二预设数量条不属于所述预设的领域分类中的任何一个分类的语句,并标注不属于所述预设的领域分类的标签;使用标注后的语句训练第一排序标注模型的目标函数,得到所述领域判别模型。可选的,所述依据预设的意图分类,将每个所述第一类子句划分为第二类子句包括:将所述第一类子句中每一个具有相同领域分类名称的字作为输入,使用与所述第一类子句所属的领域分类对应的意图判别模块,得到所述第一类子句中的每个字的意图标签,所述第一类子句中的任意一个字的所述意图标签包括:该字所属的意图分类的名称以及第二位置信息,所述第二位置信息为该字在满足第二条件的所有字中的位置信息,所述第二条件为所述第一类子句中与该字属于相同的领域分类以及相同的意图分类的字,所述位置包括起始、中间和结束,其中,每一个领域分类对应一个意图判别模块,不同的领域分类对应的意图判别模块不同。可选的,任意一个所述领域分类对应的所述意图判别模块的训练方法包括:收集属于该领域分类的第三预设数量条语句,并对收集的每条语句标注所述意图标签;收集第四预设数量不属于预设的意图分类中的任何一个分类的语句,并标注不属于所述预设的领域分类的标签;使用标注后的语句训练第二排序标注模型的目标函数,得到该领域分类对应的所述意图判别模块。可选的,所述从每个所述第二类子句中提取槽信息包括:将第二类子句中的每一个字和所述第二类子句的意图向量作为输入,使用与所述第二类子句所属的领域分类对应的槽信息判别模型,得到所述第二类子句中的每个字的槽信息标签,所述第二类子句中的任意一个字的槽信息标签包括:该字所属的槽信息的名称以及第三位置信息,所述第三位置信息为该字在满足第三条件的所有字中的位置信息,所述第三条件为所述第二类子句中与该字属于相同的领域分类、相同的意图分类、且具有相同的槽信息的字;其中,每一个领域分类对应一个槽信息判别模块,不同的领域分类对应的槽信息判别模块不同。可选的,任意一个所述领域分类对应的所述槽信息判别模块的训练方法包括:收集属于该领域分类的第五预设数量条语句,并对收集的语句标注槽信息标签;收集第六预设数量不属于预设的槽信息中的任何一个槽信息的语句,并标注不属于所述预设的槽信息的标签;使用标注后的语句训练第三排序标注模型的目标函数,得到该领域分类对应的所述槽信息判别模块。可选的,在所述从每个所述第二类子句中提取槽信息之后,还包括:将所述待理解语句的分词结果、所述槽信息候选路径以及所述待理解语句中的所述第二类子句的意图向量作为输入,使用预设的模型,对槽信息候选路径进行评分,所述槽信息候选路径由从每个所述第二类子句中提取的至少一个槽信息组合形成;依据所述评分,确定槽信息提取结果。一种语义理解装置,包括:第一划分模块,用于依据预设的领域分类,将待理解的语句划分为第一类子句,其中,每个所述第一类子句属于所述领域分类中的一个分类;第二划分模块,用于依据预设的意图分类,将每个所述第一类子句划分为第二类子句,其中,每个所述第二类子句属于所述意图分类中的一个分类;提取模块,用于从每个所述第二类子句中提取槽信息。可选的,所述第一划分模块用于依据预设的领域分类,将待理解的语句划分为第一类子句包括:所述第一划分模块具体用于,将所述待理解的语句中的每个字作为输入,使用领域判别模型,得到所述待理解的语句中的每个字的领域标签,所述待理解的语句中的任意一个字的所述领域标签包括:该字所属的领域分类的名称以及第一位置信息,所述第一位置信息为该字在满足第一条件的所有字中的位置信息,所述第一条件为所述待理解的语句中与该字属于相同的领域分类的字,所述位置包括起始、中间和结束。可选的,所述第一划分模块还用于,采用如下方法,训练所述领域判别模型:针对所述预设的领域分类中的每一种分类,分别收集第一预设数量条语句,并对收集的语句标注所述领域标签;收集第二预设数量条不属于所述预设的领域分类中的任何一个分类的语句,并标注不属于所述预设的领域分类的标签;使用标注后的语句训练第一排序标注模型的目标函数,得到所述领域判别模型。可选的,所述第二划分模块用于依据预设的意图分类,将每个所述第一类子句划分为第二类子句包括:所述第二划分模块具体用于,将所述第一类子句中每一个具有相同领域分类名称的字作为输入,使用与所述第一类子句所属的领域分类对应的意图判别模块,得到所述第一类子句中的每个字的意图标签,所述第一类子句中的任意一个字的所述意图标签包括:该字所属的意图分类的名称以及第二位置信息,所述第二位置信息为该字在满足第二条件的所有字中的位置信息,所述第二条件为所述第一类子句中与该字属于相同的领域分类以及相同的意图分类的字,所述位置包括起始、中间和结束,其中,每一个领域分类对应一个意图判别模块,不同的领域分类对应的意图判别模块不同。可选的,所述第二划分模块还用于,按照以下方法,训练任意一个所述领域分类对应的所述意图判别模块:收集属于该领域分类的第三预设数量条语句,并对收集的每条语本文档来自技高网...
一种语义理解方法及装置、设备、计算机可读介质

【技术保护点】
1.一种语义理解方法,其特征在于,包括:依据预设的领域分类,将待理解的语句划分为第一类子句,其中,每个所述第一类子句属于所述领域分类中的一个分类;依据预设的意图分类,将每个所述第一类子句划分为第二类子句,其中,每个所述第二类子句属于所述意图分类中的一个分类;从每个所述第二类子句中提取槽信息。

【技术特征摘要】
1.一种语义理解方法,其特征在于,包括:依据预设的领域分类,将待理解的语句划分为第一类子句,其中,每个所述第一类子句属于所述领域分类中的一个分类;依据预设的意图分类,将每个所述第一类子句划分为第二类子句,其中,每个所述第二类子句属于所述意图分类中的一个分类;从每个所述第二类子句中提取槽信息。2.根据权利要求1所述的方法,其特征在于,所述依据预设的领域分类,将待理解的语句划分为第一类子句包括:将所述待理解的语句中的每个字作为输入,使用领域判别模型,得到所述待理解的语句中的每个字的领域标签,所述待理解的语句中的任意一个字的所述领域标签包括:该字所属的领域分类的名称以及第一位置信息,所述第一位置信息为该字在满足第一条件的所有字中的位置信息,所述第一条件为所述待理解的语句中与该字属于相同的领域分类的字,所述位置包括起始、中间和结束。3.根据权利要求2所述的方法,其特征在于,所述领域判别模型的训练过程包括:针对所述预设的领域分类中的每一种分类,分别收集第一预设数量条语句,并对收集的语句标注所述领域标签;收集第二预设数量条不属于所述预设的领域分类中的任何一个分类的语句,并标注不属于所述预设的领域分类的标签;使用标注后的语句训练第一排序标注模型的目标函数,得到所述领域判别模型。4.根据权利要求1所述的方法,其特征在于,所述依据预设的意图分类,将每个所述第一类子句划分为第二类子句包括:将所述第一类子句中每一个具有相同领域分类名称的字作为输入,使用与所述第一类子句所属的领域分类对应的意图判别模块,得到所述第一类子句中的每个字的意图标签,所述第一类子句中的任意一个字的所述意图标签包括:该字所属的意图分类的名称以及第二位置信息,所述第二位置信息为该字在满足第二条件的所有字中的位置信息,所述第二条件为所述第一类子句中与该字属于相同的领域分类以及相同的意图分类的字,所述位置包括起始、中间和结束,其中,每一个领域分类对应一个意图判别模块,不同的领域分类对应的意图判别模块不同。5.根据权利要求4所述的方法,其特征在于,任意一个所述领域分类对应的所述意图判别模块的训练方法包括:收集属于该领域分类的第三预设数量条语句,并对收集的每条语句标注所述意图标签;收集第四预设数量不属于预设的意图分类中的任何一个分类的语句,并标注不属于所述预设的领域分类的标签;使用标注后的语句训练第二排序标注模型的目标函数,得到该...

【专利技术属性】
技术研发人员:王兴宝蒋亚冲雷琴辉黄倪莎
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1