意图识别方法、装置、设备及介质制造方法及图纸

技术编号:23558610 阅读:30 留言:0更新日期:2020-03-25 04:06
本发明专利技术提供一种意图识别方法、装置、设备及介质,该方法包括:获取用户输入的基于自然语言的对话;预处理所述对话内语料信息;利用预先训练好的意图识别模型识别所述语料信息得到相应的意图。本发明专利技术相对于传统的意图识别方法,提前训练好意图识别模块,将获取的基于自然语言的对话经预处理后输入到所述意图识别模块识别语料信息中意图;该意图识别模块可根据场景变化进行调整,可迅速迁移到新场景,提高了其适用范围。

Intention identification method, device, equipment and medium

【技术实现步骤摘要】
意图识别方法、装置、设备及介质
本专利技术涉及人工智能
,特别是涉及一种意图识别方法、装置、设备及介质。
技术介绍
对话系统(DialogueSystem)是一种基于自然语言的人机交互系统。通过对话系统,人可以使用自然语言和计算机进行多轮交互来完成特定的任务,如信息查询、服务获取等。对话系统提供了一种更自然、便捷的人机交互方式,广泛应用于车载、家居、客服等场景。然而,现有的对话系统理解。其中,自然语言理解(NaturalLanguageUnderstanding)是对话系统中的核心模块。自然语言理解的目标是将自然语言的文本信息转换为可被计算机处理的语义表示(SemanticRepresentation),即用一种结构化的数据来表示一句话所表达的含义。也就是说,自然语言理解的目标是根据待解析的文本信息识别用户想表达的意图以及满足用户意图的条件。然而,现有人机对话基于规则的自然语言中识别意图,因规则的设定需要依赖领域知识而领域知识需要依靠专业人员设定,缺乏灵活性,适用面窄,无法在更多场景使用,降低了意图识别的准确度。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供意图识别方法、装置、设备及介质,用于解决现有通过自然语言识别用户意图带来的局限性问题。为实现上述目的及其他相关目的,本专利技术提供一种意图识别方法,包括:获取用户输入的基于自然语言的对话;预处理所述对话内语料信息;利用预先训练好的意图识别模型识别所述语料信息得到相应的意图。本专利技术的另一目的在于提供一种意图识别装置,包括:对话获取模块,用于获取用户输入的基于自然语言的对话;预处理模块,用于预处理所述对话内语料信息;意图识别模块,利用预先训练好的意图识别模型识别所述语料信息得到相应的意图。本专利技术的另一目的在于提供一种设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行上述意图识别方法。本专利技术还一目的在于提供一个或多个机器可读介质,包括:其上存储有指令,当由一个或多个处理器执行时,使得设备执行上述意图识别方法。如上所述,本专利技术提供的一种意图识别方法、装置、设备及介质,具有以下有益效果:本专利技术相对于传统的意图识别方法,提前训练好意图识别模块,将获取的基于自然语言的对话经预处理后输入到所述意图识别模块识别语料信息中意图;该意图识别模块可根据场景变化进行调整,可迅速迁移到新场景,提高了其适用范围。附图说明图1为本专利技术实施例提供的意图识别方法流程图;图2为本专利技术实施例提供的意图识别方法中意图识别流程图;图3为本专利技术实施例提供的意图识别方法意图识别中编码生成流程图;图4为本专利技术实施例提供的意图识别装置结构框图;图5为本专利技术实施例提供的意图识别装置中意图识别模块结构框图;图6为本专利技术实施例提供的意图识别装置中编码生成单元结构框图;图7为本专利技术实施例提供的终端设备的硬件结构示意图;图8为本专利技术实施例提供的终端设备的硬件结构示意图。元件标号说明1对话获取模块2预处理模块3意图识别模块31编码生成单元32特定模型生成单元33意图识别模型生成单元34意图提取单元311编码子单元312第一编码融合子单元313第二编码融合子单元1100输入设备1101第一处理器1102输出设备1103第一存储器1104通信总线1200处理组件1201第二处理器1202第二存储器1203通信组件1204电源组件1205多媒体组件1206语音组件1207输入/输出接口1208传感器组件具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。请参阅图1,为本专利技术实施例提供的意图识别方法流程图,包括:步骤S1,获取用户输入的基于自然语言的对话;其中,用户通过终端输入基于自然语言(人或机器理解的人类语言)的对话,该对话的形式可为语音、文字,或图片,不限形式。步骤S2,预处理所述对话内语料信息;其中,采用归一化处理所述对话内的语料(语言材料),例如,可通过简单缩放、逐样本均值消减、或特征标准化等方式归一化处理语料,以提高语料的精度,便于后续特征提取。步骤S3,利用预先训练好的意图识别模型识别所述语料信息得到相应的意图;其中,所述意图识别模型可根据场景的变化进行调整。其中,采用意图识别模型提取语料信息中意图,例如,以用户行为“订机票”为例,与“订机票”相关的语句包括出发时间、出发地点以及目的地点。对应于上述与“订机票”相关的语句,在用户语句“订明天十点从深圳到北京的机票”中,其中识别的意图是“订机票”。本实施例中,相对于传统的意图识别方法,提前训练好意图识别模块,将获取的基于自然语言的对话经预处理后输入到所述意图识别模块识别语料信息中意图;该意图识别模块可根据场景的变化进行调整,可迅速迁移到新场景,提高了其适用范围,可广泛应用于语音助手、智能客服、智能音箱、聊天机器人等。请参阅图2,本专利技术实施例提供的意图识别方法中意图识别流程图,即,利用预先训练好的意图识别模型识别所述语料信息得到相应的意图,详述如下:步骤S31,利用无监督语料进行预训练得到语言模型中的编码器;其中,所述语言模型包括编码器与解码器,将所述对话的原始输入序列通过嵌入处理得到向量化表达的输入序列;所述编码器对所述输入序列进行编码;所述解码器对编码后的输入序列进行解码得到输出序列。在一实施例中,所述编码器对所述输入序列进行编码的步骤,详见图3,包括:步骤S311,获取所述输入序列中每个单位的编码,其中,所述输入序列的粒度为字、词、多个语法单位或其组合;例如,假设语料信息为“帮我订周六重庆到上海的机票”,通过分词器对该对话语料信息进行分词,得到分词结果,假设用w1,w2,…,wn来表示分词,所获取的分词结果为:w1=帮,w2=我,w3=订,w4=周六w5=重庆,w6=到,w7=上海,w8=的,w9=机票,这是较为简单的字、本文档来自技高网...

【技术保护点】
1.一种意图识别方法,其特征在于,包括:/n获取用户输入的基于自然语言的对话;/n预处理所述对话内语料信息;/n利用预先训练好的意图识别模型识别所述语料信息得到相应的意图。/n

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:
获取用户输入的基于自然语言的对话;
预处理所述对话内语料信息;
利用预先训练好的意图识别模型识别所述语料信息得到相应的意图。


2.根据权利要求1所述的意图识别方法,其特征在于,所述意图识别模型的训练过程包括:
利用无监督语料进行预训练得到语言模型中的编码器;
利用预设场景下的监督语料,结合所述编码器与意图识别分类器得到所述预设场景下的意图识别模型。


3.根据权利要求2所述的意图识别方法,其特征在于,利用预设场景下的监督语料,结合所述编码器与意图识别分类器,通过交叉熵训练准则,获得所述预设场景下的意图识别模型。


4.根据权利要求2所述的意图识别方法,其特征在于,所述语言模型包括编码器与解码器,其中,将所述对话的原始输入序列通过嵌入处理得到向量化表达的输入序列;所述编码器对所述输入序列进行编码;所述解码器对编码后的输入序列进行解码得到输出序列。


5.根据权利要求4所述的意图识别方法,其特征在于,所述编码器对所述输入序列进行编码的步骤,包括:获取所述输入序列中每个单位的编码,其中,所述输入序列的粒度为字、词、多个语法单位或其组合;检测到所述输入序列包含不止一种粒度时,将不同粒度的编码按时序融合得到所述输入序列的编码。


6.根据权利要求5所述的意图识别方法,其特征在于,当检测到所述输入序列涉及上下文时,将所述输入序列的编码按上下文进行融合,得到包含上下文的输入序列的编码。


7.根据权利要求4或5所述的意图识别方法,其特征在于,所述编码器采用循环神经网络、注意力机制、长短期记忆网络或递归神经网络中一种或几种方式进行融合。


8.根据权利要求2所述的意图识别方法,其特征在于,所述语言模型采用交叉熵训练准则。


9.根据权利要求2所述的意图识别方法,其特征在于,所述意图识别分类器为全连接层。


10.一种意图识别装置,其特征在于,包括:
对话获取模块,用于获取用户输入的基于自然语言的对话;
预处理模块,用于预处理所述对话内语料信息;
意图识别模块,利用预先训练好的意图识别模型识别所述语料信息得到相应的意图。


11.根据权利要求10所述...

【专利技术属性】
技术研发人员:姚志强周曦李继伟杜晓薇郝东赵云
申请(专利权)人:广州洪荒智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1