一种意图识别方法、装置、设备及介质制造方法及图纸

技术编号:32268820 阅读:14 留言:0更新日期:2022-02-12 19:32
本申请公开了一种意图识别方法、装置、设备及介质,该方法中对输入的文本进行实体抽取处理,获取所述文本对应的至少包含实体关系的脱敏文本,将所述脱敏文本与每个该规则对应的关键词进行匹配,若存在与所述脱敏文本匹配成功的规则,则确定所述文本的意图为该规则对应的意图。由于在本申请实施例中对输入的文本进行实体抽取处理,得到了至少包含实体关系的脱敏文本,将脱敏文本作为后续意图识别的输入文本,提高了意图识别的准确率,并且预先设定了多个规则,基于规则对应的关键词进行意图识别,在保证意图识别精度的情况下,极大减少了意图识别时间,提高了意图识别的效率。提高了意图识别的效率。提高了意图识别的效率。

【技术实现步骤摘要】
一种意图识别方法、装置、设备及介质


[0001]本申请涉及充信息检索
,尤其涉及一种意图识别方法、装置、设备及介质。

技术介绍

[0002]在数据信息库中存在大量的人员基本信息数据、人员轨迹数据、案件数据、车辆基本信息数据、车辆轨迹数据和各种设备数据。其中人员基本信息数据、车辆基本信息数据和案件数据每天都会产生大量的新增数据,人员轨迹数据和车辆轨迹数据更是每时每刻发生着变化,因此如何从海量的数据中精准查找到自己想要数据成为一个挑战。信息检索作为解决信息过载的一种技术手段,完美解决了信息精准查找问题。意图识别作为信息检索最核心的技术之一,对于检索结果的准确性起着决定性的作用。
[0003]目前,常用的意图识别方法是使用机器学习或者深度学习对数据进行模型训练,从而进行意图识别。虽然该方法在很多领域都取得了很好的效果,但是,取得很好的效果的前提是依赖大量的样本进行模型训练。模型训练的周期较长影响使用,并且为了实现精准识别,一般模型的结果设计的会比较复杂,尤其是卷积核较多时,在基于这样模型进行意图识别时,耗时也是非常长的,将会影响整个意图识别的效率。

技术实现思路

[0004]本申请实施提供一种意图识别方法、装置、设备及介质,用以解决现有技术中意图识别需要大量样本进行训练,意图识别过程时间较长以及每次扩充新的意图都需要重新对模型进行训练无法实现动态扩展的问题。
[0005]第一方面,本申请提供了一种意图识别方法,所述方法包括:
[0006]对输入的文本进行实体抽取处理,获取所述文本对应的至少包含实体关系的脱敏文本;
[0007]将所述脱敏文本与每个规则对应的关键词进行匹配,若存在与所述脱敏文本匹配成功的规则,则确定所述文本的意图为该规则对应的意图。
[0008]第二方面,本申请还提供了一种意图识别装置,所述装置包括:
[0009]获取模块,用于对输入的文本进行实体抽取处理,获取所述文本对应的至少包含实体关系的脱敏文本;
[0010]识别模块,用于将所述脱敏文本与每个规则对应的关键词进行匹配,若存在与所述脱敏文本匹配成功的规则,则确定所述文本的意图为该规则对应的意图。
[0011]第三方面,本申请还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现上述任一所述的意图识别方法的步骤。
[0012]第四方面,本申请还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的意图识别方法的步骤。
[0013]本申请实施例提供了一种意图识别方法、装置、设备及介质,该方法中对输入的文本进行实体抽取处理,获取所述文本对应的至少包含实体关系的脱敏文本,将所述脱敏文本与每个该规则对应的关键词进行匹配,若存在与所述脱敏文本匹配成功的规则,则确定所述文本的意图为该规则对应的意图。由于在本申请实施例中对输入的文本进行实体抽取处理,得到了至少包含实体关系的脱敏文本,将脱敏文本作为后续意图识别的输入文本,提高了意图识别的准确率,并且预先设置了多个规则,基于规则对应的关键词进行意图识别,在保证意图识别精度的情况下,极大减少了意图识别时间,提高了意图识别的效率。
附图说明
[0014]为了更清楚地说明本申请的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015]图1为本申请实施例提供的意图识别过程示意图;
[0016]图2为本申请提出的一种意图识别过程流程图;
[0017]图3为本申请实施例提供的意图识别装置的结构示意图;
[0018]图4为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
[0019]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图,对本申请的实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
[0020]本申请实施例提供了一种意图识别方法、装置、设备及介质,该方法中对输入的文本进行实体抽取处理,获取所述文本对应的至少包含实体关系的脱敏文本,将所述脱敏文本与每个该规则对应的关键词进行匹配,若存在与所述脱敏文本匹配成功的规则,则确定所述文本的意图为该规则对应的意图。由于在本申请实施例中对输入的文本进行实体抽取处理,得到了至少包含实体关系的脱敏文本,将脱敏文本作为后续意图识别的输入文本,提高了意图识别的准确率,并且预先设定了多个规则,基于规则对应的关键词进行意图识别,在保证意图识别精度的情况下,极大减少了意图识别时间,提高了意图识别的效率。
[0021]图1为本申请实施例提供的意图识别过程示意图,该过程具体包括以下步骤:
[0022]S101:对输入的文本进行实体抽取处理,获取所述文本对应的至少包含实体关系的脱敏文本。
[0023]本申请实施例提供的意图识别过程适用于电子设备,该电子设备可以是服务器、PC等设备。
[0024]当接收到输入的文本后,对该文本进行实体抽取处理,实体抽取方法包括:根据输入的文本确定未知实体的自然问句,得到自然问句和待抽取文本的向量表示;基于向量表示确定自然问句的答案,即得到未知实体。其中自然问句是由已知实体和实体关系构建而成,实体关系为已知实体和未知实体之间的关系。
[0025]在本申请实施例中,根据输入的文本获取到的脱敏文本可以只包含实体关系,也
可以包含相关的描述。例如输入文本为“张三的父亲是谁”,脱敏文本为“{姓名}的{人物关系}是谁”;输入文本为“近三周在滨江区出现的身高180男性”,脱敏文本为“{时间}在{地址}出现的{身高}{性别}”;输入文本为“五一期间,张三的入住记录”,脱敏文本为“{时间},{姓名}的入住记录”;输入文本为“张三李四王五”,脱敏文本为“{姓名}{姓名}{姓名}”等。
[0026]本申请实施例首先对输入的文本进行实体抽取处理,经过实体抽取后获得到实体关系和对应的实体,使用实体关系替换实体即完成实体脱敏,最终得到该文本对应的至少包含实体关系的脱敏文本,使用脱敏文本作为后续意图识别过程的原始输入。其中,实体关系和实体相互对应,在获取到包含有实体的脱敏文本后,可以采用该实体对应的实体关系对该实体进行替换,从而得到包含实体关系的脱敏文本。
[0027]本申请实施例中,若分别输入“张三的父亲”、“李四的儿子”两个内容完全不同的文本,经过实体抽取处理后,获取到的脱敏文本都为包含“{姓名}的{人物关系}”文本,在后续意图识别过程中,将包含“{姓名}的{人物关系}”的脱敏文本作为原始输入进行意图识别,因此本申请实施例并不会因为姓名或者人物关系内容的变化而影响意图识别的结果,更好的利用了实体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,所述方法包括:对输入的文本进行实体抽取处理,获取所述文本对应的至少包含实体关系的脱敏文本;将所述脱敏文本与每个规则对应的关键词进行匹配,若存在与所述脱敏文本匹配成功的规则,则确定所述文本的意图为该规则对应的意图。2.如权利要求1所述的方法,其特征在于,所述方法还包括:判断所述脱敏文本中是否只包含实体关系和分隔符;若是,则确定所述文本的意图为关键词意图。3.如权利要求1所述的方法,其特征在于,所述方法还包括:若所述脱敏文本与每个规则匹配均不成功,则将所述脱敏文本输入到预先训练完成的分类模型中,获取所述分类模型输出的意图;将所述分类模型输出的意图作为所述文本的意图。4.如权利要求3所述的方法,其特征在于,所述方法还包括:若所述分类模型无法识别所述文本的意图,则将所述脱敏文本输入到词移距离WMD模型中,获取所述WMD模型输出的意图识别结果;根据所述WMD模型输出的意图识别结果,确定是否能够确定所述文本的意图。5.如权利要求4所述的方法,其特征在于,所述将所述脱敏文本输入到词移距离WMD模型中,获取所述WMD模型输出的意图识别结果包括:基于所述WMD模型计算所述脱敏文本与预先保存的每个新增意图脱敏文本的相似度;若存在与所述脱敏文本的相似度大于设定的相似度阈值的新增意图脱敏文本,则输出所述相似度大于设定的相似度阈值的新增意图脱敏文本对应的意图的第一识别结果;若每个新增意图脱敏文本与所述脱敏文本的相似度均不大于设定的相似度阈值,则输出...

【专利技术属性】
技术研发人员:钱佳佳刘伟棠陈立力周明伟
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1