意图识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38421592 阅读:10 留言:0更新日期:2023-08-07 11:21
本发明专利技术涉及智慧医疗领域,提供一种意图识别方法,该方法包括:基于对话文本构建图卷积神经网络;基于对话文本中和所述图卷积神经网络,得到文本中每个字的改进的TF

【技术实现步骤摘要】
意图识别方法、装置、电子设备及存储介质


[0001]本专利技术涉智慧医疗及深度学习领域,尤其涉及一种意图识别方法、装置、电子设备及存储介质。

技术介绍

[0002]传统聊天机器人中的用户意图识别一般采用基于模板匹配或人工特征集合等方法,例如,基于规则和图的方法来获意图模板;或者基于消费意图语料的匮乏,在消费意图表达具有相似性的假设下采用跨领域迁移学习(transferlearning)的消费意图检测方法。这些传统的意图识别方法一般是基于模板匹配或人工特征集合,费时费力、扩展性不强。
[0003]针对其费时费力而且扩展性不强的问题,并结合医疗领域聊天文本的特点,现有技术采用了BTM

BiGRU的方法来解决问题,但是忽略了外部语义信息的支持,导致含有多个专业词汇的语句的意图识别不明显。
[0004]因此,针对现有就医意图识别方法“忽略了外部语义信息的支持”的问题,需要一种可以丰富词汇的语义信息,从而使就医意图识别更准确的方法。

技术实现思路

[0005]鉴于以上原因,有必要提供一种意图识别方法、装置、电子设备及存储介质,使得意图识别在兼顾外部语义信息的情况下更容易理解医疗文本的特殊名词,从而达到较好的识别效果。
[0006]为实现上述目的,本专利技术提供一种意图识别方法,该方法包括如下步骤:
[0007]S1、获取对话文本,通过预设分词工具对所述对话文本进行词性标注,基于标注后的对话文本构建所述对话文本的图卷积神经网络;
[0008]S2、计算所述对话文本中每个字的TF

IDF值,再通过所述图卷积神经网络处理所述TF

IDF值,得到改进的TF

IDF值;
[0009]S3、通过BTM模型对所述对话文本和所述改进的TF

IDF值进行主题挖掘,得到所述对话文本的第一向量;通过BERT模型对所述对话文本进行语义识别,得到所述对话文本的第二向量;
[0010]S4、对所述第一向量和所述第二向量进行拼接后,通过双向门控循环单元进行处理得到最终向量;
[0011]S5、通过Softmax分类模型处理所述最终向量,得到多个所述对话文本对应的就医意图类别的条件概率值,根据所述条件概率值的数值大小判断所述对话文本对应的就医意图。
[0012]可选地,所述对话文本的获取方式包括使用爬虫爬取在线医疗平台的客服对话、聊天机器人对话;所述对话文本为单个用户的单次对话文本。
[0013]可选地,所述基于预设分词工具对所述对话文本进行词性标注,包括:
[0014]基于所述预设分词工具对所述对话文本进行分词;
[0015]对所述对话文本中每个分词进行语法分类,并在所述对话文本中标注每个分词的词类。
[0016]可选地,所述基于标注后的对话文本构建所述对话文本的图卷积神经网络,包括:
[0017]基于词性标注后的对话文本生成所述对话文本的语法树结构,通过所述语法树结构构建所述对话文本的图卷积神经网络。
[0018]优选地,所述预设分词工具为PKUSeg工具。
[0019]优选地,所述图卷积神经网络中的网络参数是1*n维的向量,n为字表的长度。
[0020]可选地,所述TF

IDF值的计算公式为
[0021][0022]其中,TF(x)指字x在所述对话文本中的词频,N代表语料库中文本的总数,N(x)代表语料库中包括字x的文本总数。
[0023]优选地,所述改进的TF

IDF值为1*k维,k为文本长度。
[0024]可选地,所述对话文本的第一向量包含所述对话文本中每个字经过BTM模型处理后对应的向量;所述对话文本的第二向量包含所述对话文本中每个字经过BERT模型处理后对应的向量。
[0025]可选地,所述对所述第一向量和所述第二向量进行拼接后,通过双向门控循环单元进行处理得到最终向量,包括:
[0026]将所述第一向量和第二向量中同一字的向量进行拼接;
[0027]将拼接后得到的向量按照所述对话文本中字的顺序输入双向门控循环单元中进行优化处理得到最终向量。
[0028]本专利技术还提供一种意图识别装置,所述意图识别装置包括:
[0029]获取模块,用于获取用户对话文本;
[0030]分词模块,用于对所述对话文本进行词性标注;
[0031]图卷积模块,用于构建图卷积神经网络和处理TF

IDF值;
[0032]BTM模块,用于对改进的TF

IDF值和所述对话文本进行处理,得到第一向量;
[0033]BERT模块,用于对所述对话文本进行处理,得到第二向量;
[0034]BiGRU模块,用于对所述第一向量和所述第二向量进行处理,得到最终向量;
[0035]分类模块,用于对所述最终向量进行处理,得到条件概率值,并根据所述条件概率值的数值大小判断用户的就医意图类别。
[0036]本专利技术还提供一种电子设备,该电子设备包括存储器和处理器,所述存储器中包括意图识别程序,该意图识别程序被所述处理器执行时实现如上所述的意图识别方法中的任意步骤。
[0037]此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中包括意图识别程序,所述意图识别程序被处理器执行时,实现如上所述的意图识别方法中的任意步骤。
[0038]本专利技术提供的意图识别方法、装置、电子设备及计算机可读存储介质,针对现有意图识别方法忽略了外部语义信息的支持,所导致含有多个专业词汇的语句的意图识别不明显的问题,引入了文本的词性关系结构,采用图卷积神经网络+BTM模型,融合BERT模型的方
式提取文本语义信息,分别基于BTM模型和基于外部语料训练的BERT模型来获取字向量,丰富了词汇的语义信息,更容易理解文本中的特殊名词,融合BiGRU模型的特征,使得序列中每一个节点都能完整地依赖所有上下文信息,将有助于更好地了解用户的就医意图,达到较好的识别效果。
附图说明
[0039]图1为本专利技术一实施例提供的意图识别方法的电子设备的内部结构示意图;
[0040]图2为本专利技术一实施例提供的意图识别方法的模块示意图;
[0041]图3为本专利技术一实施例提供的意图识别方法的流程示意图;
[0042]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0043]下面将参考若干具体实施例来描述本专利技术的原理和精神。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0044]参阅图1所示,是本专利技术提出的电子设备一可选的硬件架构示意图。本实施例中,电子设备10可包括,但不仅限于,可通过通信总线14相互通信连接存储器11、处理器12、网络接口13。需要指出的是,图1仅示出了具有组本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,该方法包括:S1、获取对话文本,通过预设分词工具对所述对话文本进行词性标注,基于标注后的对话文本构建所述对话文本的图卷积神经网络;S2、计算所述对话文本中每个字的TF

IDF值,再通过所述图卷积神经网络处理所述TF

IDF值,得到改进的TF

IDF值;S3、通过BTM模型对所述对话文本和所述改进的TF

IDF值进行主题挖掘,得到所述对话文本的第一向量;通过BERT模型对所述对话文本进行语义识别,得到所述对话文本的第二向量;S4、对所述第一向量和所述第二向量进行拼接后,通过双向门控循环单元进行处理得到最终向量;S5、通过Softmax分类模型处理所述最终向量,得到多个所述对话文本对应的就医意图类别的条件概率值,根据所述条件概率值的数值大小判断所述对话文本对应的就医意图。2.如权利要求1所述的意图识别方法,其特征在于,所述对话文本的获取方式包括使用爬虫爬取在线医疗平台的客服对话、聊天机器人对话;所述对话文本为单个用户的单次对话文本。3.如权利要求1所述的意图识别方法,其特征在于,所述通过预设分词工具对所述对话文本进行词性标注,包括:基于所述预设分词工具对所述对话文本进行分词;对所述对话文本中每个分词进行语法分类,并在所述对话文本中标注每个分词的词类。4.如权利要求1所述意图识别方法,其特征在于,所述基于标注后的对话文本构建所述对话文本的图卷积神经网络,包括:基于词性标注后的对话文本生成所述对话文本的语法树结构,通过所述语法树结构构建所述对话文本的图卷积神经网络。5.如权利要求1所述的意图方法,其特征在于,所述的TF

IDF值的计算公式为其中,...

【专利技术属性】
技术研发人员:刘羲田巍舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1