一种基于长文本的意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号:36566765 阅读:15 留言:0更新日期:2023-02-04 17:23
本发明专利技术公开了一种基于长文本的意图识别方法、装置、设备及存储介质。所述方法包括:获取用户发送的长文本;将所述长文本拆分为至少两个子句;通过预设知识库模型,分别对各子句进行意图识别,以得到多个意图结果;根据多个意图结果确定所述长文本的主业务场景;将所述主业务场景和各意图结果输入到预设回复模型中,生成回复文本。该方法可以基于预设知识库模型对长文本进行多层次的语义识别,识别出多个意图结果,并基于多个意图结果生成回复文本,解决了现有技术无法对长文本准确的进行多层次意图识别的问题,达到了能够对长文本进行全面准确的意图识别的效果。全面准确的意图识别的效果。全面准确的意图识别的效果。

【技术实现步骤摘要】
一种基于长文本的意图识别方法、装置、设备及存储介质


[0001]本专利技术实施例涉及人工智能技术,尤其涉及一种基于长文本的意图识别方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网的普及和信息全球化,网购已经成为了日常生活中必不可少的事情。跨境电商作为一种新型国际贸易,因低成本,低风险,敏捷性,多元化,也得到了快速的发展。为了给消费者带来更加便利消费咨询和售后服务,客服服务成为跨境电商平台运作的关键。
[0003]现有技术中的客服服务通常基于语音交互的方式实现,图1为现有技术提供的一种语音交互方法的流程示意图,如图1所示,通过语音识别将用户的声音转写为文本;通过语义解析模块将文本理解成意图与槽;通过对话管理模块根据意图选择需要执行的对话流程;若该对话流程需要和用户交互,则语言生成模块被触发,用于生成与用户交互的自然语言;通过语言合成模块将自然语言合成为语音播报给用户。
[0004]上述语音交互方法是只能适用于实时的短对话场景,即只适用于短文本的单一意图识别,无法适用于长文本的多层次的意图识别。

技术实现思路

[0005]本专利技术提供一种基于长文本的意图识别方法、装置、设备及存储介质,以实现对长文本进行全面准确的意图识别,进而生成对应的回复文本。
[0006]第一方面,本专利技术实施例提供了一种基于长文本的意图识别方法,其特征在于,包括:
[0007]获取用户发送的长文本;
[0008]将所述长文本拆分为至少两个子句;
[0009]通过预设知识库模型,分别对各子句进行意图识别,以得到多个意图结果;
[0010]根据多个意图结果确定所述长文本的主业务场景;
[0011]将所述主业务场景和各意图结果输入到预设回复模型中,生成回复文本。
[0012]进一步的,将所述主业务场景和各意图结果输入到预设回复模型中,生成回复文本包括:
[0013]将所述主业务场景和各意图结果,以及所述用户的用户画像数据,输入到预设回复模型中,生成回复文本。
[0014]进一步的,将所述主业务场景和各意图结果输入到预设回复模型中,生成回复文本包括:
[0015]将所述主业务场景和各意图结果,以及基于所述长文本确定的用户情感因素,输入到预设回复模型中,生成回复文本。
[0016]进一步的,所述预设知识库模型包括至少两个业务场景;每个业务场景对应设置
有至少一个场景地图元素;每个场景地图元素对应设置有至少一个标准问;每个标准问对应设置有至少一个扩展问;每个标准问对应设置有至少一个关键元素词汇。
[0017]进一步的,所述业务场景包括下述至少一种:退换货、货物催发、问题投诉和商品咨询;场景地图元素包括下述一种:问题描述、期望解决方式、情绪表达和评价。
[0018]进一步的,通过预设知识库模型,分别对各子句进行意图识别,以得到多个意图结果包括:
[0019]基于预设知识库模型中业务场景的各扩展问,分别与每个子句进行相似度匹配;
[0020]如果相似度匹配结果满足设定要求,则获取匹配的扩展问对应的标准问和场景地图元素;
[0021]如果相似度匹配结果不满足设定要求,则基于预设知识库模型中业务场景的各关键要素词汇,分别与子句进行相似度匹配,并获取匹配的关键要素词汇对应的标准问和场景地图元素;
[0022]将获取的标准问和场景地图元素,确定为子句的意图结果。
[0023]进一步的,所述意图结果包括子句在所述预设知识库模型中匹配的标准问和场景地图元素,以及各自的匹配得分;则根据多个意图结果确定所述长文本的主业务场景包括:
[0024]根据各子句匹配的标准问和场景地图元素,以及各自的匹配得分,确定所述长文本对应的主业务场景。
[0025]进一步的,所述长文本为所述用户向客服发起的邮件文本。
[0026]进一步的,将所述长文本拆分为至少两个子句之前,还包括:
[0027]对所述长文本进行版面识别和语种归一处理。
[0028]第二方面,本专利技术实施例还提供了一种基于长文本的意图识别装置,该装置包括:
[0029]获取模块,用于获取用户发送的长文本;
[0030]拆分模块,用于将所述长文本拆分为至少两个子句;
[0031]识别模块,用于通过预设知识库模型,分别对各子句进行意图识别,以得到多个意图结果;
[0032]确定模块,用于根据多个意图结果确定所述长文本的主业务场景;
[0033]生成模块,用于将所述主业务场景和各意图结果输入到预设回复模型中,生成回复文本。
[0034]第三方面,本专利技术实施例还提供了一种电子设备,所述电子设备包括:
[0035]至少一个处理器;以及
[0036]与所述至少一个处理器通信连接的存储器;其中,
[0037]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的基于长文本的意图识别方法。
[0038]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的基于长文本的意图识别方法。
[0039]本专利技术实施例的技术方案,通过获取用户发送的长文本;将所述长文本拆分为至少两个子句;通过预设知识库模型,分别对各子句进行意图识别,以得到多个意图结果;根
据多个意图结果确定所述长文本的主业务场景,解决现有技术无法准确的对长文本进行多层次意图识别的问题,实现对长文本进行全面准确的意图识别的效果。
附图说明
[0040]图1为现有技术提供的一种语音交互方法的流程示意图;
[0041]图2为本专利技术实施例一提供的一种基于长文本的意图识别方法的流程示意图;
[0042]图3为本专利技术实施例二提供的一种基于长文本的意图识别方法的流程示意图;
[0043]图4为本专利技术实施例三提供的一种基于长文本的意图识别方法的流程示意图;
[0044]图5为本专利技术实施例四提供的一种基于长文本的意图识别方法的示例流程图;
[0045]图6为本专利技术实施例五提供的一种基于长文本的意图识别装置的结构示意图;
[0046]图7为本专利技术实施例六提供的一种电子设备的结构示意图。
具体实施方式
[0047]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0048]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于长文本的意图识别方法,其特征在于,包括:获取用户发送的长文本;将所述长文本拆分为至少两个子句;通过预设知识库模型,分别对各子句进行意图识别,以得到多个意图结果;根据多个意图结果确定所述长文本的主业务场景;将所述主业务场景和各意图结果输入到预设回复模型中,生成回复文本。2.根据权利要求1所述的方法,其特征在于,将所述主业务场景和各意图结果输入到预设回复模型中,生成回复文本包括:将所述主业务场景和各意图结果,以及所述用户的用户画像数据,输入到预设回复模型中,生成回复文本。3.根据权利要求1或2所述的方法,其特征在于,将所述主业务场景和各意图结果输入到预设回复模型中,生成回复文本包括:将所述主业务场景和各意图结果,以及基于所述长文本确定的用户情感因素,输入到预设回复模型中,生成回复文本。4.根据权利要求1所述的方法,其特征在于,所述预设知识库模型包括至少两个业务场景;每个业务场景对应设置有至少一个场景地图元素;每个场景地图元素对应设置有至少一个标准问;每个标准问对应设置有至少一个扩展问;每个标准问对应设置有至少一个关键元素词汇。5.根据权利要求4所述的方法,其特征在于:所述业务场景包括下述至少一种:退换货、货物催发、问题投诉和商品咨询;场景地图元素包括下述一种:问题描述、期望解决方式、情绪表达和评价。6.根据权利要求4所述的方法,其特征在于,通过预设知识库模型,分别对各子句进行意图识别,以得到多个意图结果包括:基于预设知识库模型中业务场景的各扩展问,分别与每个子句进行相似度匹配;如果相似度匹配结果满足设定要求,则获取匹配的扩展问对应的标准问和场景地图元素;如果相似度匹配结果不满足设定要求,则基于预设知识库模型中业务...

【专利技术属性】
技术研发人员:光亮张琛潘仰耀王涵
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1