问句文本的匹配方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24799594 阅读:21 留言:0更新日期:2020-07-07 21:03
本发明专利技术实施例公开了一种问句文本的匹配方法、装置、计算机设备及存储介质,包括:获取待匹配问句文本;分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本;将多个所述输入问句文本输入问句匹配模型,得到所述待匹配问句文本和每个所述预置问句文本的相似度标签;根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本。通过上述方式,能够在一定程度上提高问句匹配的准确率。

【技术实现步骤摘要】
问句文本的匹配方法、装置、计算机设备和存储介质
本专利技术涉及客服机器人
,尤其涉及一种问句文本的匹配方法、装置、计算机设备和存储介质。
技术介绍
客服机器人主要负责产品的售后服务工作,拥有短信群发、转接人工、通话录音、支持打断、录音转文本等功能。由于客服机器人能够帮助客户自助答疑,大大的帮客服人员分担了工作量。通常情况下,客服机器人将客户的问题与问题库中的各个问题进行匹配,然后找到与客户最接近的问题,最后将该问题的答案推送给客户。在客服机器人的问答匹配中,通常会选择有监督的学习模型,这样的学习模型需要对客户问句中的实体与非实体进行标注,以此计算问句与问句的相似度,并将最大相似度的匹配问句的答案推送给客户。但是,这样的方式需要专业的人员对实体和非实体进行标注,不仅耗费人力、效率低下,还可能因为标注人员的水平导致标注结果错误,从而导致最终匹配的问句准确率低。
技术实现思路
基于此,有必要针对上述问题,提出一种准确率高的问句文本的匹配方法、装置、计算机设备和存储介质。一种问句文本的匹配方法,所述方法包括:获取待匹配问句文本;分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本;将多个所述输入问句文本输入问句匹配模型,得到所述待匹配问句文本和每个所述预置问句文本的相似度标签;根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本。提供了一种问句文本的匹配装置,包括:获取模块,用于获取待匹配问句文本;组合模块,用于分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本;标签模块,用于将多个所述输入问句文本输入问句匹配模型,得到所述待匹配问句文本和每个所述预置问句文本的相似度标签;匹配模块,用于根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:获取待匹配问句文本;分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本;将多个所述输入问句文本输入问句匹配模型,得到所述待匹配问句文本和每个所述预置问句文本的相似度标签;根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本。一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:获取待匹配问句文本;分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本;将多个所述输入问句文本输入问句匹配模型,得到所述待匹配问句文本和每个所述预置问句文本的相似度标签;根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本。实施本专利技术实施例,将具有如下有益效果:本专利技术提出了一种问句文本的匹配方法、装置、计算机设备和存储介质,通过本专利技术实施例所述的方式,不再需要人工进行实体关键词的标注,省去了标注的大量时间,也不用再找专业的标注人员对问句文本中的实体和非实体进行标注,也减少了一定的成本花销,最后因为只用将问句进行组合,得到问句与问句之间的相似度标签,从而根据相似度标签得到目标问句文本,而不用再预先对实体和非实体进行区分,也提高了问句匹配的准确率,因为实体标注工作量大,重复性的标注工作很可能导致错误,导致训练的模型并不能准确预测实体,而对各个问句之间进行相似度判断的时候,是对两个句子整体表达的含义的相似程度进行判断,出错的概率更小,所以采用句子对(即两个句子)对模型进行训练,最终预测得到的准确率将更高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:图1为一个实施例中问句文本的匹配方法的实现流程示意图;图2为一个实施例中步骤101的实现流程示意图;图3为一个实施例中问句文本的匹配方法的实现流程示意图;图4为一个实施例中问句文本的匹配方法的实现流程示意图;图5为一个实施例中问句文本的匹配装置的结构框图;图6为一个实施例中计算机设备的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,在一个实施例中,提供了一种问句文本的匹配方法,本专利技术实施例所述的问句文本的匹配方法的执行主体可以是服务器,当然本专利技术实施例所述的问句文本的匹配方法的执行主体还可以是其他终端设备,例如,机器人设备。该问句文本的匹配方法,具体包括如下步骤:步骤S102,获取待匹配问句文本。其中,待匹配问句文本,为用于匹配的问句文本。在获取到原始的待匹配问句文本之后,需要去除原始的待匹配问句文本中的停用词。步骤S104,分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本。其中,问句文本库,包括多个预置问句文本;预置问句文本,为预先设置的问句文本。例如,待匹配问句文本为:悟空有多大,问句文本库中有两个预置问句文本:悟空有多高和悟空多少钱一个,将待匹配问句文本和预置问句文本进行组合,得到两个输入问句文本:[悟空有多大,悟空有多高]和[悟空有多大,悟空多少钱一个]。步骤S106,将多个所述输入问句文本输入问句匹配模型,得到所述待匹配问句文本和每个所述预置问句文本的相似度标签。所述相似度标签,用于反映待匹配问句文本和预置问句文本的相似程度,所述相似度标签,可以设置为一个数字。如上例子,假设用数字1表示待匹配问句文本和预置问句文本很相似,用数字0表示待匹配问句文本和预置问句文本不相似,于是经过问句匹配模型的预测,待匹配问句文本“悟空有多大”与预置问句文本“悟空有多高”的相似度标签将为1,待匹配问句文本“悟空有多大”与预置问句文本“悟空多少钱一个”的相似度标签将为0。步骤108,根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本。如上例子,由于数字1表示待匹配问句文本和预置问句文本很相似,数字0表示待匹配问句文本和预置问句文本不相似,于是,根据相似度标签,确定与待匹配问句文本“悟空有多大”的相似度最高的目标问句文本为:悟空有多高。作为本专利技术一种可选的实施例,在步骤108所述获取与所述待匹配问句文本相似度最高的目标问句文本之后,还包括本文档来自技高网...

【技术保护点】
1.一种问句文本的匹配方法,其特征在于,包括:/n获取待匹配问句文本;/n分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本;/n将多个所述输入问句文本输入问句匹配模型,得到所述待匹配问句文本和每个所述预置问句文本的相似度标签;/n根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本。/n

【技术特征摘要】
1.一种问句文本的匹配方法,其特征在于,包括:
获取待匹配问句文本;
分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本;
将多个所述输入问句文本输入问句匹配模型,得到所述待匹配问句文本和每个所述预置问句文本的相似度标签;
根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本。


2.如权利要求1所述的方法,其特征在于,所述问句文本库包括多个问句文本子库;在所述获取待匹配问句文本之前,还包括:
获取产品类别标签;
所述分别将所述待匹配问句文本和问句文本库中的各个预置问句文本进行组合,得到多个输入问句文本,包括:
根据所述产品类别标签,确定目标问句文本子库,获取所述目标问句文本子库中的多个预置问句文本;
分别将所述待匹配问句文本和所述目标问句文本子库中的多个预置问句文本进行组合,得到多个输入问句文本。


3.如权利要求2所述的方法,其特征在于,所述方法还包括:
获取所述目标问句文本子库中每个所述预置问句文本对应的预置答案文本;
分别将所述待匹配问句文本和所述目标问句文本子库中每个所述预置问句文本的预置答案文本进行组合,得到多个输入问答文本;
将多个所述输入问答文本输入问答匹配模型,得到所述待匹配问句文本和所述目标问句文本子库中每个所述预置问句文本的预置答案文本的匹配值;
所述根据所述相似度标签,获取与所述待匹配问句文本相似度最高的目标问句文本,包括:
根据所述相似度标签和所述匹配值,获取与所述待匹配问句文本匹配的目标预置答案文本。


4.如权利要求3所述的方法,其特征在于,所述预置问句文本和所述预置问句文本对应的预置答案文本具有相同的文本标识;
所述根据所述相似度标签和所述匹配值,获取与所述待匹配问句文本匹配的目标预置答案文本,包括:
根据所述待匹配问句文本和所述目标问句文本子库中每个所述预置问句文本的相似度标签,从多个所述预置问句文本中挑选出与所述待匹配问句文本相似度最高的预设个数的优选预置问句文本;
根据所述待匹配问句文本和所述目标问句文本子库中每个所述预置问句文本的预置答案文本的匹配值,从多个所述预置问句文本中的预置答案文本中挑选出与所述待匹配问句文本匹配的所述预设个数的优选预置答案文本;
根据每个所述优选预置问句文本的文本标识和每个所述优选预置答案文本的文本标识,获取与所述待匹配问句文本匹配的目标预置答案文本。


5.如权利要求4所述的方法,其特征在于,所述根据每个所述优选预置问句文本的文本标识和每个所述优选预置答案文本的文本标识,获取与所述待匹配问句文本匹配的目标预置答案文本,包括:
根据每个所述优选预置问句文本的文本...

【专利技术属性】
技术研发人员:熊友军熊为星廖洪涛
申请(专利权)人:深圳市优必选科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1