一种训练文本相似度模型的方法和系统技术方案

技术编号:24708145 阅读:48 留言:0更新日期:2020-06-30 23:59
本说明书实施例公开了一种训练文本相似度模型的方法及系统,该方法包括:获取多组训练数据,多组训练数据中的一组包括:第一文本、第二文本和第三文本,第二文本和第三文本为用户输入的询问内容,第一文本为知识库中对应于第二文本和第三文本的问题;其中,第二文本为与第一文本匹配的用户反馈好评的文本,第三文本为与第一文本不匹配的用户反馈差评的文本;基于多组训练数据调整文本相似度模型的参数进而优化损失函数,得到训练后的文本相似度模型;其中,损失函数基于第一相似度和第二相似度的相对关系确定;第一相似度为文本相似度模型基于第一文本和第二文本计算的相似度,第二相似度为文本相似度模型基于第一文本与第三文本计算的相似度。

【技术实现步骤摘要】
一种训练文本相似度模型的方法和系统
本说明书涉及计算机
,特别涉及一种训练文本相似度模型的方法和系统。
技术介绍
随着互联网和人工智能等领域的不断发展,客服机器人在客户服务中扮演了重要的角色。用户输入问题后,客服机器人可以根据问题从预先整理的知识库中确定答案。通常,客服机器人是根据问题与知识库中的知识点的文本语义相似度确定答案。然而,若知识库整理过程中出现了错误,例如,将问题A的答案与问题B组成了知识点,若将该答案反馈给与问题B语义相似的用户时,会严重影响用户的体验。因此,亟需一种可以从知识库更加准确地确定用户问题的方法。
技术实现思路
本说明书实施例的一个方面提供一种训练文本相似度模型的方法。所述训练文本相似度模型的方法包括:获取多组训练数据,所述多组训练数据中的一组包括:第一文本、第二文本和第三文本,所述第二文本和所述第三文本为用户输入的询问内容,所述第一文本为知识库中对应于所述第二文本和所述第三文本的问题;其中,所述第二文本为与所述第一文本匹配的所述用户反馈好评的文本,所述第三文本为与所述第一文本不匹配的所述用户反馈差评的文本;基于所述多组训练数据调整文本相似度模型的参数进而优化损失函数,得到训练后的文本相似度模型;其中,所述损失函数基于第一相似度和第二相似度的相对关系确定;所述第一相似度为所述文本相似度模型基于所述第一文本和所述第二文本计算的相似度,所述第二相似度为所述文本相似度模型基于所述第一文本与所述第三文本计算的相似度。本说明书实施例的另一个方面提供一种文本相似度模型的系统,所述系统包括:第一获取模块,用于获取多组训练数据,所述多组训练数据中的一组包括:第一文本、第二文本和第三文本,所述第二文本和所述第三文本为用户输入的询问内容,所述第一文本为知识库中对应于所述第二文本和所述第三文本的问题;其中,所述第二文本为与所述第一文本匹配的所述用户反馈好评的文本,所述第三文本为与所述第一文本不匹配的所述用户反馈差评的文本;参数更新模块,用于基于所述多组训练数据调整文本相似度模型的参数进而优化损失函数,得到训练后的文本相似度模型;其中,所述损失函数基于第一相似度和第二相似度的相对关系确定;所述第一相似度为所述文本相似度模型基于所述第一文本和所述第二文本计算的相似度,所述第二相似度为所述文本相似度模型基于所述第一文本与所述第三文本计算的相似度。本说明书实施例的另一个方面提供一种训练文本相似度模型的装置,包括至少一个存储介质和至少一个处理器,所述存储介质用于存储计算机指令;所述处理器用于执行训练文本相似度模型的方法。本说明书实施例的另一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行训练文本相似度模型的方法。附图说明本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:图1是根据本说明书一些实施例所示的示例性训练文本相似度模型系统的应用场景图;图2是根据本说明书一些实施例所示的示例性训练文本相似度模型的系统的模块图;图3是根据本说明书一些实施例所示的示例性训练文本相似度模型的方法的流程图;图4是根据本说明书一些实施例所示的示例性文本相似度模型的结构图;图5是根据本说明书一些实施例所示的示例性应用文本相似度模型的流程图;图6是根据本说明书一些实施例所示的示例性知识点与询问内容的示意图。具体实施方式为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。图1是根据本说明书一些实施例所示的示例性训练文本相似度模型的系统的应用场景图。训练文本相似度模型的系统100可以被广泛应用于各种线上服务平台,例如,电商平台、线上咨询平台、公共服务平台等。各个线上服务平台可以利用该系统实现智能机器人客服,即,客服机器人基于该系统为用户解答问题。训练文本相似度模型的系统100可以包括服务器110、处理器120、存储设备130、用户终端140、网络150。服务器110指管理资源并为其他设备和/或用户提供服务的计算设备及相关软件。服务器110可以是单一服务器或服务器组。该服务器组可以是集中式或分布式的(例如,服务器110可以是分布式系统)。在一些实施例中,服务器110可以在云平台上实施,或者以虚拟方式提供。所述云平台可以包括私有云、公共云及其他方式或其任意组合。服务器110中可以包括处理器120,处理器120可以执行程序指令。处理器120可以包括各种常见的通用中央处理器(centralprocessingunit,CPU),图形处理器(GraphicsProcessingUnit,GPU),微处理器,特殊应用集成电路(application-specificintegratedcircuit,ASIC),或其他类型的集成电路。服务器110中可以包括存储设备130,存储设备130指用于存储数据和/或指令的器件或设备。存储设备可包括随机存取存储器(RAM)、只读存储器(ROM)、大容量存储器、可移动存储器、存储服务器等或其任意组合。示例性的大容量储存器可以包括磁盘、光盘、固态磁盘等。在一些实施例中,所述存储设备130可在云平台上实现。仅作为示例,所述云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。数据指对信息的数字化表示,可以包括各种类型,比如二进制数据、文本数据、图像数据、视频数据等。指令指可控制设备或器件执行特定功能的程序。用户终端140指用户使用的电子设备。一些用户终端140可以包括处理器120。一些用户终端140可以包括存储设备130。在一些实施例中,用户终端140可以是移动设备140-1、本文档来自技高网...

【技术保护点】
1.一种训练文本相似度模型的方法,包括:/n获取多组训练数据,所述多组训练数据中的一组包括:第一文本、第二文本和第三文本,所述第二文本和所述第三文本为用户输入的询问内容,所述第一文本为知识库中对应于所述第二文本和所述第三文本的问题;其中,所述第二文本为与所述第一文本匹配的所述用户反馈好评的文本,所述第三文本为与所述第一文本不匹配的所述用户反馈差评的文本;/n基于所述多组训练数据调整文本相似度模型的参数进而优化损失函数,得到训练后的文本相似度模型;其中,所述损失函数基于第一相似度和第二相似度的相对关系确定;所述第一相似度为所述文本相似度模型基于所述第一文本和所述第二文本计算的相似度,所述第二相似度为所述文本相似度模型基于所述第一文本与所述第三文本计算的相似度。/n

【技术特征摘要】
1.一种训练文本相似度模型的方法,包括:
获取多组训练数据,所述多组训练数据中的一组包括:第一文本、第二文本和第三文本,所述第二文本和所述第三文本为用户输入的询问内容,所述第一文本为知识库中对应于所述第二文本和所述第三文本的问题;其中,所述第二文本为与所述第一文本匹配的所述用户反馈好评的文本,所述第三文本为与所述第一文本不匹配的所述用户反馈差评的文本;
基于所述多组训练数据调整文本相似度模型的参数进而优化损失函数,得到训练后的文本相似度模型;其中,所述损失函数基于第一相似度和第二相似度的相对关系确定;所述第一相似度为所述文本相似度模型基于所述第一文本和所述第二文本计算的相似度,所述第二相似度为所述文本相似度模型基于所述第一文本与所述第三文本计算的相似度。


2.如权利要求1所述的方法,所述方法还包括:
获取所述用户输入的询问内容;
基于所述询问内容从所述知识库中召回至少一个候选问题,以及所述至少一个候选问题对应的答案;
将所述询问内容和所述至少一个候选问题输入所述训练后的文本相似度模型,输出所述询问内容与所述至少一个候选问题之间的相似度;
基于所述相似度从所述至少一个候选问题中确定至少一个目标问题,并将所述至少一个目标问题对应的答案作为所述询问内容的答案。


3.如权利要求1所述的方法,所述相对关系包括:
所述第二相似度与所述第一相似度的差,再加上固定值。


4.如权利要求1所述的方法,所述文本相似度模型包括向量化模型和相似度计算模型;
其中,所述向量化模型用于对输入的所述第一文本、所述第二文本和所述第三文本进行向量化表示;
所述相似度计算模型基于向量化后的所述第一文本、所述第二文本和所述第三文本计算所述第一相似度和所述第二相似度。


5.如权利要求4所述的方法,所述向量化模型由WordEmbedding和BiLSTM构成,所述第一文本、所述第二文本和所述第三文本分别依次经过WordEmbedding和BiLSTM生成对应的向量。


6.如权利要求4所述的方法,所述文本相似度模型为BERT模型。


7.如权利要求4所述的方法,所述相似度计算模型为ESIM模型。


8.一种训练文本相似度模型的系统,包括:
第一获取模块,用于获取多组训练数据,所述多组训练数据中的一组包括:第一文本、第二文本和第三文本,所述第二文本和所述第三文本为用户输入的询问内容,所述第一文本为知识库中对应于所述第二文本和所述...

【专利技术属性】
技术研发人员:杨明晖崔恒斌陈晓军陈显玲
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1