文本的匹配方法、匹配装置及终端制造方法及图纸

技术编号：24799586 阅读：14 留言：0更新日期：2020-07-07 21:03

本发明专利技术涉及自然语言处理技术领域，提供了一种文本的匹配方法、匹配装置、终端及计算机可读存储介质。其中，所述匹配方法包括：获取第一文本和第二文本；获取所述第一文本对应的第一向量以及所述第二文本对应的第二向量；计算所述第一向量和所述第二向量的向量积；根据第一映射函数将所述向量积映射为第一特征向量；根据第二映射函数将所述第一向量映射为第二特征向量；基于所述第一特征向量和所述第二特征向量，确定第二文本与所述第一文本的匹配度。本发明专利技术应用于自动客服系统，能够为用户输入的问题文本匹配到较为准确的匹配文本，从而可以实现对用户问题的准确作答，有利于提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
文本的匹配方法、匹配装置及终端
本专利技术属于自然语言处理
，尤其涉及一种文本的匹配方法、匹配装置、终端及计算机可读存储介质。
技术介绍
传统的人工客服是典型的劳动密集型行业，工作时间长、工作重复性高，提高了企业的人力成本和管理成本。因此，亟需一种能够对用户的提问进行自动作答的智能客服系统来替代人工客服。现有技术中，通常采用获取用户提问的问题文本中的关键词，并通过关键词匹配来搜索与用户提问的问题相关的回答，并将回答返回给用户。然而，关键词仅属于用户输入的问题文本的一个局部特征，根据该局部特征可能会搜索到多个匹配文本，匹配的细粒度不够好、准确率低，用户体验很差。
技术实现思路
有鉴于此，本专利技术提供了一种文本的匹配方法、匹配装置、终端及计算机可读存储介质，以解决现有的自动客服系统文本匹配的细粒度不够好、准确率低的问题。本专利技术实施例的第一方面提供了一种文本的匹配方法，包括：获取第一文本和第二文本；获取所述第一文本对应的第一向量以及所述第二文本对应的第二向量；计算所述第一向量和所述第二向量的向量积；根据第一映射函数将所述向量积映射为第一特征向量；根据第二映射函数将所述第一向量映射为第二特征向量；基于所述第一特征向量和所述第二特征向量，确定第二文本与所述第一文本的匹配度。本专利技术实施例的第二方面提供了一种文本的匹配装置，包括：文本获取单元，用于获取第一文本和第二文本；向量获取单元，用于获取所述第一...

【技术保护点】
1.一种文本的匹配方法，其特征在于，所述匹配方法包括：/n获取第一文本和第二文本；/n获取所述第一文本对应的第一向量以及所述第二文本对应的第二向量；/n计算所述第一向量和所述第二向量的向量积；/n根据第一映射函数将所述向量积映射为第一特征向量；/n根据第二映射函数将所述第一向量映射为第二特征向量；/n基于所述第一特征向量和所述第二特征向量，确定第二文本与所述第一文本的匹配度。/n

【技术特征摘要】
1.一种文本的匹配方法，其特征在于，所述匹配方法包括：
获取第一文本和第二文本；
获取所述第一文本对应的第一向量以及所述第二文本对应的第二向量；
计算所述第一向量和所述第二向量的向量积；
根据第一映射函数将所述向量积映射为第一特征向量；
根据第二映射函数将所述第一向量映射为第二特征向量；
基于所述第一特征向量和所述第二特征向量，确定第二文本与所述第一文本的匹配度。

2.根据权利要求1所述的文本的匹配方法，其特征在于，所述获取第一文本和第二文本包括：
获取第一文本，以及所述第一文本的类别信息；
基于所述类别信息确定与所述第一文本对应的文本匹配库；
从所述文本匹配库中选取与所述第一文本进行匹配的第二文本。

3.根据权利要求2所述的文本的匹配方法，其特征在于，所述匹配方法还包括：
分别确定所述文本匹配库中各文本与所述第一文本的匹配度；
将所述匹配库中与所述第一文本的匹配度最高的文本作为所述第一文本的匹配文本。

4.根据权利要求1至3任一项所述的文本的匹配方法，其特征在于，所述第一映射函数包括多层映射关系，所述第一映射函数的数学表示为：
z(l)＝relu(W(l)z(l-1)+b(l))
其中，设第一映射函数包括的映射关系的层数为L，则l＝1,2,...,L，W(l)表示第l层映射对应的权重矩阵，b(l)表示第l层映射对应的偏置向量，z(l-1)表示第l层映射对应的输入，z(l)表示第l层映射对应的映射输出，relu表示映射输出的激励方式；
所述第二映射函数的数学表示为：
h＝relu(Wpq1+bp)
其中，h表示第二映射函数的映射输出，q1表示第二映射函数的输入，Wp表示第二映射函数的权重矩阵，bp表示第二映射函数的偏置向量，relu表示映射输出的激励方式。

5.根据权利要求4所述的文本的匹配方法，其特征在于，所述第一映射函数的各层映射关系对应的权重矩阵和偏置向量、以及所述第二映射函数的权重矩阵和偏置向量为通过训练得到，训练的步骤包括：
获取训练样本，其中，所述训练样本包括正向样本和负向样本，所述正向样本包含的文本对之间的匹配度大于所述负向样本包含的文本对之间的匹配度；
利用所述训练样本对所述第一映射函数和所述第二映射函数进行迭代计算；
根据预设的损...

【专利技术属性】
技术研发人员：熊友军，熊为星，廖洪涛，
申请(专利权)人：深圳市优必选科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人