一种会话文本匹配方法及装置、存储介质、设备制造方法及图纸

技术编号：40437720 阅读：5 留言：0更新日期：2024-02-22 23:01

本发明专利技术提供了一种会话文本匹配方法及装置、存储介质、设备，其中方法构建基于sentence‑Bert构架的向量编码模型，并搭建包含两个向量编码模型的siamese孪生神经网络结构的预训练模型；预训练模型用于执行文本分类任务和/或文本相似度计算任务；预先收集训练语料，利用训练语料对预训练模型进行训练，以得到微调完成的目标向量编码模型；获取待匹配目标语句，将待匹配会话文本输入目标向量编码模型，得到待匹配会话文本对应的向量编码；利用预先创建的具有索引功能的目标向量数据库对向量编码进行相似度匹配，将相似度最高的标准问文本作为待匹配会话文本的目标匹配结果。通过本发明专利技术，实现了快速增加标准问，又满足了严格区分问询意图的要求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息处理，具体涉及一种会话文本匹配方法及装置、存储介质、设备。

技术介绍

1、网约车服务端每天需要应对大量网约车司机的问询，包括车单指派问题、司机认证申请问题、客诉问题等等。这些工作如果全部交付于人工客服常常发生大量的网络拥塞，不能提供很好的用户体验。现有技术中一般使用基于ai的文本分类模型来应对这种情况，但往往出现如下问题：第一，每当增加新的标准问，需要收集大量数据重新训练模型，费时费力，而且还会造成模型的不稳定。第二，新增加的标准问往往同旧的标准问存在意图混淆的情况，造成已有分类准确率降低。

技术实现思路

1、为此，本专利技术提供一种会话文本匹配方法及装置、存储介质、设备，旨在解决现有技术中无法快速增加标准问以及不能严格区分问询意图的技术问题。

2、为实现以上目的，本专利技术采用如下技术方案：

3、依据本专利技术第一方面，本专利技术提供一种会话文本匹配方法，所述方法包括：

4、构建基于sentence-bert构架的向量编码模型，并搭建包含两个所述向量编码模型的siamese孪生神经网络结构的预训练模型；所述预训练模型用于执行文本分类任务和/或文本相似度计算任务；

5、预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，以得到微调完成的目标向量编码模型；

6、获取待匹配目标语句，将所述待匹配会话文本输入所述目标向量编码模型，得到所述待匹配会话文本对应的向量编码；

7、利用预先创建的具有

8、进一步地，所述构建基于sentence-bert构架的向量编码模型，包括：

9、构建包含语句输入层、bert神经网络、池化层以及向量编码输出层的向量编码模型。

10、进一步地，所述搭建包含两个所述向量编码模型的siamese孪生神经网络结构的预训练模型，包括：

11、搭建包含两个向量编码模型以及输出向量分类模块的siamese孪生神经网络结构的预训练模型，得到执行文本分类任务的预训练模型；以及，

12、搭建包含两个向量编码模型以及输出向量相似度计算模块的siamese孪生神经网络结构的预训练模型，得到执行文本相似度计算任务的预训练模型；

13、其中，所述输出向量分类模块为基于类别权重算法判断两个输入样本语句是否为同类别语句的功能组件；所述输出向量相似度计算模块为基于余弦相似度计算两个输入样本语句之间相似度的功能组件。

14、进一步地，所述预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，包括：

15、预先收集不同类别的多个训练语句，并生成多个语句样本对；所述语句样本对包括同类别语句样本对和非同类别语句样本对；

16、配置sentence-transformer中的多语言xlm-roberta模型的预训练权重作为共享权重，并设置损失函数为cosinesimilarityloss，利用所述语句样本对对执行文本分类任务的预训练模型进行迭代训练，直到所述预训练模型的文本分类准确率达到第一预设准确率。

17、进一步地，所述预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，还包括：

18、预先收集相似训练语句集，并定义所述相似训练语句集中的多个语句样本对之间的相似度值；

19、设置损失函数为meansquared-errorloss，利用所述相似训练语句集以及所述语句样本对之间相似度值对执行文本相似度计算任务的预训练模型进行迭代训练，直到所述预训练模型的文本相似度计算准确率达到第二预设准确率。

20、进一步地，所述利用预先创建的具有索引功能的目标向量数据库对所述向量编码进行相似度匹配之前，所述方法还包括：

21、创建具有索引功能的目标向量数据库，具体包括：

22、收集多个标准问文本，将所述标准问文本输入目标向量编码模型，得到所述标准问文本对应的标准向量编码；

23、对所述标准向量编码进行归一化，得到同一向量空间的多个标准向量数据；

24、将所述标准向量编码分批插入milvus向量数据库，并针对所述milvus向量数据库配置nlist参数和nprobe参数，得到目标向量数据库。

25、进一步地，所述利用预先创建的具有索引功能的目标向量数据库对所述向量编码进行相似度匹配，将相似度最高的标准问文本作为所述待匹配会话文本的目标匹配结果，包括：

26、根据所述向量编码对所述目标向量数据库进行检索，得到所述向量编码对应的多个相似标准向量数据；

27、分别利用余弦相似度算法计算所述向量编码与各所述相似标准向量数据的向量相似度值，将向量相似度值最高的向量编码对应的标准问文本作为所述待匹配会话文本的目标匹配结果。

28、依据本专利技术第二方面，本专利技术提供一种会话文本匹配装置，所述装置包括：

29、模型构建模块，用于构建基于sentence-bert构架的向量编码模型，并搭建包含两个所述向量编码模型的siamese孪生神经网络结构的预训练模型；所述预训练模型用于执行文本分类任务和/或文本相似度计算任务；

30、模型训练模块，用于预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，以得到微调完成的目标向量编码模型；

31、数据编码模块，用于获取待匹配目标语句，将所述待匹配会话文本输入所述目标向量编码模型，得到所述待匹配会话文本对应的向量编码；

32、结果匹配模块，用于利用预先创建的具有索引功能的目标向量数据库对所述向量编码进行相似度匹配，将相似度最高的标准问文本作为所述待匹配会话文本的目标匹配结果。

33、依据本专利技术第三方面，本专利技术提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如本专利技术第一方面中任一项所述的会话文本匹配方法。

34、依据本专利技术第四方面，本专利技术提供一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如本专利技术第一方面中任一项所述的会话文本匹配方法。

35、本专利技术采用以上技术方案，至少具备以下有益效果：

36、通过本专利技术方案，构建基于sentence-bert构架的向量编码模型，并搭建包含两个所述向量编码模型的siamese孪生神经网络结构的预训练模型；所述预训练模型用于执行文本分类任务和/或文本相似度计算任务；预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，以得到微调完成的目标向量编码模型；获取待匹配目标语句，将所述待匹配会话文本输入所述目标向量编码模型，得到所述待匹配会话文本对应的向量编码；利用预先创建的具有索引功能的目标向量本文档来自技高网...

【技术保护点】

1.一种会话文本匹配方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述构建基于sentence-Bert构架的向量编码模型，包括：

3.根据权利要求1所述的方法，其特征在于，所述搭建包含两个所述向量编码模型的siamese孪生神经网络结构的预训练模型，包括：

4.根据权利要求1所述的方法，其特征在于，所述预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，包括：

5.根据权利要求1所述的方法，其特征在于，所述预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，还包括：

6.根据权利要求1所述的方法，其特征在于，所述利用预先创建的具有索引功能的目标向量数据库对所述向量编码进行相似度匹配之前，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述利用预先创建的具有索引功能的目标向量数据库对所述向量编码进行相似度匹配，将相似度最高的标准问文本作为所述待匹配会话文本的目标匹配结果，包括：

8.一种会话文本匹配装置，其特征在于，所述装置包括：

<...

【技术特征摘要】

1.一种会话文本匹配方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述构建基于sentence-bert构架的向量编码模型，包括：

3.根据权利要求1所述的方法，其特征在于，所述搭建包含两个所述向量编码模型的siamese孪生神经网络结构的预训练模型，包括：

4.根据权利要求1所述的方法，其特征在于，所述预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，包括：

5.根据权利要求1所述的方法，其特征在于，所述预先收集训练语料，利用所述训练语料对所述预训练模型进行训练，还包括：

6.根据权利要求1所述的方法，其特征在于，所述利用预先创建的具有索引功能的目标向量数据库对所述向量编码进行相...

【专利技术属性】
技术研发人员：付乐兰，田鹏飞，吴天斌，孙洪静，朱钦，
申请(专利权)人：北京假日阳光环球旅行社有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人