语义匹配模型训练方法、匹配方法、装置、设备及存储介质制造方法及图纸

技术编号：27250397 阅读：13 留言：0更新日期：2021-02-04 12:26

本申请涉及智能决策领域，具体公开了一种语义匹配模型训练方法、语义匹配方法、装置、设备及存储介质，所述方法包括：获取多个文本数据，并将多个文本数据保存至第一数据库；根据第一数据库中保存的文本数据训练第一匹配模型；基于第一匹配模型确定每个文本数据的句向量，并将每个文本数据的句向量保存至第二数据库；从第一数据库中保存的文本数据中选择样本数据，并基于样本数据从第一数据库中获取与样本数据对应的字面匹配文本；根据样本数据的句向量从第二数据库中获取与样本数据对应的语义匹配文本；根据样本数据、字面匹配文本和语义匹配文本，对第二匹配模型进行模型训练，并将训练完成的第二匹配模型作为语义匹配模型。将训练完成的第二匹配模型作为语义匹配模型。将训练完成的第二匹配模型作为语义匹配模型。

全部详细技术资料下载

【技术实现步骤摘要】
语义匹配模型训练方法、匹配方法、装置、设备及存储介质

[0001]本申请涉及人工智能领域，尤其涉及一种语义匹配模型训练方法、语义匹配方法、装置、设备及存储介质。

技术介绍

[0002]随着计算机技术与人工智能的发展，对于自然语言处理的研究也有了很大的进步。语音匹配作为自然语言处理中的一个重要方向已经广泛应用于搜索引擎、智能问答、知识检索以及信息流推荐等系统中。传统进行语义匹配的方法是直接从知识库中寻找匹配文本，但这种方式耗时较长，实时性不足。而在构建用于语义匹配的模型时，由于语义匹配过程较为复杂，导致语义匹配模型构建的成本较高，且训练周期长。
[0003]因此，如何自动提高训练模型的效率成为亟待解决的问题。

技术实现思路

[0004]本申请提供了一种语义匹配模型训练方法、语义匹配方法、装置、设备及存储介质，以提高训练模型的效率。
[0005]第一方面，本申请提供了一种语义匹配模型训练方法，所述方法包括：
[0006]获取多个文本数据，并将多个所述文本数据保存至第一数据库；根据所述第一数据库中保存的文本数据训练第一匹配模型；基于所述第一匹配模型确定每个所述文本数据的句向量，并将每个所述文本数据的句向量保存至第二数据库；从所述第一数据库中保存的文本数据中选择样本数据，并基于所述样本数据从所述第一数据库中获取与所述样本数据对应的字面匹配文本；根据所述样本数据的句向量从所述第二数据库中获取与所述样本数据对应的语义匹配文本；根据所述样本数据、所述字面匹配文本和所述语义匹配文本，对第二匹配...

【技术保护点】

【技术特征摘要】
1.一种语义匹配模型训练方法，其特征在于，包括：获取多个文本数据，并将多个所述文本数据保存至第一数据库；根据所述第一数据库中保存的文本数据训练第一匹配模型；基于所述第一匹配模型确定每个所述文本数据的句向量，并将每个所述文本数据的句向量保存至第二数据库；从所述第一数据库中保存的文本数据中选择样本数据，并基于所述样本数据从所述第一数据库中获取与所述样本数据对应的字面匹配文本；根据所述样本数据的句向量从所述第二数据库中获取与所述样本数据对应的语义匹配文本；根据所述样本数据、所述字面匹配文本和所述语义匹配文本，对第二匹配模型进行模型训练，并将训练完成的所述第二匹配模型作为语义匹配模型。2.根据权利要求1所述的语义匹配模型训练方法，其特征在于，所述基于所述第一匹配模型确定每个所述文本数据的句向量，包括：对每个所述文本数据进行分词，得到每个所述文本数据对应的多个分词；利用所述第一匹配模型，得到每个所述文本数据对应的所述分词的词向量；根据所述文本数据对应的所述分词的词向量计算词向量平均值，将所述词向量平均值作为所述文本数据的句向量。3.根据权利要求1所述的语义匹配模型训练方法，其特征在于，所述基于所述样本数据从所述第一数据库中获取与所述样本数据对应的字面匹配文本，包括：计算所述第一数据库中保存的所述文本数据与所述样本数据的文本相似度得分；将与所述样本数据的文本相似度得分大于预设阈值的文本数据作为字面匹配文本。4.根据权利要求1所述的语义匹配模型训练方法，其特征在于，所述根据所述样本数据的句向量从所述第二数据库中获取与所述样本数据对应的语义匹配文本，包括：计算所述第二数据库中保存的所述文本数据的句向量与所述样本数据的向量相似度；根据所述向量相似度从所述第二数据库中保存的所述文本数据中选择语义匹配文本。5.根据权利要求1所述的语义匹配模型训练方法，其特征在于，所述根据所述样本数据、所述字面匹配文本和所述语义匹配文本，对第二匹配模型进行模型训练，包括：对第二匹配模型的模型参数进行随机采样，得到初始的第二匹配模型；利用所述初始的第二匹配模型计算所述字面匹配文本和所述语义匹配文本与所述样本数据的相似度；根据所述相似度对所述初始的第二匹配模型进行迭代训练，进行模型训练。6.一种语义匹配方法，其特征在于，所述方法包括：获取待...

【专利技术属性】
技术研发人员：王博锐，
申请(专利权)人：中国平安财产保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人