语义匹配方法、系统、设备及存储介质技术方案

技术编号:27208483 阅读:26 留言:0更新日期:2021-01-31 12:38
本发明专利技术公开了一种语义匹配方法、系统、设备及存储介质,方法包括:接收问题信息,并对问题信息进行预处理生成问题文本;将问题文本分别输入预设召回模型中,召回多个与问题文本相似的预设问题模板;将召回的多个预设问题模板输入预设语言模型中,生成与各预设问题模板相对应的句向量;获取问题信息对应的业务场景,确定业务场景对应已训练精排模型;将各预设问题模板相对应的句向量输入与问题信息对应的已训练精排模型中,将与问题文本相似度最高的预设问题模板设置与问题信息匹配。本发明专利技术涉及人工智能和区块链领域,所提供的语义匹配方法预算时效性高。且本发明专利技术还适用于智慧政务、智慧医疗等领域,从而可进一步推动智慧城市的建设。设。设。

【技术实现步骤摘要】
语义匹配方法、系统、设备及存储介质


[0001]本专利技术涉及人工智能领域,尤其涉及一种语义匹配方法、系统、计算机 设备及存储介质。

技术介绍

[0002]现有技术中,通过设置计算机程序实现人机交互。现有的问题系统分为 两类:开放领域的问答系统和特定领域的问答系统。开放领域问答系统依赖 于现实中的各种本体和信息,从而可以处理多种多样的问题,具体可以涉及 到生活方方面面。特定领域的问答系统仅仅智能处理特定领域中的问题,例 如与音乐相关的问题或者与天气预报相关的问题等等。相较于开放领域的问 答,特定领域的问答系统训练难度更小,特定领域问答系统一般对用户输入 的语句进行相似度计算,匹配最相似语句,然后获取该语句对应的答案。当 一个特定领域的问答系统需要对接多个业务场景时,由于数据库内预设的问 题模板数量庞大,导致该问答系统的训练难度大、运算时效性差。

技术实现思路

[0003]本专利技术的主要目的在于提出一种语义匹配方法、系统、计算机设备及存 储介质,旨在解决需要对接多个业务场景的问答系统,运算时效性差的技术 问题。
[0004]为实现上述目的,本专利技术提供一种语义匹配方法,包括步骤:
[0005]接收问题信息,并对所述问题信息进行预处理生成问题文本;
[0006]将所述问题文本分别输入预设召回模型中,召回多个与所述问题文本相 似的预设问题模板;
[0007]将召回的多个所述预设问题模板输入预设语言模型中,生成与各所述预 设问题模板相对应的句向量;
[0008]获取所述问题信息对应的业务场景,确定所述业务场景对应的已训练精 排模型;
[0009]将各所述预设问题模板相对应的句向量输入与所述问题信息对应的已训 练精排模型中,以对多个与所述问题文本相似的预设问题模板进行相似度排 序,将与所述问题文本相似度最高的预设问题模板设置为与所述问题信息匹 配。
[0010]可选地,所述将所述问题文本分别输入预设召回模型中,召回多个与所 述问题文本相似的预设问题模板的步骤包括:
[0011]将所述问题文本输入至少两个预设召回模型中,每个所述预设召回模型 输出预设个数的召回结果,其中,多个所述预设召回模型分别为采用不同预 设规则训练的召回模型;
[0012]根据与各所述预设召回模型对应的召回结果确定多个与所述问题文本相 似的预设问题模板。
[0013]可选地,所述将所述问题文本输入至少两个预设召回模型中,每个所述 预设召回模型输出预设个数的召回结果的步骤包括:
[0014]将所述问题文本输入第一预设召回模型,生成与所述问题文本的句型和 词组相似的多个预设问题模板;
[0015]将所述问题文本输入第二预设召回模型,生成与所述问题文本的语义相 似的多个预设问题模板,其中,所述第一预设召回模型和第二预设召回模型 为分别基于同一全量数据库训练的召回模型,所述全量数据库中包括多个预 设问题。
[0016]可选地,所述将召回的多个所述预设问题模板输入预设语言模型中,生 成与各所述预设问题模板相对应的句向量的步骤包括:
[0017]分别将各召回的预设问题模板输入预设语言模型中,所述预设语言模型 为部署于GUP上的已训练bert模型;
[0018]已训练bert模型输出与各所述预设问题模板相对应的句向量。
[0019]可选地,所述将召回的多个预设问题模板输入预设语言模型中,生成与 各所述预设问题模板相对应的句向量的步骤之前,还包括:
[0020]获取第一样本数据,所述第一样本数据包括多个业务场景对应的多个问 题样本和与各所述问题样本对应训练文本;
[0021]构建所述问题样本和与各所述问题样本对应的训练文本形成正样本句子 对和负样本句子对,生成训练语料;
[0022]将所述训练语料输入待训练的bert模型进行模型训练,生成已训练bert 模型。
[0023]可选地,所述获取所述问题信息对应的业务场景,确定所述业务场景对 应已训练精排模型的步骤之前包括:
[0024]获取第二样本数据,所述第二样本数据为与业务场景对应的多个问题样 本;
[0025]将所述第二样本数据的各问题样本输入已训练bert模型中输出与各问题 样本对应的句向量,根据句向量生成训练样本;
[0026]将所述训练样本输入待训练的精排模型进行模型训练,生成与所述第二 样本数据对应的业务场景所对应的已训练精排模型。
[0027]可选地,所述将与所述问题文本相似度最高的预设问题模板设置与所述 问题信息匹配的步骤之后,还包括:
[0028]获取与所述问题信息匹配的预设问题模板对应的预设回答;
[0029]将所述预设回答发送至所述问题信息的发送端。
[0030]为实现上述目的,本专利技术还提供一种语义匹配系统,所述系统包括:
[0031]接收模块,接收问题信息,并对所述问题信息进行预处理生成问题文本;
[0032]召回模块,将所述问题文本分别输入预设召回模型中,召回多个与所述 问题文本相似的预设问题模板;
[0033]句向量生成模块,将召回的多个所述预设问题模板输入预设语言模型中, 生成与各所述预设问题模板相对应的句向量;
[0034]精排模型确定模块,获取所述问题信息对应的业务场景,确定所述业务 场景对应已训练精排模型;
[0035]排序模块,将各所述预设问题模板相对应的句向量输入与所述问题信息 对应的已训练精排模型中,以对多个与所述问题文本相似的预设问题模板进 行相似度排序,将与所述问题文本相似度最高的预设问题模板设置为与所述 问题信息匹配。
[0036]为实现上述目的,本专利技术还提供一种计算机设备,所述计算机设备包括 存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程 序,所述计算机程序被所述处理器执行时实现如上所述的语义匹配方法的步 骤。
[0037]为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机 可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如 上所述的语义匹配方法的步骤。
[0038]本专利技术提出的一种语义匹配方法、系统、计算机设备及存储介质,通过 通过采用预设召回模型,从而可在预设问题模板的数据库中预先筛选多个与 问题文本相似的预设问题模板,再对多个相似的预设问题模板做进一步处理, 从而减小了后续处理的运算量,提高运算时效性;通过将不同业务场景对应 的预设问题模板均输入至同一预设语言模型生成句向量,再将不同业务场景 对应的预设问题模板输入至与业务场景对应的精排模型,相对与可对接所有 业务场景的精排模型,对应业务场景的精排模型训练难度小,运算速度快。
附图说明
[0039]图1是本专利技术实施例方案涉及的硬件运行环境的结构示意图;
[0040]图2为本专利技术语义匹配方法第一实施例的流程示意图;
[0041]图3为本专利技术语义匹配方法第一实施例步骤S200的细化流程示意图;...

【技术保护点】

【技术特征摘要】
1.一种语义匹配方法,其特征在于,包括步骤:接收问题信息,并对所述问题信息进行预处理生成问题文本;将所述问题文本分别输入预设召回模型中,召回多个与所述问题文本相似的预设问题模板;将召回的多个所述预设问题模板输入预设语言模型中,生成与各所述预设问题模板相对应的句向量;获取所述问题信息对应的业务场景,确定所述业务场景对应的已训练精排模型;将各所述预设问题模板相对应的句向量输入与所述问题信息对应的已训练精排模型中,以对多个与所述问题文本相似的预设问题模板进行相似度排序,将与所述问题文本相似度最高的预设问题模板设置为与所述问题信息匹配。2.根据权利要求1所述的语义匹配方法,其特征在于,所述将所述问题文本分别输入预设召回模型中,召回多个与所述问题文本相似的预设问题模板的步骤包括:将所述问题文本输入至少两个预设召回模型中,每个所述预设召回模型输出预设个数的召回结果,其中,多个所述预设召回模型分别为采用不同预设规则训练的召回模型;根据与各所述预设召回模型对应的召回结果确定多个与所述问题文本相似的预设问题模板。3.根据权利要求2所述的语义匹配方法,其特征在于,所述将所述问题文本输入至少两个预设召回模型中,每个所述预设召回模型输出预设个数的召回结果的步骤包括:将所述问题文本输入第一预设召回模型,生成与所述问题文本的句型和词组相似的多个预设问题模板;将所述问题文本输入第二预设召回模型,生成与所述问题文本的语义相似的多个预设问题模板,其中,所述第一预设召回模型和第二预设召回模型为分别基于同一全量数据库训练的召回模型,所述全量数据库中包括多个预设问题。4.根据权利要求3所述的语义匹配方法,其特征在于,所述将召回的多个所述预设问题模板输入预设语言模型中,生成与各所述预设问题模板相对应的句向量的步骤包括:分别将各召回的预设问题模板输入预设语言模型中,所述预设语言模型为部署于GUP上的已训练bert模型;已训练bert模型输出与各所述预设问题模板相对应的句向量。5.根据权利要求4所述的语义匹配方法,其特征在于,所述将召回的多个预设问题模板输入预设语言模型中,生成与各所述预设问题模板相对应的句向量的步骤之前,还包括:获取第一样本数据,所述第一样本数据包括多个业务场景对应的...

【专利技术属性】
技术研发人员:许强
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1