基于GraphQL的中文问答模型训练方法及其相关设备技术

技术编号:38753471 阅读:6 留言:0更新日期:2023-09-10 09:38
本申请实施例属于金融科技技术领域,应用于保险行业智能客服问答模型训练领域中,涉及一种基于GraphQL的中文问答模型训练方法及其相关设备,包括以GraphQL规范生成目标中文问题数据对应的GraphQL查询语句;通过语言分析模型获取目标中文问题数据对应的解答数据;构建第一文本对集和第二文本对集,输入到采用端到端模式预训练完成的T5问答模型内,进行T5问答模型训练,获得训练完成的T5问答模型;获得新的中文问题数据输入到训练完成的T5问答模型,获得模型输出结果作为解答数据。通过在端到端的T5问答模型内引入双塔模型结构,GraphQL规范构建查询语句,实现了训练出具有有效中间表示的端到端中文图谱问答模型,且对解答数据的输出进行良好的质量控制。解答数据的输出进行良好的质量控制。解答数据的输出进行良好的质量控制。

【技术实现步骤摘要】
基于GraphQL的中文问答模型训练方法及其相关设备


[0001]本申请涉及金融科技
,应用于保险行业智能客服问答模型训练领域中,尤其涉及一种基于GraphQL的中文问答模型训练方法及其相关设备。

技术介绍

[0002]金融保险行业在线客服场景中,机器人自动问答可以减少客服的压力,提升服务的效率。而在垂直领域中,知识类问题尤其重要,此时图谱问答可以提供精确的问答服务,同时引入规范化的知识内容,相比FAQ问答检索系统可以有效降低知识的冗余性。
[0003]当前图谱问答方法主要分为以下两类:基于语义解析的方法和基于关键词检索的方法。中文领域缺少相应的语义中间表示,通常是将自然语言句子转化为查询语句,譬如SPARQL/Cypher。由于中文自然语言句子与查询语句的差异较大,导致直接生成的效果较差,因此中文图谱问答常采用流水线式,还缺少具有有效中间表示的端到端的图谱问答模型,导致中文直接生成查询语句的难度较大,且解答输出效果容易不可控。因此,现有技术还缺少具有有效中间表示的端到端中文图谱问答模型,易产生解答输出效果可控性较差的问题。

技术实现思路

[0004]本申请实施例的目的在于提出一种基于GraphQL的中文问答模型训练方法及其相关设备,以解决现有技术还缺少具有有效中间表示的端到端中文图谱问答模型,易产生解答输出效果可控性较差的问题。
[0005]为了解决上述技术问题,本申请实施例提供一种基于GraphQL的中文问答模型训练方法,采用了如下所述的技术方案:
[0006]一种基于GraphQL的中文问答模型训练方法,包括下述步骤:
[0007]从批量中文问题数据中获取单个目标中文问题数据;
[0008]以GraphQL规范生成所述目标中文问题数据对应的GraphQL查询语句;
[0009]通过语义分析模型从预设的问答知识库中获取所述目标中文问题数据对应的解答数据;
[0010]根据所述目标中文问题数据、所述解答数据和所述GraphQL查询语句,生成第一文本对和第二文本对;
[0011]重复执行以上步骤,构建所述批量中文问题数据对应的第一文本对集和第二文本对集;
[0012]将所述第一文本对集和所述第二文本对集输入到采用端到端模式预训练完成的T5问答模型内,进行T5问答模型训练,获得训练完成的T5问答模型;
[0013]获得新的中文问题数据输入到所述训练完成的T5问答模型,获得模型输出结果作为解答数据。
[0014]进一步的,在执行所述以GraphQL规范生成所述目标中文问题数据对应的GraphQL
查询语句的步骤之前,所述方法还包括:
[0015]对所述问答知识库中所有解答数据作线性化处理,获得若干个数据队列或/和若干个数据链表;
[0016]根据预设的问答场景分类实体,对所述若干个数据队列或/和若干个数据链表进行类别分类,所述问答场景分类实体包括预设的若干个与问题场景名称相关的检索关键字段;
[0017]所述以GraphQL规范生成所述目标中文问题数据对应的GraphQL查询语句的步骤,具体包括:
[0018]根据预设的分词处理模型和所述问答场景分类实体,对所述目标中文问题数据进行分词处理;
[0019]根据分词处理结果,获取所述目标中文问题数据对应的多个分割映射结果,其中,所述多个分割映射结果表示不同分词处理结果分别对应的分割映射结果;
[0020]根据所述GraphQL规范将所述多个分割映射结果分别组合成相应的待选GraphQL查询语句;
[0021]根据BM25算法从所述待选GraphQL查询语句中筛选出最优GraphQL查询语句作为所述目标中文问题数据对应的GraphQL查询语句。
[0022]进一步的,所述根据BM25算法从所述待选GraphQL查询语句中筛选出最优GraphQL查询语句作为所述目标中文问题数据对应的GraphQL查询语句的步骤,具体包括:
[0023]根据BM25算法公式:计算每一个待选GraphQL查询语句的得分值,其中,Q为当前待选GraphQL查询语句,d为所述目标中文问题数据,n为构成当前待选GraphQL查询语句中所述目标中文问题数据的分词数量,i为当前分词的编号,ω
i
为编号为i的分词的权重,R为分词结果与所述目标中文问题数据间的相关性,q
i
为编号为i的分词;
[0024]选择得分值为最优解时的待选GraphQL查询语句作为所述最优GraphQL查询语句;
[0025]将所述最优GraphQL查询语句作为所述目标中文问题数据对应的GraphQL查询语句。
[0026]进一步的,所述根据所述目标中文问题数据、所述解答数据和所述GraphQL查询语句,生成第一文本对和第二文本对的步骤,具体包括:
[0027]以所述目标中文问题数据为第一KEY值,以所述解答数据为第一VALUE值,生成所述第一文本对;
[0028]以所述目标中文问题数据为第二KEY值,以所述GraphQL查询语句为第二VALUE值,生成所述第二文本对。
[0029]进一步的,在执行所述将所述第一文本对集和所述第二文本对集输入到采用端到端模式预训练完成的T5问答模型内的步骤之前,所述方法还包括:
[0030]预先在所述采用端到端模式预训练完成的T5问答模型内引入双塔模型结构,其中,所述双塔模型结构中包含两个独立的神经网络处理结构,分别为第一神经网络处理结构和第二神经网络处理结构;
[0031]所述进行T5问答模型训练的步骤,具体包括:
[0032]获取输入的所述第一文本对集和所述第二文本对集;
[0033]根据所述第一神经网络处理结构对所述第一文本对集进行训练处理,输出由所有目标中文问题数据及所有对应的解答数据构建的第一中文知识图谱;
[0034]根据所述第二神经网络处理结构对所述第二文本对集进行训练处理,输出基于所有目标中文问题数据及所有对应的GraphQL查询语句构建的第二中文知识图谱;
[0035]对所述第一中文知识图谱和所述第二中文知识图谱进行图谱整合,获取综合中文知识图谱;
[0036]设置所述综合中文知识图谱为所述T5问答模型的问答知识图谱;
[0037]在执行所述进行T5问答模型训练的步骤之后,所述方法还包括:
[0038]根据所述问答知识图谱,获得目标中文问题数据对应的所有解答数据,并基于排序规则筛选出排名前N位的解答数据,作为所述目标中文问题数据对应的终选解答数据,其中,N为正整数。
[0039]进一步的,所述根据所述第二神经网络处理结构对所述第二文本对集进行训练处理,输出基于所有目标中文问题数据及所有对应的GraphQL查询语句构建的第二中文知识图谱的步骤,具体包括:
[0040]获取所有目标中文问题数据所分别对应的GraphQL查询语句;
[0041]执行所述Grap本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于GraphQL的中文问答模型训练方法,其特征在于,包括下述步骤:从批量中文问题数据中获取单个目标中文问题数据;以GraphQL规范生成所述目标中文问题数据对应的GraphQL查询语句;通过语义分析模型从预设的问答知识库中获取所述目标中文问题数据对应的解答数据;根据所述目标中文问题数据、所述解答数据和所述GraphQL查询语句,生成第一文本对和第二文本对;重复执行以上步骤,构建所述批量中文问题数据对应的第一文本对集和第二文本对集;将所述第一文本对集和所述第二文本对集输入到采用端到端模式预训练完成的T5问答模型内,进行T5问答模型训练,获得训练完成的T5问答模型;获得新的中文问题数据输入到所述训练完成的T5问答模型,获得模型输出结果作为解答数据。2.根据权利要求1所述的基于GraphQL的中文问答模型训练方法,其特征在于,在执行所述以GraphQL规范生成所述目标中文问题数据对应的GraphQL查询语句的步骤之前,所述方法还包括:对所述问答知识库中所有解答数据作线性化处理,获得若干个数据队列或/和若干个数据链表;根据预设的问答场景分类实体,对所述若干个数据队列或/和若干个数据链表进行类别分类,所述问答场景分类实体包括预设的若干个与问题场景名称相关的检索关键字段;所述以GraphQL规范生成所述目标中文问题数据对应的GraphQL查询语句的步骤,具体包括:根据预设的分词处理模型和所述问答场景分类实体,对所述目标中文问题数据进行分词处理;根据分词处理结果,获取所述目标中文问题数据对应的多个分割映射结果,其中,所述多个分割映射结果表示不同分词处理结果分别对应的分割映射结果;根据所述GraphQL规范将所述多个分割映射结果分别组合成相应的待选GraphQL查询语句;根据BM25算法从所述待选GraphQL查询语句中筛选出最优GraphQL查询语句作为所述目标中文问题数据对应的GraphQL查询语句。3.根据权利要求2所述的基于GraphQL的中文问答模型训练方法,其特征在于,所述根据BM25算法从所述待选GraphQL查询语句中筛选出最优GraphQL查询语句作为所述目标中文问题数据对应的GraphQL查询语句的步骤,具体包括:根据BM25算法公式:计算每一个待选GraphQL查询语句的得分值,其中,Q为当前待选GraphQL查询语句,d为所述目标中文问题数据,n为构成当前待选GraphQL查询语句中所述目标中文问题数据的分词数量,i为当前分词的编号,ω
i
为编号为i的分词的权重,R为分词结果与所述目标中文问题数据间的相关性,q
i
为编号为i的分词;
选择得分值为最优解时的待选GraphQL查询语句作为所述最优GraphQL查询语句;将所述最优GraphQL查询语句作为所述目标中文问题数据对应的GraphQL查询语句。4.根据权利要求1所述的基于GraphQL的中文问答模型训练方法,其特征在于,所述根据所述目标中文问题数据、所述解答数据和所述GraphQL查询语句,生成第一文本对和第二文本对的步骤,具体包括:以所述目标中文问题数据为第一KEY值,以所述解答数据为第一VALUE值,生成所述第一文本对;以所述目标中文问题数据为第二KEY值,以所述GraphQL查询语句为第二VALUE值,生成所述第二文本对。5.根据权利要求1所述的基于GraphQL的中文问答模型训练方法,其特征在于,在执行所述将所述第一文本对集和所述第二文本对集输入到采用端到端模式预训练完成的T5问答模型内的步骤之前,所述方法还包括:预先在所述采用端到端模式预训练完成的T5问答模型内引入双塔模型结构,其中,所述双塔模型结构中包含两个独立的神经网络处理结构,分别为第一神经网络处理结构和第二神经网络处理结构;所述进行T5问答模型训练的步骤,具体包括:获取输入的所述第一文本对集和所述第二文本对集;根据所述第一神经网络处理结构对所述第一文本对集进行训练处理,输出由所有目标中文问题数据及所有对应的解答数据构建的第一中文知识图谱;根据所述第二神经网络处理结构对所述第二...

【专利技术属性】
技术研发人员:胡碧峰
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1