问题数据的处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:37080978 阅读:10 留言:0更新日期:2023-03-29 19:56
本申请实施例属于人工智能领域,涉及一种问题数据的处理方法,包括:判断是否接收到用户触发的标准问添加请求;若是,从标准问添加请求中解析出目标标准问;从多种相似度算法中确定出目标相似度算法;基于目标相似度算法对目标标准问与预设的问答系统内存储的每一个问句数据进行相似度计算,得到多个相似度计算结果;判断所有相似度计算结果中是否存在大于相似度阈值的目标相似度计算结果;若否,将目标标准问作为新的标准问添加至问答系统内。本申请还提供一种问题数据的处理装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,目标标准问可存储于区块链中。本申请能避免问答系统出现知识点重复构建的问题,保证了问答系统的构建质量。系统的构建质量。系统的构建质量。

【技术实现步骤摘要】
问题数据的处理方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及问题数据的处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]基于FAQ的问答系统,是智能问答系统工业应用的常见技术形式之一,因其回答问题准确、灵活和可控,被广泛应用于金融界的各类机器人中。FAQ知识库作为FAQ问答系统中重要的底层知识,其知识质的好坏和量的多少直接影响FAQ问答系统的回答覆盖率和准确率。因此,知识库维护的质量,显得尤其关键重要。
[0003]传统的问答系统内的知识库的维护通常以人工维护为主,鉴于人工维护,存在任务繁重的缺点。通常在对问答系统内的标准问进行预设时,由于不同人对知识的理解千人千面,容易在问答系统内出现同类问句构建多条知识的现象,从而造成问答系统出现知识点重复构建的问题,影响问答系统的构建质量。

技术实现思路

[0004]本申请实施例的目的在于提出一种问题数据的处理方法、装置、计算机设备及存储介质,以解决现有的在对问答系统内的标准问进行预设时,由于不同人对知识的理解千人千面,容易在问答系统内出现同类问句构建多条知识的现象,从而造成问答系统出现知识点重复构建的问题,影响问答系统的构建质量的技术问题。
[0005]为了解决上述技术问题,本申请实施例提供一种问题数据的处理方法,采用了如下所述的技术方案:
[0006]判断是否接收到用户触发的标准问添加请求;其中,所述标准问添加请求携带待添加的目标标准问;
[0007]若是,从所述标准问添加请求中解析出所述目标标准问;
[0008]从预设的多种相似度算法中确定出目标相似度算法;
[0009]基于所述目标相似度算法对所述目标标准问与预设的问答系统内存储的每一个问句数据进行相似度计算,得到对应的多个相似度计算结果;其中,每一个所述问句数据均包括一个标准问,以及包括与所述标准问对应的一个或多个相似句;
[0010]判断所有所述相似度计算结果中是否存在大于预设的相似度阈值的目标相似度计算结果;
[0011]若不存在所述目标相似度计算结果,则将所述目标标准问作为新的标准问添加至所述问答系统内。
[0012]进一步的,所述从预设的多种相似度算法中确定出目标相似度算法的步骤,具体包括:
[0013]调用预设的相似度算法统计数据表;
[0014]从所述相似度算法统计数据表中获取各所述相似度算法的处理效率、准确度以及
发布时间;
[0015]确定与所述处理效率、所述准确度以及所述发布时间分别对应的第一预设权重、第二预设权重与第三预设权重;
[0016]基于所述第一预设权重、第二预设权重与第三预设权重,对各所述相似度算法的处理效率、准确度以及发布时间进行计算,生成各所述相似度算法的处理综合分值;
[0017]从所有所述相似度算法中筛选出处理综合分值最大的指定相似度算法;
[0018]将所述指定相似度算法作为所述目标相似度算法。
[0019]进一步的,在所述将所述目标标准问作为新的标准问添加至所述问答系统内的步骤之后,还包括:
[0020]调用预先训练好的问题生成模型;
[0021]将所述目标标准问输入至所述问题生成模型内,基于所述问题生成模型生成与所述目标标准问对应的第一相似问;
[0022]建立所述目标标准问与所述第一相似问之间的关联关系;
[0023]基于所述关联关系,将所述第一相似问存储至所述问句系统内。
[0024]进一步的,在所述调用预先训练好的问题生成模型的步骤之前,还包括:
[0025]获取预设的标准问句样本数据;
[0026]从预设的数据平台中获取与所述标准问句样本数据对应的相似问题数据;
[0027]基于所述标准问句样本数据与所述相似问题数据构建训练数据;
[0028]调用预设的深度学习模型;
[0029]基于所述训练数据对所述深度学习模型进行训练,生成所述问题生成模型。
[0030]进一步的,在所述将所述目标标准问作为新的标准问添加至所述问答系统内的步骤之后,还包括:
[0031]确定与所述目标标准问对应的目标领域;
[0032]获取与所述目标领域对应的目标数据源;
[0033]从所述目标数据源采集第一语句;其中,所述第一语句的数量包括多个;
[0034]分别计算所述目标标准问与各所述第一语句之间的相似度;
[0035]基于所述相似度,从所有所述第一语句中筛选出相似度满足符合预设条件的第二语句;
[0036]基于所述第二语句生成与所述目标标准问对应的第二相似问。
[0037]进一步的,所述基于所述第二语句生成与所述目标标准问对应的第二相似问的步骤,具体包括:
[0038]获取预存储的问句长度限制规则与相似问句数量限制规则;
[0039]从所述所有第二语句中筛选出符合所述问句长度限制规则的第三语句;
[0040]获取与所述相似问句数量限制规则对应的数量阈值;
[0041]判断所述第三语句的数量是否大于所述数量阈值;
[0042]若是,从所有所述第三语句中筛选出与所述数量阈值相同且相似度数值最高的第四语句;
[0043]将所述第四语句作为所述第二相似问。
[0044]进一步的,在所述判断所有所述相似度计算结果中是否存在大于预设的相似度阈
值的目标相似度计算结果的步骤之后,还包括:
[0045]若所有所述相似度计算结果中存在大于所述相似度阈值的目标相似度计算结果,则拒绝在所述问句系统内添加所述目标标准问;
[0046]生成与所述目标标准问对应的失败提醒信息;
[0047]展示所述失败提醒信息。
[0048]为了解决上述技术问题,本申请实施例还提供一种问题数据的处理装置,采用了如下所述的技术方案:
[0049]第一判断模块,用于判断是否接收到用户触发的标准问添加请求;其中,所述标准问添加请求携带待添加的目标标准问;
[0050]解析模块,用于若是,从所述标准问添加请求中解析出所述目标标准问;
[0051]第一确定模块,用于从预设的多种相似度算法中确定出目标相似度算法;
[0052]计算模块,用于基于所述目标相似度算法对所述目标标准问与预设的问答系统内存储的每一个问句数据进行相似度计算,得到对应的多个相似度计算结果;其中,每一个所述问句数据均包括一个标准问,以及包括与所述标准问对应的一个或多个相似句;
[0053]第二判断模块,用于判断所有所述相似度计算结果中是否存在大于预设的相似度阈值的目标相似度计算结果;
[0054]添加模块,用于若不存在所述目标相似度计算结果,则将所述目标标准问作为新的标准问添加至所述问答系统内。
[0055]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
[0056]判断是否接本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题数据的处理方法,其特征在于,包括下述步骤:判断是否接收到用户触发的标准问添加请求;其中,所述标准问添加请求携带待添加的目标标准问;若是,从所述标准问添加请求中解析出所述目标标准问;从预设的多种相似度算法中确定出目标相似度算法;基于所述目标相似度算法对所述目标标准问与预设的问答系统内存储的每一个问句数据进行相似度计算,得到对应的多个相似度计算结果;其中,每一个所述问句数据均包括一个标准问,以及包括与所述标准问对应的一个或多个相似句;判断所有所述相似度计算结果中是否存在大于预设的相似度阈值的目标相似度计算结果;若不存在所述目标相似度计算结果,则将所述目标标准问作为新的标准问添加至所述问答系统内。2.根据权利要求1所述的问题数据的处理方法,其特征在于,所述从预设的多种相似度算法中确定出目标相似度算法的步骤,具体包括:调用预设的相似度算法统计数据表;从所述相似度算法统计数据表中获取各所述相似度算法的处理效率、准确度以及发布时间;确定与所述处理效率、所述准确度以及所述发布时间分别对应的第一预设权重、第二预设权重与第三预设权重;基于所述第一预设权重、第二预设权重与第三预设权重,对各所述相似度算法的处理效率、准确度以及发布时间进行计算,生成各所述相似度算法的处理综合分值;从所有所述相似度算法中筛选出处理综合分值最大的指定相似度算法;将所述指定相似度算法作为所述目标相似度算法。3.根据权利要求1所述的问题数据的处理方法,其特征在于,在所述将所述目标标准问作为新的标准问添加至所述问答系统内的步骤之后,还包括:调用预先训练好的问题生成模型;将所述目标标准问输入至所述问题生成模型内,基于所述问题生成模型生成与所述目标标准问对应的第一相似问;建立所述目标标准问与所述第一相似问之间的关联关系;基于所述关联关系,将所述第一相似问存储至所述问句系统内。4.根据权利要求3所述的问题数据的处理方法,其特征在于,在所述调用预先训练好的问题生成模型的步骤之前,还包括:获取预设的标准问句样本数据;从预设的数据平台中获取与所述标准问句样本数据对应的相似问题数据;基于所述标准问句样本数据与所述相似问题数据构建训练数据;调用预设的深度学习模型;基于所述训练数据对所述深度学习模型进行训练,生成所述问题生成模型。5.根据权利要求1所述的问题数据的处理方法,其特征在于,在所述将所述目标标准问作为新的标准问添加至所述问答系统内的步骤之后,还包括:
确定与所述目标标准问对应的目标领域;获取与所述目标领域对应...

【专利技术属性】
技术研发人员:曹贵邦
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1