问题解答方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:37845885 阅读:14 留言:0更新日期:2023-06-14 22:30
本申请实施例提供一种问题解答方法、装置、电子设备及计算机可读存储介质,至少应用于人工智能领域和信息搜索领域,其中,方法包括:获取待解答问题;通过预先训练的问题拆解模型对待解答问题进行问题拆解,得到待解答问题对应的多个子问题;问题拆解模型是采用第一数量的监督数据和第二数量的弱监督数据作为样本数据进行训练后得到的模型;通过搜索引擎对每一子问题进行查询,得到多个子问题对应的参考信息集合;基于参考信息集合中的参考信息,对待解答问题进行解答,得到待解答问题的解答结果。通过本申请,能够极大的降低问题解答过程中的资源消耗。答过程中的资源消耗。答过程中的资源消耗。

【技术实现步骤摘要】
问题解答方法、装置、电子设备及计算机可读存储介质


[0001]本申请实施例涉及互联网领域,涉及但不限于一种问题解答方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着ChatGPT(Chat Generative Pre

trained Transformer)的技术革新,国内外越来越多的企业开展ChatGPT类项目的探索,大部分模型在算法的使用上都会存在着事实错误和事实捏造(Fact Fabrication),缺乏依据的逻辑或事实错误,且丰富度和条理性不足等问题,容易给用户造成误导。
[0003]针对这个问题,目前业界大部分搜索引擎使用ChatGPT类技术提升搜索能力时,通常采用思维链(Chain of Thought)的方式,或者,是通过搜索引擎对用户的问题进行检索得到搜索结果,在回答问题时,让模型根据搜索结果进行答案的生成,以此来提升推理准确性。
[0004]但是,思维链的方式需要构造大批量带有推理过程的样本,构造难度大,人工成本高;且需要保证参考样例和当前问题分布一致、类别一致、推理过程类似,一旦遇到跨类别的样本问题,则输出效果会很差。而通过搜索引擎检索搜索结果的方式,整个问题的子问题拆解和回答过程均为串行,耗时较长;且当自身模型较大时,整体计算量过大,无法独立进行问题拆解。由此可见,相关技术中的方案均存在样本构造难度大、计算量大的问题,从而需要提供较大的计算资源才能够实现有效的问题解答过程,显然会造成较大的资源消耗。

技术实现思路

[0005]本申请实施例提供一种问题解答方法、装置、电子设备及计算机可读存储介质,至少能够应用于人工智能领域和信息搜索领域,能够极大的降低问题解答过程中的资源消耗。
[0006]本申请实施例的技术方案是这样实现的:本申请实施例提供一种问题解答方法,包括:获取待解答问题;所述待解答问题的问题复杂度大于复杂度阈值;通过预先训练的问题拆解模型对所述待解答问题进行问题拆解,得到所述待解答问题对应的多个子问题;其中,所述问题拆解模型是采用第一数量的监督数据和第二数量的弱监督数据作为样本数据进行训练后得到的模型;所述第一数量小于所述第二数量,且所述第一数量与所述第二数量之间具有特定比例;通过搜索引擎对每一所述子问题进行查询,得到所述多个子问题对应的参考信息集合;将所述待解答问题和所述参考信息集合输入至预设的自然语言处理模型中,通过所述自然语言处理模型基于所述参考信息集合中的参考信息,对所述待解答问题进行解答,得到所述待解答问题的解答结果。
[0007]本申请实施例提供一种问题解答装置,所述装置包括:获取模块,用于获取待解答问题;所述待解答问题的问题复杂度大于复杂度阈值;问题拆解模块,用于通过预先训练的
问题拆解模型对所述待解答问题进行问题拆解,得到所述待解答问题对应的多个子问题;其中,所述问题拆解模型是采用第一数量的监督数据和第二数量的弱监督数据作为样本数据进行训练后得到的模型;所述第一数量小于所述第二数量,且所述第一数量与所述第二数量之间具有特定比例;查询模块,用于通过搜索引擎对每一所述子问题进行查询,得到所述多个子问题对应的参考信息集合;问题解答模块,用于将所述待解答问题和所述参考信息集合输入至预设的自然语言处理模型中,通过所述自然语言处理模型基于所述参考信息集合中的参考信息,对所述待解答问题进行解答,得到所述待解答问题的解答结果。
[0008]在一些实施例中,所述装置还包括:监督数据获取模块,用于获取多个第一类问题文本和多个第二类问题文本;所述第一类问题文本与所述第二类问题文本的数据来源不同;获取预设的筛选阈值;基于所述筛选阈值,对所述多个第一类问题文本和所述多个第二类问题文本进行数据筛选,得到筛选后的第一类问题文本和筛选后的第二类问题文本;将所述筛选后的第一类问题文本和筛选后的第二类问题文本,确定为所述监督数据。
[0009]在一些实施例中,所述筛选阈值包括:文本复杂度阈值和交互频次阈值;所述监督数据获取模块还用于:按照所述文本复杂度阈值,对所述多个第一类问题文本和所述多个第二类问题文本进行复杂度筛选,得到复杂度筛选后的至少一个第一类问题文本和复杂度筛选后的至少一个第二类问题文本;按照所述交互频次阈值,对所述复杂度筛选后的至少一个第一类问题文本进行交互频次筛选,得到交互频次筛选后的第一类问题文本;对所述复杂度筛选后的至少一个第二类问题文本进行表述筛选,得到表述筛选后的第二类问题文本;将所述交互频次筛选后的第一类问题文本,确定为所述筛选后的第一类问题文本;将所述表述筛选后的第二类问题文本,确定为所述筛选后的第二类问题文本。
[0010]在一些实施例中,所述装置还包括:问题分类体系构造模块,用于构造问题分类体系;所述问题分类体系包括多个一级分类和与每一所述一级分类对应的多个二级分类;每一所述二级分类对应一个二级分类标识;在每得到一个监督数据时,确定所述监督数据对应的目标一级分类标识和目标二级分类标识;并将所述监督数据划分至所述问题分类体系中与所述目标二级分类标识对应的二级分类中;通过划分后得到的所述问题分类体系,对所述监督数据进行类别平衡分析,得到类别平衡分析结果;基于所述类别平衡分析结果,更新所述问题分类体系。
[0011]在一些实施例中,所述问题分类体系构造模块还用于:获取每一所述一级分类对应的多个二级分类中每一二级分类中的监督数据的数量;对每一所述一级分类对应的全部二级分类中的监督数据的数量进行求和,得到相应一级分类的监督数据数量和;确定全部一级分类的监督数据数量和之间的比值;基于所述比值对全部监督数据进行类别平衡分析,得到类别平衡分析结果;其中,所述类别平衡分析结果包括:全部一级分类的类别平衡和全部一级分类的类别不平衡。
[0012]在一些实施例中,所述问题分类体系构造模块还用于:响应于所述类别平衡分析结果为所述类别不平衡,基于所述比值确定待扩充数量的目标一级分类;获取所述目标一级分类对应的多个目标二级分类和每一所述目标二级分类下的监督数据的数量;基于每一所述目标二级分类下的监督数据的数量,确定待扩充数量的目标二级分类;获取所述待扩充数量的目标二级分类下的新的监督数据;通过所述新的监督数据更新所述问题分类体系。
[0013]在一些实施例中,所述装置还包括:第一弱监督数据获取模块,用于获取第一原始问题和与所述第一原始问题对应的至少一个要求信息;将所述第一原始问题和所述至少一个要求信息输入至零样本学习模型中,通过所述零样本学习模型基于所述至少一个要求信息对所述第一原始问题进行问题拆解,得到多个第一拆解子问题;将所述第一原始问题与所述多个第一拆解子问题确定为所述弱监督数据。
[0014]在一些实施例中,所述装置还包括:第二弱监督数据获取模块,用于获取第二原始问题和所述第二原始问题的问题类型;基于所述问题类型,获取与所述第二原始问题具有相同类型的至少一个参考问题;将所述第二原始问题和所述至少一个参考问题输入至少样本学习模型中,通过所述少样本学习模型基于所述至少一个参考问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题解答方法,其特征在于,所述方法包括:获取待解答问题;所述待解答问题的问题复杂度大于复杂度阈值;通过预先训练的问题拆解模型对所述待解答问题进行问题拆解,得到所述待解答问题对应的多个子问题;其中,所述问题拆解模型是采用第一数量的监督数据和第二数量的弱监督数据作为样本数据进行训练后得到的模型;所述第一数量小于所述第二数量,且所述第一数量与所述第二数量之间具有特定比例;通过搜索引擎对每一所述子问题进行查询,得到所述多个子问题对应的参考信息集合;将所述待解答问题和所述参考信息集合输入至预设的自然语言处理模型中,通过所述自然语言处理模型基于所述参考信息集合中的参考信息,对所述待解答问题进行解答,得到所述待解答问题的解答结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过以下方式获取所述监督数据:获取多个第一类问题文本和多个第二类问题文本;所述第一类问题文本与所述第二类问题文本的数据来源不同;获取预设的筛选阈值;基于所述筛选阈值,对所述多个第一类问题文本和所述多个第二类问题文本进行数据筛选,得到筛选后的第一类问题文本和筛选后的第二类问题文本;将所述筛选后的第一类问题文本和筛选后的第二类问题文本,确定为所述监督数据。3.根据权利要求2所述的方法,其特征在于,所述筛选阈值包括:文本复杂度阈值和交互频次阈值;所述基于所述筛选阈值,对所述多个第一类问题文本和所述多个第二类问题文本进行数据筛选,得到筛选后的第一类问题文本和筛选后的第二类问题文本,包括:按照所述文本复杂度阈值,对所述多个第一类问题文本和所述多个第二类问题文本进行复杂度筛选,得到复杂度筛选后的至少一个第一类问题文本和复杂度筛选后的至少一个第二类问题文本;按照所述交互频次阈值,对所述复杂度筛选后的至少一个第一类问题文本进行交互频次筛选,得到交互频次筛选后的第一类问题文本;对所述复杂度筛选后的至少一个第二类问题文本进行表述筛选,得到表述筛选后的第二类问题文本;将所述交互频次筛选后的第一类问题文本,确定为所述筛选后的第一类问题文本;将所述表述筛选后的第二类问题文本,确定为所述筛选后的第二类问题文本。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:构造问题分类体系;所述问题分类体系包括多个一级分类和与每一所述一级分类对应的多个二级分类;每一所述二级分类对应一个二级分类标识;在每得到一个监督数据时,确定所述监督数据对应的目标一级分类标识和目标二级分类标识;并将所述监督数据划分至所述问题分类体系中与所述目标二级分类标识对应的二级分类中;通过划分后得到的所述问题分类体系,对所述监督数据进行类别平衡分析,得到类别
平衡分析结果;基于所述类别平衡分析结果,更新所述问题分类体系。5.根据权利要求4所述的方法,其特征在于,所述通过划分后得到的所述问题分类体系,对所述监督数据进行类别平衡分析,得到类别平衡分析结果,包括:获取每一所述一级分类对应的多个二级分类中每一二级分类中的监督数据的数量;对每一所述一级分类对应的全部二级分类中的监督数据的数量进行求和,得到相应一级分类的监督数据数量和;确定全部一级分类的监督数据数量和之间的比值;基于所述比值对全部监督数据进行类别平衡分析,得到类别平衡分析结果;其中,所述类别平衡分析结果包括:全部一级分类的类别平衡和全部一级分类的类别不平衡。6.根据权利要求5所述的方法,其特征在于,所述基于所述类别平衡分析结果,更新所述问题分类体系,包括:响应于所述类别平衡分析结果为所述类别不平衡,基于所述比值确定待扩充数量的目标一级分类;获取所述目标一级分类对应的多个目标二级分类和每一所述目标二级分类下的监督数据的数量;基于每一所述目标二级分类下的监督数据的数量,确定待扩充数量的目标二级分类;获取所述待扩充数量的目标二级分类下的新的监督数据;通过所述新的监督数据更新所述问题分类体系。7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:通过以下方式获取所述弱监督数据:获取第一原始问题和与所述第一原始问题对应的至少一个要求信息;将所述第一原始问题和所述至少一个要求信息输入至零样本学...

【专利技术属性】
技术研发人员:马晋常景冬邵一峰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1