数据处理方法以及装置制造方法及图纸

技术编号:36073767 阅读:11 留言:0更新日期:2022-12-24 10:44
本说明书实施例提供数据处理方法以及装置,其中所述数据处理方法包括:获取用户针对目标对象提交的待查询问题,并获取初始文档,其中,所述初始文档中包含所述待查询问题对应的初始答案,将所述待查询问题以及所述初始文档输入答案检测模型进行处理,获得所述初始答案,将所述待查询问题及所述初始答案发送至对象提供方,并获取所述对象提供方针对所述初始答案生成的答案使用信息,根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案。答案。答案。

【技术实现步骤摘要】
数据处理方法以及装置


[0001]本说明书实施例涉及计算机
,特别涉及一种数据处理方法。

技术介绍

[0002]对于机器学习,尤其是深度学习而言,大多数算法的运行均需要以大量的样本数据为基础。样本数据的丰富程度及准确性对于机器学习具有非常重要的意义。
[0003]目前的模型训练过程中,由于样本标注存在人为标注的主观因素,并且训练样本数量多,无法做到通过人工一一筛选掉部分劣质样本,影响模型训练效果,使训练后的模型精准度不高,因此,如何在降低人工标注成本的条件下,对模型输出的答案进行精准度调整,成为亟需解决的问题。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种数据处理方法。本说明书一个或者多个实施例同时涉及一种数据处理装置,一种问答处理方法,一种问答处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种数据处理方法,包括:
[0006]获取用户针对目标对象提交的待查询问题,并获取初始文档,其中,所述初始文档中包含所述待查询问题对应的初始答案;
[0007]将所述待查询问题以及所述初始文档输入答案检测模型进行处理,获得所述初始答案;
[0008]将所述待查询问题及所述初始答案发送至对象提供方,并获取所述对象提供方针对所述初始答案生成的答案使用信息;
[0009]根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案。
[0010]根据本说明书实施例的第二方面,提供了一种数据处理装置,包括:
[0011]获取模块,被配置为获取用户针对目标对象提交的待查询问题,并获取初始文档,其中,所述初始文档中包含所述待查询问题对应的初始答案;
[0012]处理模块,被配置为将所述待查询问题以及所述初始文档输入答案检测模型进行处理,获得所述初始答案;
[0013]发送模块,被配置为将所述待查询问题及所述初始答案发送至对象提供方,并获取所述对象提供方针对所述初始答案生成的答案使用信息;
[0014]确定模块,被配置为根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案。
[0015]根据本说明书实施例的第三方面,提供了一种问答处理方法,包括:
[0016]获取用户通过对话交互界面针对目标商品提交的待查询问题;
[0017]获取初始文档,并将所述待查询问题以及所述初始文档输入答案检测模型进行处理,获得所述初始文档中包含的所述待查询问题的初始答案;
[0018]将所述待查询问题及所述初始答案发送至商品提供方,并获取所述商品提供方针对所述初始答案生成的答案使用信息;
[0019]根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案。
[0020]根据本说明书实施例的第三方面,提供了一种问答处理装置,包括:
[0021]获取模块,被配置为获取用户通过对话交互界面针对目标商品提交的待查询问题;
[0022]输入模块,被配置为获取初始文档,并将所述待查询问题以及所述初始文档输入答案检测模型进行处理,获得所述初始文档中包含的所述待查询问题的初始答案;
[0023]发送模块,被配置为将所述待查询问题及所述初始答案发送至商品提供方,并获取所述商品提供方针对所述初始答案生成的答案使用信息;
[0024]确定模块,被配置为根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案。
[0025]根据本说明书实施例的第五方面,提供了一种计算设备,包括:
[0026]存储器和处理器;
[0027]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令实现任意一项所述数据处理方法的步骤。
[0028]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述数据处理方法的步骤。
[0029]根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述数据处理方法的步骤。
[0030]本说明书一个实施例通过获取用户针对目标对象提交的待查询问题,并获取初始文档,其中,所述初始文档中包含所述待查询问题对应的初始答案,将所述待查询问题以及所述初始文档输入答案检测模型进行处理,获得所述初始答案,将所述待查询问题及所述初始答案发送至对象提供方,并获取所述对象提供方针对所述初始答案生成的答案使用信息,根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案。
[0031]本说明书实施例通过项目提供方针对答案检测模型输出的初始答案的使用信息,优化抽取式阅读理解数据集的生产方式,即实现通过对象提供方对答案检测模输出的问答对进行辅助审核,以对象提供方对初始答案的使用信息作为反馈,对答案检测模型输出的初始答案进行调整,而减少了人工标注的过程,既有利于降低人工审核成本,有利于提高答案调整结果的准确性。
附图说明
[0032]图1是本说明书一个实施例提供的一种数据处理过程的示意图;
[0033]图2是本说明书一个实施例提供的一种数据处理方法的流程图;
[0034]图3是本说明书一个实施例提供的另一种数据处理过程的示意图;
[0035]图4是本说明书一个实施例提供的一种数据处理方法的处理过程流程图;
[0036]图5是本说明书一个实施例提供的一种数据处理装置的结构示意图;
[0037]图6是本说明书一个实施例提供的一种问答处理方法的示意图;
[0038]图7是本说明书一个实施例提供的一种问答处理装置的结构示意图;
[0039]图8是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0040]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0041]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0042]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:获取用户针对目标对象提交的待查询问题,并获取初始文档,其中,所述初始文档中包含所述待查询问题对应的初始答案;将所述待查询问题以及所述初始文档输入答案检测模型进行处理,获得所述初始答案;将所述待查询问题及所述初始答案发送至对象提供方,并获取所述对象提供方针对所述初始答案生成的答案使用信息;根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案。2.根据权利要求1所述的数据处理方法,还包括:将所述待查询问题以及所述初始文档输入答案检测模型进行处理,获得所述初始答案在所述初始文档中的位置信息;相应地,所述确定所述待查询问题的目标答案之后,还包括:根据所述待查询问题、所述目标答案、所述初始文档及所述位置信息构建所述答案检测模型的训练样本数据;通过所述训练样本数据对所述答案检测模型进行迭代训练。3.根据权利要求2所述的数据处理方法,所述根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案,包括:在确定所述答案使用信息为使用的情况下,将所述初始答案确定为所述待查询问题的目标答案;相应地,所述根据所述待查询问题、所述目标答案、所述初始文档及所述位置信息构建所述答案检测模型的训练样本数据,包括:将所述待查询问题、所述目标答案、所述初始文档及所述位置信息作为训练样本,将有答案作为样本标签,以构建所述答案检测模型的训练样本数据。4.根据权利要求2所述的数据处理方法,所述根据所述答案使用信息及所述初始答案,确定所述待查询问题的目标答案,包括:在确定所述答案使用信息为使用的情况下,获取所述对象提供方使用的中间答案,并判断所述中间答案与所述初始答案是否一致;若否,则将所述中间答案确定为所述待查询问题的目标答案;相应地,所述根据所述待查询问题、所述目标答案、所述初始文档及所述位置信息构建所述答案检测模型的训练样本数据,包括:将所述待查询问题、所述目标答案、所述初始文档及所述位置信息作为训练样本,将有答案作为样本标签,以构建所述答案检测模型的训练样本数据。5.根据权利要求2所述的数据处理方法,所述位置信息包括所述初始答案在所述初始文档中的第一起始位置以及第一结束位置;相应的,所述根据所述待查询问题、所述目标答案、所述初始文档及所述位置信息构建所述答案检测模型的训练样本数据,包括:根据所述第一起始位置及所述第一结束位置确定所述初始答案对应的第一答案长度,并确定所述目标答案对应的第二答案长度;判断所述第一答案长度与所述第二答案长度是否相等;
若是,则根据所述待查询问题、所述目标答案、所述初始文档及所述位置信息构建所述答案检测模型的训练样本数据。6.根据权利要求5所述的数据处理方法,在所述判断所述第一答案长度与所述第二答案长度是否相等的执行结果为否的情况下,所述方法还包括:将所述第一起始位置确定为所述目标答案在所述初始文档中的第二起始位置;根据所述第二起始位置及所述第二答案长度,确定所述目标答案在所述初始文档中的第二结束位置;根据所述待查询问题、所述目标答案、所述初始文档、所述第二起始位置及所述第二结束位置,构建所述答案检测模型的训练样本数据。7.根据权利要求6所述的数据处理方法,所述根据所述目标答案、所述初始文档、所述第二起...

【专利技术属性】
技术研发人员:曹昊亮
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1