本发明专利技术公开了一种数据处理方法、装置和系统。其中,该方法包括:接收待解码数据,其中,待解码数据为问答交互过程中与待回答问题相关的文本数据;依据编码器中的预设提取任务对文本数据进行提取,得到与待回答问题满足相关度条件的文本数据;依据与待回答问题满足相关度条件的文本数据通过解码器进行解析,生成待回答问题的答案。本发明专利技术解决了由于在应用NLP的过程中,导致的生成式阅读理解存在的答案与提问偏离的技术问题。问偏离的技术问题。问偏离的技术问题。
【技术实现步骤摘要】
数据处理方法、装置和系统
[0001]本专利技术涉及互联网
,具体而言,涉及一种数据处理方法、装置和系统。
技术介绍
[0002]在人工智能自然语言处理(Natural Language Processing,简称NLP)中,生成式阅读理解在给定问题,可以产生抽象的答案,而不是从提供的段落中提取答案范围,这种交互更加智能,可以被用于智能音箱、智能助理等设备上。但生成式阅读理解通常存在不可控问题,会遇到两个关键问题:(1)生成的答案与给定问题无关;(2)在生成过程中偏离正确答案。例如:
[0003]给定段落:一个好的计算机程序员更像是一个问题解决者和逻辑思想家,而不是数学爱好者。此外,该行业充斥着许多对数学不太了解的计算机程序员。
[0004]给定问题:游戏程序员需要数学技能吗?
[0005]正确答案:不,游戏程序员不需要数学技能。
[0006]但是基于现有技术针对上述给定问题往往生成的答案为:是的,游戏程序员是数学迷。
[0007]而用户/开发/测试者等技术生成答案则需要为:游戏程序员不需要数学技能。
[0008]针对上述由于在应用NLP的过程中,导致的生成式阅读理解存在的答案与提问偏离的问题,目前尚未提出有效的解决方案。
技术实现思路
[0009]本专利技术实施例提供了一种数据处理方法、装置和系统,以至少解决由于在应用NLP的过程中,导致的生成式阅读理解存在的答案与提问偏离的技术问题。
[0010]根据本专利技术实施例的一个方面,提供了一种数据处理方法,包括:接收待解码数据,其中,待解码数据为问答交互过程中与待回答问题相关的文本数据;依据编码器中的预设提取任务对文本数据进行提取,得到与待回答问题满足相关度条件的文本数据;依据与待回答问题满足相关度条件的文本数据通过解码器进行解析,生成待回答问题的答案。
[0011]可选的,该方法还包括:在接收待解码数据之前,对编码器进行自编码训练,以及,对解码器进行自回归训练,得到训练后的编码器和解码器;依据训练后的编码器和解码器生成问答交互模型;其中,问答交互模型中训练后的编码器用于依据输入的待解码数据和待回答问题获取对应的原理数据,原理数据为与待回答问题满足相关度条件的文本数据;训练后的解码数据用于依据原理数据生成待回答问题的答案。
[0012]进一步地,可选的,该方法还包括:在预设提取任务包括第一提取任务的情况下,在编码器中添加第一提取任务;通过第一提取任务将输入的待解码数据和待回答问题进行拼接,得到拼接后的文本数据;通过计算拼接后的文本数据中每个词预测为原理数据的概率,将概率对应分值最大的词作为待解码数据的原理数据。
[0013]可选的,将概率对应分值最大的词作为待解码数据的原理数据包括:通过编码器
的全连接层和预设函数对每个词进行预测,得到各个词的概率值;依据各个词的概率值获取对应的分值,将分值位于预设区间的词作为原理数据。
[0014]进一步地,可选的,依据各个词的概率值获取对应的分值,将分值位于预设区间的词作为原理数据包括:对各个词对应的概率值计算平均交叉熵,得到损失函数;依据损失函数获取各个词的概率值对应的分值,并将分值位于预设区间的词作为原理数据。
[0015]可选的,该方法还包括:在预设提取任务包括第二提取任务的情况下,在解码器中添加第二提取任务;依据第二提取任务,对编码器输出的原理数据进行提取,得到满足正确答案概率区间的词;将满足正确答案概率区间的词进行拼接,得到答案。
[0016]可选的,数据处理方法应用于问答系统。
[0017]根据本专利技术实施例的另一方面,还提供了一种数据处理装置,包括:接收模块,用于接收待解码数据,其中,待解码数据为问答交互过程中与待回答问题相关的文本数据;提取模块,用于依据编码器中预添加的提取任务对文本数据进行提取,得到与待回答问题满足相关度条件的文本数据;答案生成模块,用于依据与待回答问题满足相关度条件的文本数据通过解码器进行解析,生成待回答问题的答案。
[0018]根据本专利技术实施例的另一方面,还提供了一种数据处理系统,包括:编码器和解码器,其中,编码器,用于接收待解码数据,并依据预添加的提取任务对文本数据进行提取,得到与待回答问题满足相关度条件的文本数据;其中,待解码数据为问答交互过程中与待回答问题相关的文本数据;解码器,用于对与待回答问题满足相关度条件的文本数据进行解析,生成待回答问题的答案。
[0019]可选的,数据处理系统应用于问答系统。
[0020]根据本专利技术实施例的另一方面,还提供了一种非易失性存储介质,其中,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行上述方法。
[0021]根据本专利技术实施例的另一方面,还提供了一种处理器,其中,处理器用于运行程序,其中,程序运行时执行上述方法。
[0022]在本专利技术实施例中,通过接收待解码数据,其中,待解码数据为问答交互过程中与待回答问题相关的文本数据;依据编码器中的预设提取任务对文本数据进行提取,得到与待回答问题满足相关度条件的文本数据;依据与待回答问题满足相关度条件的文本数据通过解码器进行解析,生成待回答问题的答案,达到了在更好的理解问题和段落的同时,生成正确的答案的目的,从而实现了提升答案的质量和语义准确性的技术效果,进而解决了由于在应用NLP的过程中,导致的生成式阅读理解存在的答案与提问偏离的技术问题。
附图说明
[0023]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0024]图1是本专利技术实施例的一种数据处理方法的计算机终端的硬件结构框图;
[0025]图2是根据本专利技术实施例一的数据处理方法的流程图;
[0026]图3a是根据本专利技术实施例一的数据处理方法中NLP模型的示意图;
[0027]图3b是根据本专利技术实施例一的数据处理方法中NLP模型预训练的示意图;
[0028]图4是根据本专利技术实施例二的数据处理装置的示意图。
具体实施方式
[0029]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0030]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:接收待解码数据,其中,所述待解码数据为问答交互过程中与待回答问题相关的文本数据;依据编码器中的预设提取任务对所述文本数据进行提取,得到与所述待回答问题满足相关度条件的文本数据;依据所述与所述待回答问题满足相关度条件的文本数据通过解码器进行解析,生成所述待回答问题的答案。2.根据权利要求1所述的方法,其中,所述方法还包括:在接收待解码数据之前,对所述编码器进行自编码训练,以及,对所述解码器进行自回归训练,得到训练后的所述编码器和所述解码器;依据所述训练后的所述编码器和所述解码器生成问答交互模型;其中,所述问答交互模型中所述训练后的所述编码器用于依据输入的所述待解码数据和所述待回答问题获取对应的原理数据,所述原理数据为与所述待回答问题满足相关度条件的文本数据;所述训练后的所述解码数据用于依据所述原理数据生成所述待回答问题的答案。3.根据权利要求2所述的方法,其中,所述方法还包括:在所述预设提取任务包括第一提取任务的情况下,在所述编码器中添加第一提取任务;通过所述第一提取任务将输入的所述待解码数据和所述待回答问题进行拼接,得到拼接后的文本数据;通过计算所述拼接后的文本数据中每个词预测为所述原理数据的概率,将概率对应分值最大的词作为所述待解码数据的原理数据。4.根据权利要求3所述的方法,其中,所述将概率对应分值最大的词作为所述待解码数据的原理数据包括:通过所述编码器的全连接层和预设函数对每个词进行预测,得到各个词的概率值;依据所述各个词的概率值获取对应的分值,将分值位于预设区间的词作为所述原理数据。5.根据权利要求4所述的方法,其中,所述依据所述各个词的概率值获取对应的分值,将分值位于预设区间的词作为所述原理数据包括:对所述各个词...
【专利技术属性】
技术研发人员:李晨亮,闭彬,严明,黄松芳,
申请(专利权)人:阿里巴巴新加坡控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。