数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：19903640 阅读：43 留言：0更新日期：2018-12-26 02:58

本发明专利技术涉及一种数据处理方法、装置、计算机设备和存储介质，该方法包括：获取问题数据和候选文档；分别通过多个处理层逐层处理问题数据的信息和候选文档的信息，获得问题特征向量和文档特征向量，且在每个处理层处理时将相同处理层中问题数据的信息和候选文档的信息相互参考；根据问题特征向量和文档特征向量，确定候选文档中每个候选答案对应的答案相似度；按照答案相似度筛选对应的候选答案，获得与问题数据对应的答案数据。本申请方案根据问题特征向量和文档特征向量，确定候选文档中每个候选答案对应的答案相似度，提高了答案相似度的准确性，根据答案相似度确定答案数据，从而提高了确定答案数据的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、计算机设备和存储介质
本专利技术涉及计算机
，特别是涉及一种数据处理方法、装置、计算机设备和存储介质。
技术介绍
随着计算技术飞速发展，越来越多的数据需要通过计算机进行处理，基于数据对计算机的需求，使得数据处理技术也得到了发展。然而，伴随着数据处理技术的众多应用，对于数据处理准确度的要求越来越高，例如根据问题数据确定答案数据的业务，对确定答案数据的准确率要求较高。传统的确定答案数据的过程中，直接根据问题数据查询匹配的答案数据，查询到的答案数据千差万别，使得查询到的答案数据的准确率较低。
技术实现思路
基于此，有必要针对查询到的答案数据的准确率较低的问题，提供一种问答数据处理方法、装置、计算机设备和存储介质。一种数据处理方法，所述方法包括：获取问题数据和候选文档；分别通过多个处理层逐层处理所述问题数据的信息和所述候选文档的信息，获得问题特征向量和文档特征向量，且在每个处理层处理时将相同处理层中问题数据的信息和候选文档的信息相互参考；根据所述问题特征向量和所述文档特征向量，确定所述候选文档中每个候选答案对应的答案相似度；按照所述答案相似度筛选对应...

【技术保护点】
1.一种数据处理方法，所述方法包括：获取问题数据和候选文档；分别通过多个处理层逐层处理所述问题数据的信息和所述候选文档的信息，获得问题特征向量和文档特征向量，且在每个处理层处理时将相同处理层中问题数据的信息和候选文档的信息相互参考；根据所述问题特征向量和所述文档特征向量，确定所述候选文档中每个候选答案对应的答案相似度；按照所述答案相似度筛选对应的候选答案，获得与所述问题数据对应的答案数据。

【技术特征摘要】
1.一种数据处理方法，所述方法包括：获取问题数据和候选文档；分别通过多个处理层逐层处理所述问题数据的信息和所述候选文档的信息，获得问题特征向量和文档特征向量，且在每个处理层处理时将相同处理层中问题数据的信息和候选文档的信息相互参考；根据所述问题特征向量和所述文档特征向量，确定所述候选文档中每个候选答案对应的答案相似度；按照所述答案相似度筛选对应的候选答案，获得与所述问题数据对应的答案数据。2.根据权利要求1所述的方法，其特征在于，所述获取问题数据和候选文档包括：获取问题数据；提取所述问题数据中的问题关键数据；根据所述问题关键数据进行检索，得到与所述问题数据匹配的候选文档。3.根据权利要求1所述的方法，其特征在于，所述分别通过多个处理层逐层处理所述问题数据的信息和所述候选文档的信息，获得问题特征向量和文档特征向量包括：分别获取所述问题数据的问题原始向量和所述候选文档的文档原始向量；将所述问题原始向量和所述文档原始向量输入当前处理层，在当前处理层中将问题原始向量和文档原始向量相互参考进行处理，得到当前层文档向量；以所述当前层文档向量作为文档原始向量，且以下一处理层作为当前处理层，返回所述将所述问题原始向量和所述文档原始向量输入当前处理层，在当前处理层中将问题原始向量和文档原始向量相互参考进行处理，得到当前层文档向量继续执行，直至最后一个处理层；根据最后一个处理层输出的当前层文档向量确定文档特征向量，并根据所述问题原始向量确定问题特征向量。4.根据权利要求3所述的方法，其特征在于，所述将所述问题原始向量和所述文档原始向量输入当前处理层，在当前处理层中将问题原始向量和文档原始向量相互参考进行处理，得到当前层文档向量包括：通过当前处理层中的门控循环单元，分别对所述问题原始向量和所述文档原始向量进行处理，得到问题待参考向量和文档待参考向量；将所述问题待参考向量和所述文档待参考向量输入向量参考单元，得到当前层问题向量；将所述当前层问题向量和所述文档待参考向量输入向量参考单元，得到当前层文档向量。5.根据权利要求4所述的方法，其特征在于，所述将所述问题待参考向量和所述文档待参考向量输入向量参考单元，得到当前层问题向量包括：根据所述问题待参考向量和所述文档待参考向量，确定文档向量对齐权重；将所述文档待参考向量与所述文档向量对齐权重相乘，生成文档对齐向量；对所述文档对齐向量与所述问题待参考向量进行元素积运算，得到当前层问题向量。6.根据权利要求5所述的方法，其特征在于，所述当前层问题向量通过以下公式计算得到：βj＝softmax(DTqj)Z＝[z1,z2,…,z|Q|]其中，D为文档待参考向量，DT为对文档待参考向量进行转置，qj表示问题待参考向量的第j个向量，βj表示文档向量对齐权重的第j个权重值，DTqj表示转置后的文档待参考向量DT与qj的乘积，softmax(DTqj)表示对DTqj进行归一化处理；表示文档对齐向量，Dβj表示D与βj的乘积；zj表示当前层问题向量中的第j个向量，表示qj与对应的进行元素积运算；Z为当前层问题向量，|Q|表示当前层问题向量的长度，1≤j≤|Q|。7.根据权利要求4所述的方法，其特征在于，所述将所述当前层问题向量和所述文档待参考向量输入向量参考单元，得到当前层文档向量包括：根据所述当前层问题向量和所述文档待参考向量，确定问题向量对齐权重；将所述问题向量对齐权重与所述当前层问题向量相乘，生成问题对齐向量；对所述问题对齐向量与所述文档待参考向量进行元素积运算，得到当前层文档向量。8.根据权...

【专利技术属性】
技术研发人员：譚翊章，邓浩辉，田乐，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人