一种信息补全的方法、装置、设备和存储介质制造方法及图纸

技术编号:27813404 阅读:52 留言:0更新日期:2021-03-30 09:57
本申请公开了信息补全的方法、装置、设备、存储介质和计算机程序产品,涉及人工智能、大数据、深度学习等领域。具体实现方案为:获取实际信息表单以及初始化信息表单;实际信息表单包括多个用户填写的存在目标信息缺失的信息表单,初始化信息表单为在每个目标信息位置存在目标信息的信息表单;利用用户之间的相似性、初始化信息表单的低秩约束和初始化信息表单与实际信息表单之间的差异,对初始化信息表单进行调整,得到调整后的信息表单;将调整后的信息表单中的目标信息补充至实际信息表单中对应的目标信息缺失的位置。利用信息表单的低秩约束作为调整依据,可以降低调整初始化信息表单所需的时间,在不降低结果精度的情况下,提高调整效率。提高调整效率。提高调整效率。

【技术实现步骤摘要】
一种信息补全的方法、装置、设备和存储介质


[0001]本申请涉及数据处理领域,尤其涉及人工智能、大数据、深度学习等领域。

技术介绍

[0002]在收取调查问卷时,通常会遇到部分调查问卷的答案出现缺漏的情况。例如第1个参与调查问卷填写的用户遗漏了第2个问题,相关技术的处理办法包括:计算其他所有参与调查问卷填写的用户对于第2个问题的答案的平均值用以补全、计算第1个参与调查问卷填写的用户的所有答案的平均值用以补全和计算其他参与调查问卷填写的用户所有答案的平均值用以补全中的一种。但上述补全方案相对简单,补全的信息可用价值较低。

技术实现思路

[0003]本申请提供了一种信息补全的方法、装置、设备、存储介质和计算机程序产品。
[0004]根据本申请的一方面,提供了一种信息补全的方法,该方法可以包括以下步骤:
[0005]获取实际信息表单以及初始化信息表单;实际信息表单包括多个用户填写的存在目标信息缺失的信息表单,初始化信息表单为在每个目标信息位置存在目标信息的信息表单;
[0006]利用用户之间的相似性、初始化信息本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息补全的方法,包括:获取实际信息表单以及初始化信息表单;所述实际信息表单包括多个用户填写的存在目标信息缺失的信息表单,所述初始化信息表单为在每个目标信息位置存在目标信息的信息表单;利用所述用户之间的相似性、所述初始化信息表单的低秩约束和所述初始化信息表单与所述实际信息表单之间的差异,对所述初始化信息表单进行调整,得到调整后的信息表单;将所述调整后的信息表单中的目标信息补充至所述实际信息表单中对应的目标信息缺失的位置。2.根据权利要求1所述的方法,其中,所述利用所述用户之间的相似性、所述初始化信息表单的低秩约束和所述初始化信息表单与所述实际信息表单之间的差异,对所述初始化信息表单进行调整,包括:执行多次调整,在第N次调整后的信息表单满足预定条件的情况下,将所述第N次调整后的得到的信息表单作为调整后的信息表单,N为正整数。3.根据权利要求2所述的方法,其中,对于第i次调整,0<i≤N,所述低秩约束的确定方式,包括:对所述第i

1次调整后的信息表单进行第t次梯度下降计算,得到第t次梯度下降计算结果;其中,t为大于0的正整数;利用所述第t次梯度下降计算结果进行梯度下降优化,得到第t次梯度下降优化结果;对所述第i

1次调整后的信息表单进行第t次奇异值分解计算,得到第t次奇异值分解计算结果;利用所述第t次梯度下降优化结果和第t

1次奇异值分解计算结果,进行近似通用奇异值阈值法计算,得到第t次近似通用奇异值阈值法计算结果;在所述第t次近似通用奇异值阈值法计算结果与第t

1次近似通用奇异值阈值法计算结果的差异满足对应阈值的情况下,将所述第t次近似通用奇异值阈值法计算结果作为所述第i次调整后的信息表单的低秩约束。4.根据权利要求3所述的方法,其中,所述近似通用奇异值阈值法计算,包括:利用幂法,对第t次梯度下降优化结果和第t

1次奇异值分解计算结果进行特征提取,得到特征提取结果;利用所述特征提取结果和第t次梯度下降优化结果进行奇异值分解,得到奇异值分解结果;对所述奇异值分解结果进行低秩解析,得到低秩解析结果;利用所述低秩解析结果,得到近似通用奇异值阈值法计算的结果。5.根据权利要求4所述的方法,其中,所述利用幂法,对第t次梯度下降优化结果和第t

1次奇异值分解计算结果进行特征提取,包括:根据所述第t次梯度下降优化结果和第t

1次奇异值分解计算结果,利用正交三角分解计算,得到分解结果;利用所述第t次梯度下降优化结果、所述第t次梯度下降优化结果的转置以及所述分解结果进行计算,得到特征提取结果。
6.根据权利要求1所述的方法,其中,所述用户之间的相似性的确定方式,包括:确定每个所述用户的特征向量;计算每个所述用户的特征向量之间的距离;利用所述距离得到每个所述用户之间的相似性。7.根据权利要求1所述的方法,其中,所述初始化信息表单与所述实际信息表单之间的差异的确定方式,包括:获取所述实际信息表单中的第一目标信息的位置;在所述初始化信息表单中,获取与所述第一目标信息的位置的对应位置的第二目标信息;利用所述第一目标信息,以及与所述第一目标信息的位置的对应位置的第二目标信息,得到目标信息差值矩阵;计算所述目标信息差值矩阵的F范数,利用所述目标信息差值矩阵的F范数表示所述初始化信息表单与所述实际信息表单之间的差异。8.根据权利要求1至7任一所述的方法,其中,在所述初始化信息表单为矩阵形式的情况下,所述初始化信息表单包括第一子矩阵和第二子矩阵;所述初始化信息表单为第一子矩阵和所述第二子矩阵的转置矩阵的乘积。9.一种信息补全的装置,包括:信息表单获取模块,用于获取实际信息表单以及初始化信息表单;所述实际信息表单包括多个用户填写的存在目标信息缺失的信息表单,所述初始化信息表单为在每个目标信息位置存在目标信息的信息表单;初始化信息表单调整模块,用于利用所述用户之间的相似性、所述初始化信息表单的低秩约束和所述初始化信息表单与所述实际信息表单之间的差异,对所述初始化信息表单进行调整,得到调整后的信...

【专利技术属性】
技术研发人员:王雅晴窦德景
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1