基于大数据的居民收入预测系统及其预测方法技术方案

技术编号:33557197 阅读:10 留言:0更新日期:2022-05-26 22:54
本申请涉及居民收入预测的领域,其具体地公开了一种基于大数据的居民收入预测系统及其预测方法,其通过基于上下文的编码器模型对所述离散型变量进行高维特征提取,进一步再构造所述离散型变量的合取邻接矩阵和析取邻接矩阵以表示出所述离散型数据之间的逻辑关系特征,同样地,对于所述连续型变量,也将其通过基于上下文的编码器模型中进行处理,再将所述连续特征向量进行最大值归一化,从而得到能够与所述离散变量的邻接关系表达相对应的实数权重矩阵。进一步通过逻辑激活函数替换逻辑运算,以实现了所述连续变量的端到端所述离散化和所述逻辑关系激活。这样,可以较好地将所述离散型变量和所述连续型变量融合,进而也就能够更准确地对居民的收入进行预测。够更准确地对居民的收入进行预测。够更准确地对居民的收入进行预测。

【技术实现步骤摘要】
基于大数据的居民收入预测系统及其预测方法


[0001]本专利技术涉及居民收入预测的领域,且更为具体地,涉及一种基于大数据的居民收入预测系统及其预测方法。

技术介绍

[0002]随着社会的不断发展和人们生活水平的不断提高,居民的收入水平也在不断上升,这样就对居民有支付能力的需求以及消费品和服务的提供等方面的预测开算提出了相应地要求,其首要任务就是需要对居民的收入进行准确地预测。
[0003]但是,不同职业不同地区的居民的收入水平大不相同,不仅如此,居民的收入还受诸多方面的影响,例如工作类别、受教育程度、婚姻状况、职业、社会角色、种族、性别、国籍、年龄、需要、受教育时间、资本收益、资本支出和每周工作时间等,这样就导致对于居民收入预测的难度较大且准确度较低。因此,为了更准确地对居民的收入进行预测,期望一种基于大数据的居民收入预测系统。

技术实现思路

[0004]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于大数据的居民收入预测系统及其预测方法,其通过基于上下文的编码器模型对所述离散型变量进行高维特征提取,进一步再构造所述离散型变量的合取邻接矩阵和析取邻接矩阵以表示出所述离散型数据之间的逻辑关系特征,同样地,对于所述连续型变量,也将其通过基于上下文的编码器模型中进行处理,再将所述连续特征向量进行最大值归一化,从而得到能够与所述离散变量的邻接关系表达相对应的实数权重矩阵。进一步通过逻辑激活函数替换逻辑运算,以实现了所述连续变量的端到端所述离散化和所述逻辑关系激活。这样,可以较好地将所述离散型变量和所述连续型变量融合,进而也就能够更准确地对居民的收入进行预测。
[0005]采用基于深度学习技术的卷积神经网络模型来挖掘出基于大数据的居民收入预测系统所连接的多个用电设备的用电量在设备维度和时间维度上的高维关联特征,并且还进一步地表达非对角线位置的关于时间的信息,以利用时间信息进行参数的变换,从而得到更为准确的用于表示每个所述用电设备的性能是否正常的概率值。通过这样的方式,可以便于对所述用电设备的性能状态是否正常进行分析,进而解决了所述家用电器的安全隐患。
[0006]根据本申请的一个方面,提供了一种基于大数据的居民收入预测系统,其包括:
[0007]数据获取单元,用于获取与居民收入相关的所有离散型变量和所有连续型变量,所述离散型变量包括工作类别、受教育程度、婚姻状况、职业、社会角色、种族、性别和国籍,所述连续型变量包括年龄、需要、受教育时间、资本收益、资本支出和每周工作时间;
[0008]第一全局编码单元,用于将所有所述离散型变量通过包含嵌入层的基于上下文的编码器模型以获得多个离散特征向量,并将所述多个离散特征向量二维拼接为离散特征矩
阵;
[0009]邻接矩阵构造单元,用于基于各个所述离散型变量之间的合取逻辑和析取逻辑,构造所述多个离散型变量的合取邻接矩阵和析取邻接矩阵,其中,在所述合取邻接矩阵中,如果两个离散型变量之间存在合取范式,则对应位置的特征值1,如果两个离散型变量之间不存在合取范式,则对应位置的特征值为0,在所述析取邻接特征矩阵中,如果两个离散型变量之间存在析取范式,则对应位置的特征值为1,如果两个离散型变量之间不存在析取范式,则对应位置的特征值为0;
[0010]邻接特征矩阵生成单元,用于分别将所述合取邻接矩阵和所述析取邻接矩阵通过卷积神经网络以获得合取特征矩阵和析取特征矩阵,并计算所述合取特征矩阵和所述析取特征矩阵之间的按位置加权和以获得邻接特征矩阵;
[0011]第一融合单元,用于将所述离散特征矩阵与所述邻接特征矩阵进行矩阵相乘以获得第一特征矩阵;
[0012]第二全局编码单元,用于将所有所述连续型变量通过所述包含嵌入层的基于上下文的编码器模型以获得多个连续特征向量;
[0013]实数权重矩阵构造单元,用于分别对所述多个连续特征向量中各个连续特征向量进行归一化处理以获得多个归一化特征向量,并将所述多个归一化特征向量二维拼接为归一化特征矩阵,其中,所述归一化特征矩阵为与离散变量的0/1邻接关系表达相对应的实数权重矩阵;
[0014]激活函数构造单元,用于基于所述实数权重矩阵和所述邻接特征矩阵使用逻辑激活函数来构造第一逻辑激活函数和第二逻辑激活函数,其中,所述第一逻辑激活函数基于所述实数权重矩阵和所述邻接特征矩阵之间的乘积生成,所述第二逻辑激活函数基于单位矩阵减去所述邻接特征矩阵与所述单位矩阵减去所述实数权重矩阵的结果之间的乘积的结果生成;
[0015]激活单元,用于使用所述第一逻辑激活函数和所述第二逻辑激活函数对每个所述连续型变量对应的连续特征向量进行激活以获得第一激活向量和第二激活向量,并计算所述第一激活向量和所述第二激活向量之间的按位置加权以获得与每个所述连续型变量对应的最终激活向量;
[0016]二维排列单元,用于将与每个所述连续型变量对应的最终激活向量进行二维排列以获得第二特征矩阵;
[0017]第二融合单元,用于融合所述第一特征矩阵和所述第二特征矩阵以获得回归矩阵;以及
[0018]回归单元,用于对所述回归矩阵进行回归解码以获得居民收入的预测值。
[0019]根据本申请的另一方面,一种基于大数据的居民收入预测系统的预测方法,其包括:
[0020]获取与居民收入相关的所有离散型变量和所有连续型变量,所述离散型变量包括工作类别、受教育程度、婚姻状况、职业、社会角色、种族、性别和国籍,所述连续型变量包括年龄、需要、受教育时间、资本收益、资本支出和每周工作时间;
[0021]将所有所述离散型变量通过包含嵌入层的基于上下文的编码器模型以获得多个离散特征向量,并将所述多个离散特征向量二维拼接为离散特征矩阵;
[0022]基于各个所述离散型变量之间的合取逻辑和析取逻辑,构造所述多个离散型变量的合取邻接矩阵和析取邻接矩阵,其中,在所述合取邻接矩阵中,如果两个离散型变量之间存在合取范式,则对应位置的特征值1,如果两个离散型变量之间不存在合取范式,则对应位置的特征值为0,在所述析取邻接特征矩阵中,如果两个离散型变量之间存在析取范式,则对应位置的特征值为1,如果两个离散型变量之间不存在析取范式,则对应位置的特征值为0;
[0023]分别将所述合取邻接矩阵和所述析取邻接矩阵通过卷积神经网络以获得合取特征矩阵和析取特征矩阵,并计算所述合取特征矩阵和所述析取特征矩阵之间的按位置加权和以获得邻接特征矩阵;
[0024]将所述离散特征矩阵与所述邻接特征矩阵进行矩阵相乘以获得第一特征矩阵;
[0025]将所有所述连续型变量通过所述包含嵌入层的基于上下文的编码器模型以获得多个连续特征向量;
[0026]分别对所述多个连续特征向量中各个连续特征向量进行归一化处理以获得多个归一化特征向量,并将所述多个归一化特征向量二维拼接为归一化特征矩阵,其中,所述归一化特征矩阵为与离散变量的0/1邻接关系表达相对应的实数权重矩阵;
[0027]基于所述实数权重矩阵和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的居民收入预测系统,其特征在于,包括:数据获取单元,用于获取与居民收入相关的所有离散型变量和所有连续型变量,所述离散型变量包括工作类别、受教育程度、婚姻状况、职业、社会角色、种族、性别和国籍,所述连续型变量包括年龄、需要、受教育时间、资本收益、资本支出和每周工作时间;第一全局编码单元,用于将所有所述离散型变量通过包含嵌入层的基于上下文的编码器模型以获得多个离散特征向量,并将所述多个离散特征向量二维拼接为离散特征矩阵;邻接矩阵构造单元,用于基于各个所述离散型变量之间的合取逻辑和析取逻辑,构造所述多个离散型变量的合取邻接矩阵和析取邻接矩阵,其中,在所述合取邻接矩阵中,如果两个离散型变量之间存在合取范式,则对应位置的特征值1,如果两个离散型变量之间不存在合取范式,则对应位置的特征值为0,在所述析取邻接特征矩阵中,如果两个离散型变量之间存在析取范式,则对应位置的特征值为1,如果两个离散型变量之间不存在析取范式,则对应位置的特征值为0;邻接特征矩阵生成单元,用于分别将所述合取邻接矩阵和所述析取邻接矩阵通过卷积神经网络以获得合取特征矩阵和析取特征矩阵,并计算所述合取特征矩阵和所述析取特征矩阵之间的按位置加权和以获得邻接特征矩阵;第一融合单元,用于将所述离散特征矩阵与所述邻接特征矩阵进行矩阵相乘以获得第一特征矩阵;第二全局编码单元,用于将所有所述连续型变量通过所述包含嵌入层的基于上下文的编码器模型以获得多个连续特征向量;实数权重矩阵构造单元,用于分别对所述多个连续特征向量中各个连续特征向量进行归一化处理以获得多个归一化特征向量,并将所述多个归一化特征向量二维拼接为归一化特征矩阵,其中,所述归一化特征矩阵为与离散变量的0/1邻接关系表达相对应的实数权重矩阵;激活函数构造单元,用于基于所述实数权重矩阵和所述邻接特征矩阵使用逻辑激活函数来构造第一逻辑激活函数和第二逻辑激活函数,其中,所述第一逻辑激活函数基于所述实数权重矩阵和所述邻接特征矩阵之间的乘积生成,所述第二逻辑激活函数基于单位矩阵减去所述邻接特征矩阵与所述单位矩阵减去所述实数权重矩阵的结果之间的乘积的结果生成;激活单元,用于使用所述第一逻辑激活函数和所述第二逻辑激活函数对每个所述连续型变量对应的连续特征向量进行激活以获得第一激活向量和第二激活向量,并计算所述第一激活向量和所述第二激活向量之间的按位置加权以获得与每个所述连续型变量对应的最终激活向量;二维排列单元,用于将与每个所述连续型变量对应的最终激活向量进行二维排列以获得第二特征矩阵;第二融合单元,用于融合所述第一特征矩阵和所述第二特征矩阵以获得回归矩阵;以及回归单元,用于对所述回归矩阵进行回归解码以获得居民收入的预测值。2.根据权利要求1所述的基于大数据的居民收入预测系统,其中,所述第一全局编码单元,包括:
嵌入向量转化子单元,用于使用所述编码器模型的嵌入层分别将所述离散型变量转化为输入向量以获得输入向量的序列,其中,所述输入向量的序列中每一输入向量对应于一个所述离散型变量;以及转换器子单元,用于将所述输入向量的序列通过所述编码器模型的转换器以获得多个离散特征向量;以及矩阵拼接子单元,用于将所述多个离散特征向量二维拼接为所述离散特征矩阵。3.根据权利要求2所述的基于大数据的居民收入预测系统,其中,所述邻接矩阵构造单元,进一步用于:基于各个所述离散型变量之间的合取逻辑以如下公式来构建所述合取邻接矩阵;其中,所述公式为:其中,是合取矩阵,用于表示相应的一对规则构成合取范式时矩阵位置取1,而非合取范式时矩阵位置取0;以及基于各个所述离散型变量之间的析取逻辑以如下公式来构建所述析取邻接矩阵;其中,所述公式为:其中,是析取邻接矩阵,用于表示相应的一对规则构成析取范式时矩阵位置取1,而非析取范式时矩阵位置取0。4.根据权利要求3所述的基于大数据的居民收入预测系统,其中,在所述邻接特征矩阵生成单元中,所述卷积神经网络的各层在层的正向传递过程中对输入数据进行卷积处理、沿通道维度的均值池化处理和激活处理以由所述卷积神经网络的最后一层输出所述合取特征矩阵和所述析取特征矩阵。5.根据权利要求4所述的基于大数据的居民收入预测系统,其中,所述实数权重矩阵构造单元,用于分别对所述多个连续特征向量中各个连续特征向量进行基于最大值的归一化处理以获得所述多个归一化特征向量。6.根据权利要求5所述的...

【专利技术属性】
技术研发人员:刘笑颖
申请(专利权)人:杭州邬萍科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1