基于调查数据的决策的方法、装置、存储介质和终端设备制造方法及图纸

技术编号:19479938 阅读:42 留言:0更新日期:2018-11-17 10:31
本发明专利技术提出一种基于调查数据的决策方法、装置、存储介质和终端设备,其中,所述方法包括:获取调查数据;所述调查数据包括描述调查过程的连续值特征、类别特征以及文本信息;从所述文本信息中提取语义表示特征;对所述连续值特征和所述类别特征进行组合处理,获得宽度模型输入特征;对预处理后的连续值特征以及类别特征进行泛化处理,获得深度模型输出特征;以及将所述语义表示特征、所述宽度模型输入特征和所述深度模型输出特征输入决策模型,获得所述调查数据的决策结果。采用本发明专利技术,能结合调查数据中的文本的语义特征来进行决策,有利于提高决策的准确度。

【技术实现步骤摘要】
基于调查数据的决策的方法、装置、存储介质和终端设备
本专利技术涉及计算机
,尤其涉及一种基于调查数据的决策方法、装置、存储介质和终端设备。
技术介绍
互联网金融是传统金融与互联网技术相融合,并依托于大数据、云计算、人工智能等新技术来实现资金融通、支付和信息中介等业务的新兴金融业务。随着互联网金融业务的急剧扩张及金融创新产品的不断涌现,互联网金融暴露了大量的风险,主要包括:信用违约和欺诈风险、消费者权益被侵犯风险、资金流动风险等。因而,如何使用风险控制来解决互联网金融面临的风险、降低用户和企业的损失,是目前金融企业亟需解决的问题。但是,在欺诈手段多样化、网络欺诈黑色产业化、人力成本上升的背景下,现有的风险防控措施已难于满足精准化管理的需求。因此,迫切需要建立基于大数据处理技术的智能风险控制模型,形成定量标示和定性分析的风险防控模式,精准识别欺诈风险。随着深度学习技术的迅速发展,神经网络模型已被广泛地应用在各种领域中,例如,在语音识别、图像识别、自然语言处理等,并取得了巨大的成功。深度学习具有自动提取特征的能力,无需人工设计复杂的特征,节省了大量的人力物力。而且,在金融风控方面,深本文档来自技高网...

【技术保护点】
1.一种基于调查数据的决策方法,其特征在于,包括:获取调查数据;所述调查数据包括描述调查过程的连续值特征、类别特征以及文本信息;从所述文本信息中提取语义表示特征;对所述连续值特征和所述类别特征进行组合处理,获得宽度模型输入特征;对预处理后的连续值特征以及类别特征进行泛化处理,获得深度模型输出特征;以及将所述语义表示特征、所述宽度模型输入特征和所述深度模型输出特征输入决策模型,获得所述调查数据的决策结果。

【技术特征摘要】
1.一种基于调查数据的决策方法,其特征在于,包括:获取调查数据;所述调查数据包括描述调查过程的连续值特征、类别特征以及文本信息;从所述文本信息中提取语义表示特征;对所述连续值特征和所述类别特征进行组合处理,获得宽度模型输入特征;对预处理后的连续值特征以及类别特征进行泛化处理,获得深度模型输出特征;以及将所述语义表示特征、所述宽度模型输入特征和所述深度模型输出特征输入决策模型,获得所述调查数据的决策结果。2.如权利要求1所述的基于调查数据的决策方法,其特征在于,所述从所述文本信息中提取语义表示特征,包括:对所述文本信息进行切词,获得有效词数组;通过词嵌入层对所述有效词数组进行处理,获得文本矩阵;其中,所述有效词数组中包括一个或多个词向量,每个词向量表示一个词,所述文本矩阵的行向量或列向量包括所述词向量;以及通过神经网络对所述文本矩阵进行卷积处理,获得语义表示特征。3.如权利要求2所述的基于调查数据的决策方法,其特征在于,所述神经网络为卷积神经网络,所述通过神经网络对所述词向量进行卷积处理,获得语义表示特征,包括:利用所述卷积神经网络的滤波器,对所述文本矩阵的各个子矩阵进行卷积操作,获得各个子矩阵对应的输出序列;将各个子矩阵对应的输出序列输入激活函数中进行非线性变换,获得各个子矩阵的特征序列;从各个子矩阵的特征序列中分别提取序列中的最大值,并依据子矩阵之间的排列顺序将提取到的数值进行向量拼接,获得所述语义表示特征。4.如权利要求3所述的基于调查数据的决策方法,其特征在于,所述根据所述卷积神经网络的滤波器,对所述文本矩阵的各个子矩阵进行卷积操作,获得各个子矩阵对应的输出序列的计算公式,包括:oi=w·Ai[i:i+h-1]其中,oi表示第i个子矩阵的输出序列;i=1…s-h+1,s表示所述文本矩阵包含词向量的数量,h表示所述子矩阵包含词向量的数量;第i个子矩阵由所述文本矩阵中的第i个词向量至第i+h-1个词向量构成,所述参数矩阵的行数与所述子矩阵的行数相同,所述参数矩阵的列数与所述子矩阵的行数相同;w表示所述滤波器的参数矩阵,Ai[i:i+h-1]表示第i个子矩阵。5.如权利要求4所述的基于调查数据的决策方法,其特征在于,所述将各个子矩阵对应的输出序列输入激活函数中进行非线性变换,获得各个子矩阵的特征序列的计算公式,包括:ci=f(oi+bcf)其中,ci表示第i个子矩阵的特征序列,f()表示激活函数,bcf表示所述激活函数的偏置项。6.如权利要求2所述的基于调查数据的决策方法,其特征在于,所述神经网络为递归神经网络,所述通过神经网络对所述词向量进行卷积处理,获得语义表示特征,包括:根据所述递归神经网络的输入门、忘记门、输出门以及记忆单元,按照所述文本矩阵中词向量的排列顺序逐个对词向量进行前向递归处理,获得前向隐状态序列;从所述前向隐状态序列中获取语义表示特征。7.如权利要求2所述的基于调查数据的决策方法,其特征在于,所述所述神经网络为递归神经网络,所述通过神经网络对所述词向量进行卷积处理,获得语义表示特征,包括:根据所述递归神经网络的输入门、忘记门、输出门以及记忆单元,按照所述文本矩阵中词向量的排列顺序逐个对词向量进行前向递归处理,获得前向隐状态序列;根据所述递归神经网络的输入门、忘记门、输出门以及记忆单元,按照所述文本矩阵中词向量的排列顺序逐个对词向量进行后向递归处理,获得后向隐状态序列;从所述前向隐状态序列和所述后向隐状态序列中获取语义表示特征。8.如权利要求6或7所述的基于调查数据的决策方法,其特征在于,所述获得前向隐状态序列的过程,包括:it=σ(Wi·[xt,ht-1]+bi)ft=σ(Wf·[xt,ht-1]+bf)ot=σ(Wo·[xt,ht-1]+bo)ct=tanh(Wc·[xt,ht-1]+bc)ct=it⊙ct+ft⊙ct-1ht=ot⊙tanh(ct)其中,ii、ft、ot、ct分别表示第t个词向量的输入门特征、忘记门特征、输出门特征以及记忆单元特征;Wi、Wf、Wo、Wc分别表示所述输入门、所述忘记门、所述输出门以及所述记忆单元的参数矩阵;bi、bf、bo、bc分别表示所述输入门、所述忘记门、所述输出门以及所述记忆单元的偏置项;t的初始值为1,t=1…s,s表示所述文本矩阵包含词向量的数量;xt表示所述文本矩阵的第t个词向量;ht-1表示所述前向隐状态序列中的第t-1个前向隐状态向量;[xt,ht-1]表示由第t个词向量与第t-1个前向隐状态向量拼接而成的矩阵;σ()表示sigmoid函数;...

【专利技术属性】
技术研发人员:王建祥吕复强
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1