【技术实现步骤摘要】
资产数据识别方法、装置、电子设备和计算机存储介质
[0001]本公开涉及互联网
,特别涉及一种资产数据识别方法、装置、电子设备和计算机存储介质。
技术介绍
[0002]现有技术中,目标资源识别模型常常借助SVM(Support Vector Machine,支持向量机)、朴素贝叶斯分类器、基于N
‑
Gram统计语言模型的文本分类方法等,对文本类型的资产数据进行有效分类,以识别出资产数据的具体类别。然而,上述目标资源识别模型在对文本类型的资产数据进行分类的过程中,会面临对文本类型的资产数据进行数值化表示时数据稀疏以及建模之间语义相似度较大、类型识别准确率低、无法深度理解数据语义等问题,且需要进行分类识别的资产数据通常数量庞大、种类繁杂,使得上述目标资源识别模型识别效率低下且不够灵活。
技术实现思路
[0003]本公开旨在至少解决现有技术中存在的问题之一,提供一种资产数据识别方法、装置、电子设备和计算机存储介质。
[0004]本公开的一个方面,提供了一种资产数据识别方法,包括:
[0005]将文本类型的资产数据编码为表示向量;
[0006]基于训练好的资源识别模型,对表示向量进行资源分类,以得到文本类型的资产数据对应的资源类别;其中,训练好的资源识别模型是预先根据表示向量对预设的基于LSTM
‑
CNN的深度神经网络模型进行训练得到。
[0007]可选的,训练好的资源识别模型根据以下步骤训练得到:
[0008]为表示向量添加真 ...
【技术保护点】
【技术特征摘要】
1.一种资产数据识别方法,其特征在于,所述方法包括:将文本类型的资产数据编码为表示向量;基于训练好的资源识别模型,对所述表示向量进行资源分类,以得到所述文本类型的资产数据对应的资源类别;其中,所述训练好的资源识别模型是预先根据所述表示向量对预设的基于LSTM
‑
CNN的深度神经网络模型进行训练得到。2.根据权利要求1所述的方法,其特征在于,所述训练好的资源识别模型根据以下步骤训练得到:为所述表示向量添加真实标签,并将添加真实标签后的所述表示向量划分为训练数据和测试数据,其中,所述真实标签用于指示所述表示向量对应的所述资产数据的资源类别;构建所述预设的基于LSTM
‑
CNN的深度神经网络模型,确定所述预设的基于LSTM
‑
CNN的深度神经网络模型所包括的隐含层的层数和默认参数值,其中,所述隐含层包括嵌入层、LSTM模型、CNN模型;将所述训练数据输入所述预设的基于LSTM
‑
CNN的深度神经网络模型,利用反向传播算法进行有监督训练,以使所述预设的基于LSTM
‑
CNN的深度神经网络模型的损失函数最小化;利用所述测试数据,对损失函数最小化的所述预设的基于LSTM
‑
CNN的深度神经网络模型进行测试,以得到所述训练好的资源识别模型。3.根据权利要求2所述的方法,其特征在于,所述CNN模型包括卷积层、最大池化层、Merge层、Dropout层、全连接层、SoftMax层,所述将所述训练数据输入所述预设的基于LSTM
‑
CNN的深度神经网络模型,利用反向传播算法进行有监督训练,以使所述预设的基于LSTM
‑
CNN的深度神经网络模型的损失函数最小化,包括:将所述训练数据输入所述嵌入层,得到所述训练数据的嵌入表示;将所述训练数据的嵌入表示提供给所述LSTM模型,以生成LSTM特征向量,并将所述训练数据的嵌入表示提供给所述卷积层和所述最大池化层,以生成CNN特征向量;利用所述Merge层将所述LSTM特征向量和所述CNN特征向量进行融合,得到融合特征向量;利用所述Dropout层将所述融合特征向量正则化,得到正则化向量;利用所述全连接层对所述正则化向量进行数据降维;将数据降维后的所述正则化向量输入所述SoftMax层,得到所述训练数据的概率矩阵,并将所述概率矩阵中概率值最大的位置所对应的所述真实标签作为所述训练数据对应的预测标签;将所述预测标签与所述训练数据对应的所述真实标签进行比对,通过所述反向传播算法更新所述预设的基于LSTM
‑
CNN的深度神经网络模型的参数,直至所述预设的基于LSTM
‑
CNN的深度神经网络模型...
【专利技术属性】
技术研发人员:徐桂忠,方赴洋,张淯舒,马勋,
申请(专利权)人:中国电子科技集团公司信息科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。