基于神经网络和树模型的预测模型建立方法及其装置制造方法及图纸

技术编号:26731505 阅读:30 留言:0更新日期:2020-12-15 14:34
本发明专利技术公开了一种基于神经网络和树模型的预测模型建立方法及其装置,该方法包括获取数据集,对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集分为训练数据集和测试数据集;根据预设神经网络模型和预设树模型构建神经网络树模型,根据所述神经网络树模型构建神经网络随机森林模型;将所述训练数据集输入至所述神经网络随机森林模型进行模型训练;将所述测试数据集输入至训练结束后的神经网络随机森林模型进行模型验证。本发明专利技术提供的基于神经网络和树模型的预测模型建立方法,将神经网络与树模型相结合得到神经网络随机森林模型,通过神经网络随机森林模型进行相关预测,不仅提高了预测的准确度,也提高了预测的效率。

【技术实现步骤摘要】
基于神经网络和树模型的预测模型建立方法及其装置
本专利技术属于机器学习算法与大数据
,具体涉及一种基于神经网络和树模型的预测模型建立方法及其装置。
技术介绍
随着大数据与人工智能(ArtificialIntelligence,简称AI)领域的发展,“AI+”的概念逐渐扩展到众多领域。医疗行业也不例外,“AI+医疗”也是当下人工智能研究的重要领域。医疗行业每天都会产生大量的数据,诸如患者的化验单数据、电子病历数据等等,而这些大量数据对于疾病预测方面有着重要的价值。机器学习算法让这些医疗数据有了应用的价值,它可以帮助患者进行疾病的预测。但是传统的机器学习算法应用在医疗数据集中,不仅准确率较低,而且算法运行速度还较慢。诸如:传统的神经网络算法,虽然准确率较高,但是运行速度却较慢;传统的树模型算法,虽然运行速度较快,但是准确率却较低。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术提供了一种基于神经网络和树模型的预测模型建立方法及其装置。本专利技术的一个实施例提供了一种基于神经网络和树模型的预测模型建立方法,该基于神经网络和树模型的预测模型建立方法包括:获取数据集,对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集分为训练数据集和测试数据集;根据预设神经网络模型和预设树模型构建神经网络树模型,根据所述神经网络树模型构建神经网络随机森林模型;将所述训练数据集输入至所述神经网络随机森林模型进行模型训练;将所述测试数据集输入至训练结束后的神经网络随机森林模型进行模型验证。在本专利技术的一个实施例中,对所述数据集进行预处理得到预处理数据集包括:对所述数据集进行数据清洗;将数据清洗后的数据集中文字型数据转化为数值型数据;计算每个所述数值型数据的相关性,并选择所述相关性大于或等于第一预设阈值的数值型数据形成所述预处理数据集。在本专利技术的一个实施例中,所述预设神经网络模型包括输入层、输出层,以及位于所述输入层与所述输出层之间的若干层隐藏层,每一层所述隐藏层包括若干神经元节点,所述预设神经网络模型中隐藏层和神经元节点的集合表示为:H={(h1,n1),(h2,n2),…,(hn,nn)};其中,H表示预设神经网络模型中隐藏层和神经元节点的集合,hn表示第n层隐藏层,nn表示隐藏层hn里有nn个神经元节点。在本专利技术的一个实施例中,根据预设神经网络模型和预设树模型构建神经网络树模型包括:将所述预设神经网络模型中输出层的神经元节点、每一层隐藏层的若干神经元节点均替换为所述预设树模型得到所述神经网络树模型。在本专利技术的一个实施例中,所述预设树模型包括决策树模型、GBDT模型、XGBoost模型和AdaBoost模型。在本专利技术的一个实施例中,根据所述神经网络树模型构建神经网络随机森林模型包括:采用voting/averaging方法对若干所述神经网络树模型进行组合得到所述神经网络随机森林模型。在本专利技术的一个实施例中,所述方法还包括:若验证结果小于第二预设阈值,通过网格搜索方法优化所述训练结束后的神经网络随机森林模型。本专利技术的又一实施例提供了一种基于神经网络和树模型的预测模型建立装置,包括:数据获取及处理模块,用于获取数据集,对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集分为训练数据集和测试数据集;数据模型构建模块,用于根据预设神经网络模型和预设树模型构建神经网络树模型,根据所述神经网络树模型构建神经网络随机森林模型;数据模型训练模块,用于将所述训练数据集输入至所述神经网络随机森林模型进行模型训练;数据模型验证模块,用于将所述测试数据集输入至训练结束后的神经网络随机森林模型进行模型验证。在本专利技术的一个实施例中,所述装置还包括:数据模型优化模块,用于若验证结果小于第二预设阈值,通过网格搜索方法优化所述训练结束后的神经网络随机森林模型。与现有技术相比,本专利技术的有益效果:本专利技术提供的基于神经网络和树模型的预测模型建立方法,将神经网络与树模型相结合得到神经网络随机森林模型,通过神经网络随机森林模型进行相关预测,比如疾病预测,不仅提高了相关预测的准确度,也提高了相关预测的效率。以下将结合附图及实施例对本专利技术做进一步详细说明。附图说明图1为本专利技术实施例提供的一种基于神经网络和树模型的预测模型建立方法的流程示意图;图2为本专利技术实施例提供的一种基于神经网络和树模型的预测模型建立方法中神经网络随机森林模型构建过程的结构示意图;图3为本专利技术实施例提供的一种基于神经网络和树模型的预测模型建立方法中神经网络随机森林模型构建过程的结构一实例示意图;图4为本专利技术实施例提供的一种基于神经网络和树模型的预测模型建立方法中神经网络随机森林模型训练过程一实例示意图;图5为本专利技术实施例提供的又一种基于神经网络和树模型的预测模型建立方法的流程示意图;图6为本专利技术实施例提供的一种基于神经网络和树模型的预测模型建立装置的结构示意图;图7为本专利技术实施例提供的又一种基于神经网络和树模型的预测模型建立方法的流程示意图。具体实施方式下面结合具体实施例对本专利技术做进一步详细的描述,但本专利技术的实施方式不限于此。实施例一为了兼顾预测模型的预测准确度和预测效率,请参见图1,图1为本专利技术实施例提供的一种基于神经网络和树模型的预测模型建立方法的流程示意图。本专利技术实施例提供了一种基于神经网络和树模型的预测模型建立方法,该基于神经网络和树模型的预测模型建立方法包括以下步骤:步骤1、获取数据集,对数据集进行预处理得到预处理数据集,并将预处理数据集分为训练数据集和测试数据集。具体而言,本实施例从数据库中获取需要的数据集,比如本实施例数据库具体为UCI官网的糖尿病数据库,从UCI官网上获取到糖尿病数据集,共768例数据,其中500人没有患病,268人患有疾病。对数据集进行预处理得到预处理数据集具体包括步骤1.1、步骤1.2、步骤1.3:步骤1.1、对数据集进行数据清洗。具体而言,本实施例根据应用场景需求,对数据集进行数据清洗,即将数据集中的异常数据进行剔除,比如身体质量指数(BodyMassIndex,简称BMI)为1000,则表示此类数据为异常数据,应被剔除,剔除数据集中所有的异常数据。剔除异常数据后,对缺失的数据进行填补操作:若缺失数据为连续型变量,则使用均值填补缺失值;若缺失数据为分类型变量,则使用众数填补缺失值。步骤1.2、将数据清洗后的数据集中文字型数据转化为数值型数据。具体而言,本实施例对数据清洗后的数据集中数据类型进行转化,具体地,将文字型数据转化为数值型数据,即将数据集中含有文字型数据转化为数值型数量,比如:将“阳性/阴性”转化为“1/-1”,将“是/否”转化为“1/0”,将“患有糖尿病/未患本文档来自技高网...

【技术保护点】
1.一种基于神经网络和树模型的预测模型建立方法,其特征在于,包括:/n获取数据集,对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集分为训练数据集和测试数据集;/n根据预设神经网络模型和预设树模型构建神经网络树模型,根据所述神经网络树模型构建神经网络随机森林模型;/n将所述训练数据集输入至所述神经网络随机森林模型进行模型训练;/n将所述测试数据集输入至训练结束后的神经网络随机森林模型进行模型验证。/n

【技术特征摘要】
1.一种基于神经网络和树模型的预测模型建立方法,其特征在于,包括:
获取数据集,对所述数据集进行预处理得到预处理数据集,并将所述预处理数据集分为训练数据集和测试数据集;
根据预设神经网络模型和预设树模型构建神经网络树模型,根据所述神经网络树模型构建神经网络随机森林模型;
将所述训练数据集输入至所述神经网络随机森林模型进行模型训练;
将所述测试数据集输入至训练结束后的神经网络随机森林模型进行模型验证。


2.根据权利要求1所述的基于神经网络和树模型的预测模型建立方法,其特征在于,对所述数据集进行预处理得到预处理数据集包括:
对所述数据集进行数据清洗;
将数据清洗后的数据集中文字型数据转化为数值型数据;
计算每个所述数值型数据的相关性,并选择所述相关性大于或等于第一预设阈值的数值型数据形成所述预处理数据集。


3.根据权利要求1所述的基于神经网络和树模型的预测模型建立方法,其特征在于,所述预设神经网络模型包括输入层、输出层,以及位于所述输入层与所述输出层之间的若干层隐藏层,每一层所述隐藏层包括若干神经元节点,所述预设神经网络模型中隐藏层和神经元节点的集合表示为:
H={(h1,n1),(h2,n2),...,(hn,nn)};
其中,H表示预设神经网络模型中隐藏层和神经元节点的集合,hn表示第n层隐藏层,nn表示隐藏层hn里有nn个神经元节点。


4.根据权利要求3所述的基于神经网络和树模型的预测模型建立方法,其特征在于,根据预设神经网络模型和预设树模型构建神经网络树模型包括:
将所述预设神经网络模型中输出层的神经元节点、每一层隐藏层的若干...

【专利技术属性】
技术研发人员:孙立锐阮佳程
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1