一种逻辑回归模型的构建方法及系统技术方案

技术编号：20273579 阅读：37 留言：0更新日期：2019-02-02 04:02

本发明专利技术提供了一种逻辑回归模型的构建方法及系统，其中，所述方法包括：获取训练数据集和所述训练数据集对应的分类数据，其中，所述训练数据集中包括多个特征数据；基于预设逻辑函数和所述训练数据集以及所述分类数据，建立待评估函数；在所述待评估函数取最小值时，将所述待评估函数中的自变量作为构建的逻辑回归模型。本申请提供的技术方案，能够提高逻辑回归模型的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种逻辑回归模型的构建方法及系统
本专利技术涉及数据建模
，特别涉及一种逻辑回归模型的构建方法及系统。
技术介绍
传统数据挖掘对象多是结构化、单一对象的小数据集，挖掘更侧重根据先验知识预先人工建立模型，然后依据既定模型进行分析。对于非结构化、多源异构的大数据集的分析，往往缺乏先验知识，很难建立显式的数学模型。目前，为了实现对Spark、Ruby和MapReduce等大数据计算引擎云端无缝集成，并研制高性能通用超级计算引擎系统，往往需要依托于多种数学模型。在这其中，逻辑回归模型由于能够实现数据的分类，越来越受到人们的青睐。然而，当前的逻辑回归模型的精度均不高，无法对数据进行准确分类。
技术实现思路
本申请的目的在于提供一种逻辑回归模型的构建方法及系统，能够提高逻辑回归模型的精度。为实现上述目的，本申请提供一种逻辑回归模型的构建方法，所述方法包括：获取训练数据集和所述训练数据集对应的分类数据，其中，所述训练数据集中包括多个特征数据；基于预设逻辑函数和所述训练数据集以及所述分类数据，建立待评估函数；在所述待评估函数取最小值时，将所述待评估函数中的自变量作为构建的逻辑回归模型。进一步地，建立待评估函数包括：在所述分类数据的取值为1或0的情况下，基于预设逻辑函数计算所述训练数据集中单个特征数据的后验概率；根据所述训练数据集和所述分类数据，计算所述后验概率的极大似然函数；将所述极大似然函数取对数，并将取对数后的结果作为建立的所述待评估函数。进一步地，按照以下公式计算所述训练数据集中单个特征数据的后验概率：p(y|x,θ)＝(hθ(x))y(1-hθ(x))1-y其中...

【技术保护点】
1.一种逻辑回归模型的构建方法，其特征在于，所述方法包括：获取训练数据集和所述训练数据集对应的分类数据，其中，所述训练数据集中包括多个特征数据；基于预设逻辑函数和所述训练数据集以及所述分类数据，建立待评估函数；在所述待评估函数取最小值时，将所述待评估函数中的自变量作为构建的逻辑回归模型。

【技术特征摘要】
1.一种逻辑回归模型的构建方法，其特征在于，所述方法包括：获取训练数据集和所述训练数据集对应的分类数据，其中，所述训练数据集中包括多个特征数据；基于预设逻辑函数和所述训练数据集以及所述分类数据，建立待评估函数；在所述待评估函数取最小值时，将所述待评估函数中的自变量作为构建的逻辑回归模型。2.根据权利要求1所述的方法，其特征在于，建立待评估函数包括：在所述分类数据的取值为1或0的情况下，基于预设逻辑函数计算所述训练数据集中单个特征数据的后验概率；根据所述训练数据集和所述分类数据，计算所述后验概率的极大似然函数；将所述极大似然函数取对数，并将取对数后的结果作为建立的所述待评估函数。3.根据权利要求2所述的方法，其特征在于，按照以下公式计算所述训练数据集中单个特征数据的后验概率：p(y|x,θ)＝(hθ(x))y(1-hθ(x))1-y其中，p(y|x,θ)表示所述后验概率，hθ(x)表示所述预设逻辑函数，θ表示待构建的逻辑回归模型的自变量，x表示训练数据集中的特征数据，y表示所述分类数据，其中，y取值1或0。4.根据权利要求3所述的方法，其特征在于，按照以下公式计算所述后验概率的极大似然函数：其中，L(θ|x,y)表示所述极大似然函数，m表示所述分类数据中数据的总数量。5.根据权利要求2所述的方法，其特征在于，所述待评估函数的最小值利用梯度下降法求解。6.根据权利要求1所述的方法，其特征在于，在构建了所述逻辑回归模型之后，所述方法还包括：获取评价信息集，并利用所述逻辑回归模型对所述评价信息集中的评价样本进行预测；根据预测结果，计算所述逻辑回归模型...

【专利技术属性】
技术研发人员：王军平，
申请(专利权)人：北京赛博贝斯数据科技有限责任公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人