一种基于个人用户画像的产废量预测方法技术

技术编号:35229033 阅读:32 留言:0更新日期:2022-10-15 10:49
一种基于个人用户画像的产废量预测方法,它涉及一种产废量预测方法。本发明专利技术为了解决目前对个体用户产废量分析缺乏对个体特征和生活垃圾产量之间定量分析的问题。本发明专利技术的步骤为:步骤一、收集用户原始数据;步骤二、对步骤一中收集的用户原始数据进行分析和研究,并论证其可靠性;步骤三、数据预处理;步骤四、用户个人特征与产废量相关性分析;步骤五、决策树模型输入特征的筛选;步骤六、建立个人产废量用户画像决策树模型;步骤七、基于个人用户画像的生活垃圾产量预测。本发明专利技术属于环境保护领域。域。域。

【技术实现步骤摘要】
一种基于个人用户画像的产废量预测方法


[0001]本专利技术涉及一种产废量预测方法,属于环境保护领域。

技术介绍

[0002]随着大数据技术在各个领域的不断应用,数据服务行业日渐兴起,“数据服务指提供数据采集、数据传输、数据存储、数据处理(包括计算、分析、可视化等)、数据交换、数据销毁等数据各种生存形态演变的一种信息技术驱动的服务。数据服务应用的关键在于通过获取用户数据建立相应的数据分析模型,分析不同顾客的行为偏好并据此制定不同的管理策略。为了更好地呈现出不同用户的偏好,在刻画用户行为偏好的过程中,用到了一种主流模型——用户画像。
[0003]机器学习是大数据技术的重要应用工具,它用计算机和算法从“数据”中学习并发现“模式和洞察”,因为在许多情况下,“模式和洞察”就隐藏在“数据”之中。随着时代发展,从业务流程中积累的数据对人类来说理解起来可能非常复杂,然而算法却能够比人更快、更准确地从数据中挖掘出“模式和洞察”。
[0004]为了更好的实现垃圾的收集、运输和处理,垃圾产量和种类的预测十分必要,目前国外学者研究方向较多在社会因素对垃圾产量的影响,通过对垃圾回收利用、生命周期评价的研究,致力于搭建循环经济体系;国内学者的研究多集中在对内在因素和个体因素上,各学者对内在因素的分析主要运用模型和算法建立产废量与城市人口、城市规模、经济发展之间的联系,继而对垃圾产生量进行预测;对个体因素的研究主要集中在家庭人口分布、受教育程度、职业、收入对垃圾产量和组分的影响,大多为定性研究,缺少对个体特征和生活垃圾产生量之间的定量分析。
[0005]人物特征与其产生垃圾的种类和数量应具有一定的联系,为了深入探讨他们之间的关系,本方法引入人物画像概念,通过对人物特征信息(年龄、性别、性格特征、收入、产废量)的问卷调研,基于python分析工具分析其关联性,运用机器学习中的决策树分类算法,以产废量为基础对不同群体进行聚类,形成不同产废量下的人物画像图谱。并以此为基础,预测某地区不同类别(餐厨垃圾和其它垃圾)的垃圾产生量,为地区垃圾总量的精准预测提供更多的数据、方法和模型。

技术实现思路

[0006]本专利技术为解决目前对个体用户产废量分析缺乏对个体特征和生活垃圾产量之间定量分析的问题,进而提出一种基于个人用户画像的产废量预测方法。
[0007]本专利技术为解决上述问题采取的技术方案是:本专利技术的具体步骤为:
[0008]步骤一、收集用户原始数据;
[0009]步骤二、对步骤一中收集的用户原始数据进行分析和研究,并论证其可靠性;
[0010]步骤三、数据预处理;
[0011]步骤四、用户个人特征与产废量相关性分析;
[0012]步骤五、决策树模型输入特征的筛选;
[0013]步骤六、建立个人产废量用户画像决策树模型;
[0014]步骤七、基于个人用户画像的生活垃圾产量预测。
[0015]进一步的,步骤一中用户原始数据包括年龄、性别、兴趣爱好、性格特征、收入以及用户产生的餐厨垃圾和其他垃圾量。
[0016]进一步的,步骤二中对调研人的基本信息如分布地区、性别比例和年龄占比情况分别进行统计分析,以了解信息的分布规律情况,并证明所收集的数据是随机抽样的结果,样本数据可以被认为是整体的代表。
[0017]进一步的,步骤三对获取到的数据进行预处理,包括数据的清洗、异常值的去除、数据离散化、语义转换、编码处理等。
[0018]进一步的,步骤四中挖掘对生活垃圾产废量影响较大的特征,对特征之间与特征及垃圾产量之间进行相关性分析,挖掘相关关系较高的参数,从而为下一步建模中选用的最优特征提供参考。
[0019]进一步的,步骤五中采用机器学习的方法进一步确定最优特征,将相关系分析方法的结果和机器学习的结果联合确定决策树最优输入特征,最终确定最优特征为7个:用户的年龄、受教育程度、年收入、家庭成员数、兴趣爱好、每周健身次数、性格特征。
[0020]进一步的,步骤六中采用机器学习决策树模型实现餐厨垃圾及其他垃圾这两类生活垃圾产量用户画像的构建,生活垃圾总量为餐厨垃圾及其他垃圾的总和;
[0021]模型的建立分为二个步骤:模型的训练和模型的验证:通过模型输入特征和输出垃圾产量的训练,得到决策树模型结构;并验证该模型的准确率,若准确率达标,个人产废用户画像决策树模型建立完成。
[0022]进一步的,步骤七中在研究区域内收集新的数据,利用已建立的决策树模型预测个人及对应区域产生垃圾的量,包括餐厨垃圾、其他垃圾和总垃圾,对预测结果进行综合评价和分析。
[0023]本专利技术的有益效果是:本专利技术实现了个人尺度生活垃圾日产量的预测,以及基于个人预测结果的居民区生活垃圾日产量预测。在数据量爆炸的当今时代,居民的个人信息获取变得更加方便且完善。在目前垃圾产量预测有明显不足的情况下,通过合理使用这些个人信息,可以有利于实现每个个体生活垃圾日产量的预测,从而获取更大范围(地区)的预测结果。
[0024]以往研究个人用户画像一般只考虑个人的基础信息特征,比如性别、年龄、收入等,本专利技术在个人基础信息的基础上,添加了个人的社会学特征,比如兴趣爱好、性格特征等,从更多的视角和特征研究对产废模式产生影响的因素,并根据优选的特征对产废量进行了定量的预测,为提高垃圾产量的预测提供了方法论。
[0025]同时该方法利用机器学习算法提高了人类对大数据理解的能力,更准确地从数据中挖掘出“模式和洞察”,对产废影响因素(特征)的精准分析、因素与产废预测量之间的协同影响进行了更加深入的分析,为个人和地区产废量的精准预测提供更多的数据、方法和模型。
附图说明
[0026]图1是本专利技术的流程框图。
具体实施方式
[0027]具体实施方式一:结合图1说明本实施方式,本实施方式所述一种基于个人用户画像的产废量预测方法的具体步骤如下:
[0028]步骤一、收集用户原始数据;
[0029]步骤二、对步骤一中收集的用户原始数据进行分析和研究,并论证其可靠性;
[0030]步骤三、数据预处理;
[0031]步骤四、用户个人特征与产废量相关性分析;
[0032]步骤五、决策树模型输入特征的筛选;
[0033]步骤六、建立个人产废量用户画像决策树模型;
[0034]步骤七、基于个人用户画像的生活垃圾产量预测。
[0035]具体实施方式二:结合图1说明本实施方式,本实施方式所述一种基于个人用户画像的产废量预测方法的步骤一中用户原始数据包括年龄、性别、兴趣爱好、性格特征、收入以及用户产生的餐厨垃圾和其他垃圾量。
[0036]具体实施方式三:结合图1说明本实施方式,本实施方式所述一种基于个人用户画像的产废量预测方法的步骤二中对调研人的基本信息如分布地区、性别比例和年龄占比情况分别进行分析,以了解信息的分布规律情况,并证明所收集的数据是随机抽样的结果,样本数据可以被认为是整体的代表。
[0037本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于个人用户画像的产废量预测方法,其特征在于:所述一种基于个人用户画像的产废量预测方法的具体步骤如下:步骤一、收集用户原始数据;步骤二、对步骤一中收集的用户原始数据进行分析和研究,并论证其可靠性;步骤三、数据预处理;步骤四、用户个人特征与产废量相关性分析;步骤五、决策树模型输入特征的筛选;步骤六、建立个人产废量用户画像决策树模型;步骤七、基于个人用户画像的生活垃圾产量预测。2.根据权利要求1所述的一种基于个人用户画像的产废量预测方法,其特征在于:步骤一中用户原始数据包括年龄、性别、兴趣爱好、性格特征、收入以及用户产生的餐厨垃圾和其他垃圾量。3.根据权利要求1所述的一种基于个人用户画像的产废量预测方法,其特征在于:步骤二中对调研人的基本信息如分布地区、性别比例和年龄占比情况分别进行统计分析,以了解信息的分布规律情况,并证明所收集的数据是随机抽样的结果,样本数据可以被认为是整体的代表。4.根据权利要求1所述的一种基于个人用户画像的产废量预测方法,其特征在于:步骤三对获取到的数据进行预处理,包括数据的清洗、异常值的去除、数据离散化、语义转换、编码处理等。5.根据权利要求1所述的一种基于个人用户画像的产废量预测方法,其特征在于:步骤四中...

【专利技术属性】
技术研发人员:赵英郭亮关明刘冬梅
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1