System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种网络成瘾特征选择方法及网瘾预测方法技术_技高网

一种网络成瘾特征选择方法及网瘾预测方法技术

技术编号:41289631 阅读:11 留言:0更新日期:2024-05-11 09:39
本发明专利技术公开了一种网络成瘾特征选择方法及网瘾预测方法,网络成瘾特征选择方法,包括:获取网络成瘾的特征数据,得到网络成瘾的特征集;计算特征的信息增益和信息增益比;对信息增益算法和信息增益比算法整合,计算信息增益平均值,对信息增益值大于信息增益平均值的特征采用信息增益比对特征进行排序,对信息增益值小于信息增益平均值的特征采用信息增益对特征进行排序,对特征进行评估,获取最优特征子集。提出整合信息增益和信息增益比的特征选择方法,训练SVM算法分类器,实现适用于低年级同学的网瘾预测,做到早发现早预防。特别地,提出的整合信息增益和信息增益比的特征选择方法,避免过拟合问题,提高分类器预测准确率。

【技术实现步骤摘要】

本专利技术属于人工智能,本专利技术涉及一种网络成瘾特征选择方法及网瘾预测方法


技术介绍

1、随着互联网时代的不断深化,长期沉迷网络对于人们社会生活的影响不断加剧。互联网在提供给人民便利的同时,也蕴藏着巨大的潜在风险。随着我国高校的扩招,高校管理难度增加,其中网瘾成为学生学业问题重要因素之一。分析高校学生网瘾及影响因素,对高校学生提供早期预警,并为有针对性个体化干预治疗提供因素相关重要依据已经成为当前高校管理迫切需求。

2、guangming li等在中国学生网络成瘾及其相关危险因素的研究中,对1033名中国学生的抑郁、焦虑、性别、肥胖进行了调查研究,表明在网络成瘾的干预措施中考虑抑郁、焦虑以及性别的重要性。刘奕蔓等在通过meta分析发现我国大学生网瘾与生源地、专业满意程度、学习成绩和所在地区密切相关。谢晓娟等人调查了150名网瘾学生和150名非网瘾学生的一般自我效能感、父母教育方式,对支持的利用度、感觉寻求等方面进行了调查,发现一般自我效能感和社会支持是网络成瘾的危险因素。张金健等人追踪研究大学生社交恐惧与网络成瘾的关系中,发现这两者之间存在双向关系。傅春长等人在探究网络成瘾、社会支持与孤独感这三者的关系时,发现网瘾存在性别差异和孤独感在其余两者之间起到了中介作用。燕春婷等人在了解大连市未成年人网络使用现状,发现父母文化水平低、吸烟饮酒、农村、家长打骂、看电视时间长是网络成瘾的主要危险因素。

3、国内外研究学者关于网络成瘾的研究主要集中基于心理学理论的诊断,存在两个主要问题:

4、1、心理学理论诊断只能诊断是否网络成瘾,而不能提前预测网络成瘾可能性。

5、2、上述研究发现了与网瘾密切相关的特征,特别地,成绩作为与网瘾密切相关的特征,特点是取值较多,传统的信息增益特征选择方法倾向于取值较多的特征,这将导致过拟合问题,从而降低分类性能。


技术实现思路

1、本专利技术的目的在于提供一种网络成瘾特征选择方法及网瘾预测方法,提出整合信息增益和信息增益比的特征选择方法,训练svm算法分类器,实现适用于低年级同学的网瘾预测,做到早发现早预防。特别地,提出的整合信息增益和信息增益比的特征选择方法,避免过拟合问题,提高分类器预测准确率。

2、实现本专利技术目的的技术解决方案为:

3、一种网络成瘾特征选择方法,包括以下步骤:

4、s01:获取网络成瘾的特征数据,得到网络成瘾的特征集;

5、s02:计算特征的信息增益和信息增益比;

6、s03:对信息增益算法和信息增益比算法整合,计算信息增益平均值,对信息增益值大于信息增益平均值的特征采用信息增益比对特征进行排序,对信息增益值小于信息增益平均值的特征采用信息增益对特征进行排序,对特征进行评估,获取最优特征子集。

7、优选的技术方案中,所述网络成瘾的特征数据包括学生成绩、人口学问卷、个体行为问卷、社会关系问卷和网瘾诊断调查问卷。

8、优选的技术方案中,所述步骤s02中计算特征的信息增益和信息增益比的方法包括:

9、选择全部特征集d,计算d的经验熵:

10、

11、其中,|y|代表样本总数,|dk|代表类别k的样本个数;

12、计算特征a对特征集d的经验条件熵:

13、

14、对于特征集d,将特征a作为随机变量,特征a有v个不同的取值,征a按照不同取值对样本集d划分v个数据子集,第v个数据子集为dv,dvk为数据子集dv中类别为k的样本个数;

15、计算特征a对于特征集d的信息增益:

16、gains(d,a)=h(d)-h(d|a)

17、计算信息增益比:

18、gainsr=gains(d,a)/ha(d)

19、其中,ha(d)为特征集d关于a的信息熵。

20、优选的技术方案中,所述信息增益平均值为所有特征的信息增益与特征数的比值:

21、

22、其中,特征集为{a1,a2,……at},特征总数为t。

23、优选的技术方案中,获取最优特征子集的方法包括,分别选择选取排名靠前的一定数量的特征作为特征子集,训练不同的svm模型,计算不同的svm模型的准确性,根据准确性获得最优svm模型,对应的特征子集即为最优特征子集。

24、本专利技术还公开了一种网络成瘾特征选择系统,其特征在于,采用上述任一项所述的网络成瘾特征选择方法实现。

25、本专利技术又公开了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被执行时实现上述任一项所述的网络成瘾特征选择方法。

26、本专利技术又公开了一种网瘾预测方法,包括以下步骤:

27、s11:获取网络成瘾的特征数据;

28、s12:采用上述任一项所述的网络成瘾特征选择方法进行特征选择,构建特征子集;

29、s13:对特征子集采用svm算法训练分类器,预测网瘾可能性。

30、本专利技术又公开了一种网瘾预测系统,包括:

31、网络成瘾特征数据获取模块,获取网络成瘾的特征数据;

32、特征子集构建模块,采用上述任一项所述的网络成瘾特征选择方法进行特征选择,构建特征子集;

33、网瘾预测模块,对特征子集采用svm算法训练分类器,预测网瘾可能性。

34、本专利技术与现有技术相比,其显著优点为:

35、1、本专利技术以学生成绩、人口学、个体行为、社会关系和网瘾诊断调查问卷为特征数据,提出整合信息增益和信息增益比的特征选择方法,计算信息增益平均值,对信息增益值大于信息增益平均值的特征采用信息增益比,对信息增益值小于信息增益平均值的特征采用信息增益,从而获取有效特征集,分别选取排名靠前的作为特征子集,用该子集进行分类来提高识别准确率,并将其应用在网瘾预测问题上,训练svm算法分类器,实现适用于低年级同学的网瘾预测。提升网瘾预测准确率,同时提供网瘾问题的影响因素分析,为网瘾问题早期干预提供方向。

36、2、特别地,提出的整合信息增益和信息增益比的特征选择方法,避免过拟合问题,提高分类器预测准确率。

本文档来自技高网...

【技术保护点】

1.一种网络成瘾特征选择方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的网络成瘾特征选择方法,其特征在于,所述网络成瘾的特征数据包括学生成绩、人口学问卷、个体行为问卷、社会关系问卷和网瘾诊断调查问卷。

3.根据权利要求1所述的网络成瘾特征选择方法,其特征在于,所述步骤S02中计算特征的信息增益和信息增益比的方法包括:

4.根据权利要求1所述的网络成瘾特征选择方法,其特征在于,所述信息增益平均值为所有特征的信息增益与特征数的比值:

5.根据权利要求1所述的网络成瘾特征选择方法,其特征在于,获取最优特征子集的方法包括,分别选择选取排名靠前的一定数量的特征作为特征子集,训练不同的SVM模型,计算不同的SVM模型的准确性,根据准确性获得最优SVM模型,对应的特征子集即为最优特征子集。

6.一种网络成瘾特征选择系统,其特征在于,采用权利要求1-5任一项所述的网络成瘾特征选择方法实现。

7.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现权利要求1-5任一项所述的网络成瘾特征选择方法。

8.一种网瘾预测方法,其特征在于,包括以下步骤:

9.一种网瘾预测系统,其特征在于,包括:

...

【技术特征摘要】

1.一种网络成瘾特征选择方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的网络成瘾特征选择方法,其特征在于,所述网络成瘾的特征数据包括学生成绩、人口学问卷、个体行为问卷、社会关系问卷和网瘾诊断调查问卷。

3.根据权利要求1所述的网络成瘾特征选择方法,其特征在于,所述步骤s02中计算特征的信息增益和信息增益比的方法包括:

4.根据权利要求1所述的网络成瘾特征选择方法,其特征在于,所述信息增益平均值为所有特征的信息增益与特征数的比值:

5.根据权利要求1所述的网络成瘾特征选择方法,其特征在于,获取最优...

【专利技术属性】
技术研发人员:王颖汝吉东刘永俊
申请(专利权)人:常熟理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1