【技术实现步骤摘要】
在线课程平台评论数据处理系统
[0001]本专利技术涉及数据处理
,尤其涉及在线课程平台评论数据处理系统。
技术介绍
[0002]数据处理系统主要针对在线课程平台搜集数据集,并整理网络开源的有极性标注的数据集,设计针对在线课程平台的爬虫获取数据集,完成数据集清洗并持久化存储以后安排项目组成员进行数据集标注,还有必要借助于独立的项目组外的成员对数据集的标注进行核验,确保数据集满足统计有效性。
[0003]现有的数据处理系统存在不同的在线课程平台不是独立同分布,每门课程之间不设有关联,会进行相互影响,从而影响评论数据的处理效率,因此具有待改进的空间。
技术实现思路
[0004]本专利技术的目的是为了解决现有技术中存在的缺点,而提出的在线课程平台评论数据处理系统。其优点在于不同的在线课程平台独立同分布,每门课程之间设有关联,不会进行相互影响,提高了评论数据的处理效率。
[0005]为了实现上述目的,本专利技术采用了如下技术方案:在线课程平台评论数据处理系统,包括数据集采集模块、数据处理模块、数 ...
【技术保护点】
【技术特征摘要】
1.在线课程平台评论数据处理系统,其特征在于,包括数据集采集模块、数据处理模块、数据标注模块、特征库挖掘模块、框架设计模块和工具部署模块,所述数据集采集模块通过信号线与数据处理模块相连接,所述数据处理模块通过信号线与数据标注模块相连接,所述数据标注模块通过信号线与特征库挖掘模块相连接,所述特征库挖掘模块通过信号线与框架设计模块相连接,所述框架设计模块通过信号线与工具部署模块相连接。2.根据权利要求1所述的在线课程平台评论数据处理系统,其特征在于,所述数据集采集模块包括数据集采集单元,且数据集采集单元用于以慕课网为数据源,设计爬虫,从该平台采集数据。3.根据权利要求2所述的在线课程平台评论数据处理系统,其特征在于,所述数据处理模块包括数据清洗单元和数据可视化单元,且数据清洗单元用于实现自动化的数据清洗,所述数据可视化单元用于将清洗后的数据进行可视化,初步展示课程评论数据集。4.根据权利要求3所述的在线课程平台评论数据处理系统,其特征在于,所述数据标注模块包括数据标注单元,且数据标注单元采用两个团队分别对持久化的网络评论数据进行标注,一组采用项目组内成员,另外一组采用项目组外成员,引入统计分析工具,只有达到置信度为95%以上的情况下,完成数据的标注,在标注的过程中,针对具体问题确定合理的标注策略。5.根据权利要求4所述的在线课程平台评论数据处理系统,其特征在于,所述特征库挖掘模块包括用户量挖掘单元、评论数据挖掘单元、登陆时间挖掘单元和专利设置挖掘单元,所述特征库挖掘...
【专利技术属性】
技术研发人员:曲豫宾,李芳,
申请(专利权)人:江苏工程职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。