基于深度学习在线教育学生综合画像标签管理系统技术方案

技术编号:18862987 阅读:32 留言:0更新日期:2018-09-05 15:14
基于深度学习在线教育学生综合画像标签管理系统,包括数据采集单元、数据预处理单元、画像标签提炼单元,以及成果输出与展现单元;对学生学习内容、行为、态度、体征和成果数据,采用埋点技术,脑波采集技术,视点追踪技术,图像识别技术,文本挖掘技术和深度学习算法,将从多个数据源采集获取到的数据进行数据整合、数据审核与清洗;从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系;将画像标签成果,以恰当的逻辑和可视化方式进行展现和场景应用。对学生群体与个体层级能力的科学评定,以系统的方式实现对学生群体与个体层级能力的科学评定与展现,有效地指导学生培养方案与教学内容计划的优化与提升。

Online student comprehensive image label management system based on deep learning

Based on in-depth learning, online education students'comprehensive portrait label management system includes data acquisition unit, data pre-processing unit, portrait label extraction unit, as well as output and display unit; for students' learning content, behavior, attitude, physical signs and results data, using embedded technology, brain wave acquisition technology, viewpoint tracking Tracer technology, image recognition technology, text mining technology and in-depth learning algorithm, data integration, data audit and cleaning of data collected from multiple data sources, screening important dimension information from basic data, extracting representative portrait labels, and forming a complete top-down label system. Signing results and displaying them in proper logic and visualization. The scientific evaluation of students'group and individual level abilities can be carried out in a systematic way, which can effectively guide the optimization and promotion of students' training programs and teaching content plans.

【技术实现步骤摘要】
基于深度学习在线教育学生综合画像标签管理系统
本专利技术属于IPC分类中G06F电数字数据处理或G06Q专门适用于教育预测目的的数据处理系统或方法中的画像标签技术,涉及网络埋点、图像识别、文本挖掘、深度学习等领域,尤其是基于深度学习在线教育学生综合画像标签管理系统。
技术介绍
在线教育即e-Learning,或称远程教育、在线学习,现行概念中一般指的是指一种基于网络的学习行为,与网络培训概念相似。埋点技术是网站分析的一种常用的数据采集方法,它通过在网站页面关键位置植入多段代码,追踪用户在平台每个界面上的系列行为,事件之间相互独立。可以用于建立用户画像,还原用户行为模型。文本挖掘技术是指对文本的表示及其特征项的选取,是文本挖掘、信息检索中的基本问题。它将无结构的原始文本转化为结构化的计算机可以识别和处理的信息,从而建立数学模型来描述和代替文本,最终实现从大量文本中挖掘有效信息的目的。文本语义分析是识别文本主题、类别与意义等语义信息的过程,在自然语言处理、信息过滤、信息分类、信息检索、语义挖掘等领域都普遍应用。图像识别技术,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。它将无结构的图像识别成具体结构化的计算机可以识别和处理的信息。图像识别用视觉传感器或摄像头和计算机来模拟人眼和大脑,进行物体识别、跟踪和测量,进而做图形处理让计算机理解真实世界。图像识别技术有很多应用场景,如:人脸识别、拍照识别、物体识别等各种图像场景的识别。深度学习技术具有分布式特征表达、自动特征提取、端到端机器学习和良好的泛化能力等优势,在语音识别、图像识别和自然语言处理等很多领域得到令人瞩目的成功应用。同时其强大的归纳能力也使得其在标签提炼等问题上有着非常优异的效果。例如,训练分类判别模型,需大量的样本数据多次迭代训练,数据须具有判别对象的基本特征,有不同的背景角度区分,数据样本越丰富,模型的识别精度越高。相关专利文献公开较少。例如:中国专利申请201510944668.6提出一种基于大数据的用户画像建立方法和用户画像管理系统,其利用有效时间期限内的用户行为和/或内容建立一个临时用户画像,并且使该临时用户画像从用户画像当中继承与有效时间期限内的用户行为和/或内容相匹配的描述性标签属性,而当有效时间期限内的用户行为和/或内容与用户画像的描述性标签属性不匹配时,则在临时用户画像中新建描述性标签属性。本专利技术能够实现根据用户行为和/或内容数据对用户画像的有效维护,特别是在用户行为和/或内容发生阶越式突变的情况下,能够快速淘汰分布统计规律上占有优势但已经不符合用户当前内容和行为的累积数据的影响。中国专利申请201510965619.0提出一种用户画像构建方法,首先通过分布式爬虫爬取互联网各类数据并融合打通形成海量知识库;然后获取的上网日志并将上网日志与知识库进行匹配生成用户基础标签;结合电信运营商特有的客户关系管理(CRM)数据及地理位置数据构建用户属性标签;对标签数据进行权重及衰减因子处理生成用户基础画像,并且可以结合行业用户的特征及行业客户数据做个性化的数据挖掘,生成符合行业应用的用户画像并对外提供服务。本专利技术的优点在于能够为客户提供精确的全网用户画像,充分利用互联网数据,为用户分析、产品推荐、精准营销等应用服务提供方便。中国专利申请201510564860.2公开了一种构建用户画像的方法。其中,构建用户画像的方法包括:获取用户互联网上网日志数据并进行预处理,对预处理后的互联网上网日志数据进行特征提取,得到用户的属性特征,然后基于已建立的多维特征库训练的标签分类,根据用户的属性特征在多维特征库中进行匹配,得到用户的多维度属性标签,根据多维度属性标签构建用户画像。通过上述方式,本专利技术能够构建出全息的多维度用户画像,从而能够满足运营商/企业/公司快速精准广告投放和用户群体的消费行为的推荐。中国专利申请201611162106.7提供了一种用于在线教育及合成教学多媒体对象的方法和系统。该用于合成教学多媒体对象的方法包括:根据教学对象的个性化需求信息从多媒体资源库中选择多个多媒体资源;利用所述多个多媒体资源合成教学多媒体对象。根据教学对象的个性化需求信息从多媒体资源库中选择多个多媒体资源并合成教学多媒体对象,可以针对教学对象的实际需求灵活合成及提供个性化的教学多媒体,从而使教学对象能够更方便地进行针对性学习,为用户带来了更好的体验。中国专利申请201510054208.6提供了一种在线教育测评系统,包括:知识图谱单元,包含一个或多个知识点,及所述一个或多个知识点间的关联关系;试题单元,包括一个或多个待测试题,每一所述待测试题与所述知识点中的一个或多个绑定,并根据每一所述待测试题与所述知识点的联系确定每一所述待测试题的权重值;测评单元,根据所述权重值从所述待测试题中选择部分或全部待测试题作为测评试题,并交由被测评者测评;结果生成单元,根据所述被测评者的测评结果生成一测评结果报告。采用上述技术方案后,可将测试的知识点间的关系图谱化,并在最终的测评报告中显示出被测评者在哪些知识点掌握不够。当前教育领域的数据虽然繁多,但孤岛效益明显,缺乏对学生系统的刻画与评估。
技术实现思路
本专利技术的目的是提供基于深度学习在线教育学生综合画像标签管理系统,以解决上述不足,能够支撑面向学生群体与个体层级能力的科学评定与展现,进而有效地指导学生培养方案与教学内容计划的优化与提升。本专利技术的目的将通过以下技术措施来实现:基于深度学习在线教育学生综合画像标签管理系统,包括依次连接的数据采集单元、数据预处理单元、画像标签提炼单元,以及成果输出与展现单元;其中:1)所述数据采集单元用于从多个数据源进行数据的采集获取与存储,具体包括:a.数据采集单元利用埋点技术采集学生线上平台行为路径与行为内容等信息并存储;b.数据采集单元利用脑波采集技术采集学生在线下学习过程中的大脑活动状态等信息并存储;c.数据采集单元利用视点追踪技术采集学生在线下学习过程中的目光焦点位置等信息并存储。2)所述数据预处理单元将采集获取到的数据进行数据整合,数据审核与清洗,具体包括:a.数据整合,基于身份证号或学籍号统一标识,将以上采集多源异构数据进行横向融合;b.数据清洗,针对以上采集数据进行完整性和有效性审核,剔除或调整其中的无效值与异常值;3)所述画像标签提炼单元用于从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系,具体包括:a.利用深度学习技术,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签并存储;b.利用图像识别技术将学生在线下学习过程中的目光焦点位置与浏览内容进行匹配,锁定学生学习的重点关注内容与浏览行为模式,结合对脑波状态的解读,提炼包括学生注意力水平,学生视点稳定性在内的线下学习状态标签并存储;c.利用文本挖掘技术针对学生线上线下评论进行中文分词、互信息计算、主题内容提炼,提炼学生评论的目标对象、情感倾向与内容要点,形成学生主观态度标签并存储;d.利用数据挖掘技术对各类标签进行分类与上层归纳提炼,形成自上而下的完整标签体系;4)所述成果输出与展现单元用于将画像标本文档来自技高网
...

【技术保护点】
1.基于深度学习在线教育学生综合画像标签管理系统,包括数据采集单元、数据预处理单元、画像标签提炼单元,以及成果输出与展现单元;其特征在于,a.从多个数据源进行数据的采集获取与存储;b.将采集获取到的数据进行数据整合、数据审核与清洗;c.从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系;d.将画像标签成果,以恰当的逻辑和可视化方式进行展现和场景应用。

【技术特征摘要】
1.基于深度学习在线教育学生综合画像标签管理系统,包括数据采集单元、数据预处理单元、画像标签提炼单元,以及成果输出与展现单元;其特征在于,a.从多个数据源进行数据的采集获取与存储;b.将采集获取到的数据进行数据整合、数据审核与清洗;c.从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系;d.将画像标签成果,以恰当的逻辑和可视化方式进行展现和场景应用。2.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于,从多个数据源进行数据的采集获取与存储,包括:a.利用埋点技术采集学生线上平台行为路径与行为内容等信息并存储;b.利用脑波采集技术采集学生在线下学习过程中的大脑活动状态等信息并存储;c.利用视点追踪技术采集学生在线下学习过程中的目光焦点位置等信息并存储。3.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统其特征在于,将采集获取到的数据进行数据整合、数据审核与清洗,包括:a.数据整合,基于身份证号或学籍号统一标识,将以上采集多源异构数据进行横向融合;b.数据清洗,针对以上采集数据进行完整性和有效性审核,剔除或调整其中的无效值与异常值。4.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于,从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系,包括:a.利用深度学习技术,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签并存储;b.利用图像识别技术将学生在线下学习过程中的目光焦点位置与浏览内容进行匹配,锁定学生学习的重点关注内容与浏览行为模式,结合对脑波状态的解读,提炼包括学生注意力水平,学生视点稳定性在内的线下学习状态标签并存储;c.利用文本挖掘技术针对学生线上线下评论进行中文分词、互信息计算、主题内容提炼,提炼学生评论的目标对象、情感倾向与内容要点,形成学生主观态度标签并存储;d.利用数据挖掘技术对各类标签进行分类与上层归纳提炼,形成自上而下的完整标签体系。5.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于:将画像标签成果,以恰当的逻辑和可视化方式进行展现和场景应用,包括:a.利用数据可视化技术选择体系中的代表性画像标签,以折线图,柱状图,散点图,饼图,地图,热力图,关系图,漏斗图,仪表盘等在内的各种形式,结合表与文字,进行综合化、立体化呈现;b.将标签开放为可选项,支持用户通过对标签的筛选与组合,锁定特定学生群体,进行定向的辅导优化与策略制定。6.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于:使用方法包括九个步骤,步骤1至步骤4对应数据采集单元,步骤5至步骤7对应数据预处理单元,步骤8对应画像标签提炼单元,步骤9对应成果输出与展现单元,其中:步骤1:对线上行为进行埋点采集;利用埋点技术采集学生线上平台行为路径与行为内容等信息;步骤2:对脑波状态尽心该脑波采集;利用脑波采集技术采集学生在线下学习过程中的大脑活动状态等信息;步骤3:对视点轨迹进行视点轨迹采集;利用视点追踪技术采集学生在线下学习过程中的目光焦点位置等信息;步骤4:对原始数据进行数据预处理;基于身份证号或学籍号类统一标识,将采集到的多源异构数据进行横向融合;同时进行完整性和有效性审核,剔除或调整其中的无效值与异常值;步骤5:基于基础数据集市中的线上学习模式进行深度学习处理;利用深度学习技术,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签;步骤6:基于基础数据集市中的线下...

【专利技术属性】
技术研发人员:肖君王宏余晔王腊梅蔡朔
申请(专利权)人:上海开放大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1