【技术实现步骤摘要】
基于文本语义特征分析的学生思想报告分析系统与方法
本专利技术属于文本数据处理
,尤其涉及一种基于文本语义特征分析的学生思想报告提炼、分析系统与方法。
技术介绍
在社会经济过程中社会不良风气也在不断的滋长,青少年在成长过程中会受到各种因素的影响,加强对青少年思想政治工作的管理,构建良好的社会环境与风气,可以为青少年的健康成长奠定基础。目前,学生的思想政治工作主要是通过学习来进行,并通过学生提交的思想报告来关注其学习成果。然而,由于思想政治教育本身不同于其他科目教育,思想政治课程本身具有自身的严肃性,因此,学生的学习欲望和主动参与性不高,提交的思想报告有时候未能正确反映自身思想动态;更有甚者,会出现大面积相互抄袭,包括随意摘抄网上搜索的内容,而不能客观的报告自身思想动态,从而失去了本身的教育效果。对于这些情况,相关授课老师也大多心里有数,但是由于报告的阅读和评估本身也是比较枯燥和单调的工作,授课老师也无法一一进行并对,导致思想政治工作的教学和追踪效率降低。随着计算机文字和文本数据处理技术的发展,自动评阅和自动文本评估提供了可能。例如,申请号为CN201911129815的中国专利技术专利申请提出一种评价数据处理方法、装置、计算机存储介质和计算机设备;该方法包括:响应于包含员工标识的评价数据处理指令,获取与所述员工标识对应的评价数据;确定与所述员工标识对应的岗位类型,从预先训练好的多个情感判别模型中确定与所述岗位类型对应的情感判别模型;使用所述确定出的情感判别模型对所述评价数据进行处理,得到情 ...
【技术保护点】
1.一种基于文本语义特征分析的学生思想报告提炼与分析系统,所述系统包括报告输入子系统、报告分离子系统、报告存储子系统以及报告评估子系统;/n其特征在于:/n所述报告输入子系统包括光学扫描识别模块和电子文档提交接口;/n所述光学扫描识别模块,用于对提交的纸质学生思想报告进行光学扫描识别,生成纸质学生思想报告扫描识别版本;/n所述电子文档提交接口,用于接收学生提交的电子学生思想报告以及所述纸质学生思想报告扫描识别版本;/n所述报告分离子系统,用于对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理;/n所述报告存储子系统,用于存储所述报告分离子系统对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本;/n所述报告评估子系统,用于基于所述报告存储子系统存储的所述分离内容,对所有所述学生思想报告进行评估。/n
【技术特征摘要】
1.一种基于文本语义特征分析的学生思想报告提炼与分析系统,所述系统包括报告输入子系统、报告分离子系统、报告存储子系统以及报告评估子系统;
其特征在于:
所述报告输入子系统包括光学扫描识别模块和电子文档提交接口;
所述光学扫描识别模块,用于对提交的纸质学生思想报告进行光学扫描识别,生成纸质学生思想报告扫描识别版本;
所述电子文档提交接口,用于接收学生提交的电子学生思想报告以及所述纸质学生思想报告扫描识别版本;
所述报告分离子系统,用于对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理;
所述报告存储子系统,用于存储所述报告分离子系统对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本;
所述报告评估子系统,用于基于所述报告存储子系统存储的所述分离内容,对所有所述学生思想报告进行评估。
2.如权利要求1所述的一种基于文本语义特征分析的学生思想报告提炼与分析系统,其特征在于:
所述光学扫描识别模块,用于对提交的纸质学生思想报告进行光学扫描识别,生成纸质学生思想报告扫描识别版本,具体包括:
分别扫描所述纸质学生思想报告的著录项目段和正文段,得到著录项目段图像和正文段图像;
对于著录项目段图像,采用至少一种图像加密转换算法,生成所述著录项目段图像对应的第一加密身份识别ID;
对于正文段图像,采用至少一种光学字符识别方法获取所述正文段图像对应的至少一个第一字符集合。
3.如权利要求2所述的一种基于文本语义特征分析的学生思想报告提炼与分析系统,其特征在于:
所述报告分离子系统,用于对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理,具体包括:
对于所述电子学生思想报告,通过文档结构识别方法识别出所述电子学生思想报告的著录项目段和正文段;
对于所述电子学生思想报告的著录项目段,采用至少一种摘要加密算法,生成所述电子学生思想报告的著录项目段对应的第二加密身份识别ID;
对于所述电子学生思想报告的正文段,通过与预先配置的关注词数据进行匹配后,生成所述电子学生思想报告的正文段对应的至少一个第二字符集合。
4.如权利要求3所述的一种基于文本语义特征分析的学生思想报告提炼与分析系统,其特征在于:
所述报告存储子系统,用于存储所述报告分离子系统对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本,具体包括:
所述报告存储子系统包括第三著录ID数据库和第四字符集合数据库;
将所述第一加密身份识别ID与所述第一字符集合建立第一映射关系;
将所述第二加密身份识别ID与所述第二字符集合建立第二映射关系;
将所述第一加密身份识别ID、第二加密身份识别ID、第一映射关系以及第二映射关系存储至所述第三著录ID数据库;
将所述第一字符集合和所述第二字符集合存储至所述第四字符集合数据库。
5.如权利要求3所述的一种基于文本语义特征分析的学生思想报告提炼与分析系统,其...
【专利技术属性】
技术研发人员:张敏敏,
申请(专利权)人:江苏安全技术职业学院,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。