基于文本语义特征分析的学生思想报告分析系统与方法技术方案

技术编号:26924542 阅读:20 留言:0更新日期:2021-01-01 22:50
本发明专利技术提出基于文本语义特征分析的学生思想报告提炼、分析系统与方法。系统包括报告输入子系统、报告分离子系统、报告存储子系统以及报告评估子系统,方法包括基于所述系统实现的电子学生思想报告提炼方法、纸质学生思想报告提炼方法以及学生思想报告分析方法。光学扫描识别模块对提交的纸质学生思想报告进行光学扫描识别生成纸质学生思想报告扫描识别版本;报告分离子系统用于所述电子学生思想报告进行报告内容分离处理;报告存储子系统用于存储分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本;报告评估子系统用于对所有所述学生思想报告进行评估。本发明专利技术的技术方案能够自动化的快速实现学生思想报告的分析和评估。

【技术实现步骤摘要】
基于文本语义特征分析的学生思想报告分析系统与方法
本专利技术属于文本数据处理
,尤其涉及一种基于文本语义特征分析的学生思想报告提炼、分析系统与方法。
技术介绍
在社会经济过程中社会不良风气也在不断的滋长,青少年在成长过程中会受到各种因素的影响,加强对青少年思想政治工作的管理,构建良好的社会环境与风气,可以为青少年的健康成长奠定基础。目前,学生的思想政治工作主要是通过学习来进行,并通过学生提交的思想报告来关注其学习成果。然而,由于思想政治教育本身不同于其他科目教育,思想政治课程本身具有自身的严肃性,因此,学生的学习欲望和主动参与性不高,提交的思想报告有时候未能正确反映自身思想动态;更有甚者,会出现大面积相互抄袭,包括随意摘抄网上搜索的内容,而不能客观的报告自身思想动态,从而失去了本身的教育效果。对于这些情况,相关授课老师也大多心里有数,但是由于报告的阅读和评估本身也是比较枯燥和单调的工作,授课老师也无法一一进行并对,导致思想政治工作的教学和追踪效率降低。随着计算机文字和文本数据处理技术的发展,自动评阅和自动文本评估提供了可能。例如,申请号为CN201911129815的中国专利技术专利申请提出一种评价数据处理方法、装置、计算机存储介质和计算机设备;该方法包括:响应于包含员工标识的评价数据处理指令,获取与所述员工标识对应的评价数据;确定与所述员工标识对应的岗位类型,从预先训练好的多个情感判别模型中确定与所述岗位类型对应的情感判别模型;使用所述确定出的情感判别模型对所述评价数据进行处理,得到情感判别序列;获取与所述员工标识对应的绩效等级对照表,查询所述绩效等级对照表,确定与所述情感判别序列对应的绩效等级信息。通过该专利技术,能够更准确地对员工相关的绩效总结文本即评价数据进行判别,有利于提高对员工绩效等级的评估准确性;此外,申请号为CN201710908163的中国专利技术专利申请提出一种评价观点抽取的方法及装置,包括:对待抽取文本进行切词处理,得到多个切词序列;根据语义特征信息对每个切词序列进行特征化处理,得到每个切词序列对应的切词序列特征向量;将每个切词序列特征向量输入到评价观点抽取模型进行评价观点的抽取,评价观点抽取模型是通过训练文本集对应的训练切词序列特征向量以及训练切词序列中评价观点词的标注对深度神经网络模型进行训练得到的;根据评价观点抽取模型的输出结果确定待抽取文本中的评价观点词,评价观点词包括属性词以及评价词。然而,对于学生思想政治报告的自动评阅和分析,现有技术并未提出有效的技术方案。
技术实现思路
为解决上述技术问题,本专利技术提出基于文本语义特征分析的学生思想报告提炼、分析系统与方法。所述系统包括报告输入子系统、报告分离子系统、报告存储子系统以及报告评估子系统,所述方法包括基于所述系统实现的电子学生思想报告提炼方法、纸质学生思想报告提炼方法以及学生思想报告分析方法。所述光学扫描识别模块对提交的纸质学生思想报告进行光学扫描识别生成纸质学生思想报告扫描识别版本;报告分离子系统用于所述电子学生思想报告进行报告内容分离处理;报告存储子系统用于存储分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本;报告评估子系统用于对所有所述学生思想报告进行评估。本专利技术的技术方案充分了考虑了学生思想政治报告的文本语义和结构特点,结合光学扫描识别技术以及内容分离技术以及映射关联存储技术,能够自动化的快速实现学生思想报告的分析和评估。具体来说,在本专利技术的第一个方面,提供一种基于文本语义特征分析的学生思想报告提炼与分析系统,所述系统包括报告输入子系统、报告分离子系统、报告存储子系统以及报告评估子系统;作为一个改进,所述报告输入子系统包括光学扫描识别模块和电子文档提交接口;所述光学扫描识别模块,用于对提交的纸质学生思想报告进行光学扫描识别,生成纸质学生思想报告扫描识别版本;作为上述改进的关键技术手段,所述光学扫描识别模块,用于对提交的纸质学生思想报告进行光学扫描识别,生成纸质学生思想报告扫描识别版本,具体包括:分别扫描所述纸质学生思想报告的著录项目段和正文段,得到著录项目段图像和正文段图像;对于著录项目段图像,采用至少一种图像加密转换算法,生成所述著录项目段图像对应的第一加密身份识别ID;对于正文段图像,采用至少一种光学字符识别方法获取所述正文段图像对应的至少一个第一字符集合。所述电子文档提交接口,用于接收学生提交的电子学生思想报告以及所述纸质学生思想报告扫描识别版本;作为另一个改进,所述报告分离子系统,用于对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理;作为上述改进的关键技术手段,所述报告分离子系统,用于对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理,具体包括:对于所述电子学生思想报告,通过文档结构识别方法识别出所述电子学生思想报告的著录项目段和正文段;对于所述电子学生思想报告的著录项目段,采用至少一种摘要加密算法,生成所述电子学生思想报告的著录项目段对应的第二加密身份识别ID;对于所述电子学生思想报告的正文段,通过与预先配置的关注词数据进行匹配后,生成所述电子学生思想报告的正文段对应的至少一个第二字符集合。所述报告存储子系统,用于存储所述报告分离子系统对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本;所述报告评估子系统,用于基于所述报告存储子系统存储的所述分离内容,对所有所述学生思想报告进行评估。具体而言,所述报告评估子系统计算所述第一字符集合和所述第二字符集合的相似性评分值和差异性评分值;基于所述相似性评分值和差异性评分值,得到所述第一字符集合和所述第二字符集合对应的至少两份学生思想报告的评估结果。在本专利技术的第二个方面,提供一种基于文本语义特征分析的电子学生思想报告提炼方法,所述方法基于前述的一种基于文本语义特征分析的学生思想报告提炼与分析系统实现。具体而言,所述方法包括如下步骤:S601:输入电子学生思想报告;S602:识别出所述电子学生思想报告的著录项目段和正文段;S603:采用摘要加密算法,生成所述电子学生思想报告的著录项目段对应的第二加密身份识别ID;S604:通过与预先配置的关注词数据进行匹配后,生成所述电子学生思想报告的正文段对应的至少一个第二字符集合;S605:将所述第二加密身份识别ID与所述第二字符集合建立第二映射关系;S606:将所述第二加密身份识别ID以及第二映射关系存储至第三著录ID数据库;S607:将所述第二字符集合存储至第四字符集合数据库。在本专利技术的第三个方面,提供一种基于文本语义特征分析的纸质学生思想报告提炼方法,所述方法基于前述的一种基于文本语义特征分析的学生思想报告提炼与分析系统实现。具体来说,所述方法包括如下步骤:S701:获取提交的纸质学生思本文档来自技高网
...

【技术保护点】
1.一种基于文本语义特征分析的学生思想报告提炼与分析系统,所述系统包括报告输入子系统、报告分离子系统、报告存储子系统以及报告评估子系统;/n其特征在于:/n所述报告输入子系统包括光学扫描识别模块和电子文档提交接口;/n所述光学扫描识别模块,用于对提交的纸质学生思想报告进行光学扫描识别,生成纸质学生思想报告扫描识别版本;/n所述电子文档提交接口,用于接收学生提交的电子学生思想报告以及所述纸质学生思想报告扫描识别版本;/n所述报告分离子系统,用于对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理;/n所述报告存储子系统,用于存储所述报告分离子系统对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本;/n所述报告评估子系统,用于基于所述报告存储子系统存储的所述分离内容,对所有所述学生思想报告进行评估。/n

【技术特征摘要】
1.一种基于文本语义特征分析的学生思想报告提炼与分析系统,所述系统包括报告输入子系统、报告分离子系统、报告存储子系统以及报告评估子系统;
其特征在于:
所述报告输入子系统包括光学扫描识别模块和电子文档提交接口;
所述光学扫描识别模块,用于对提交的纸质学生思想报告进行光学扫描识别,生成纸质学生思想报告扫描识别版本;
所述电子文档提交接口,用于接收学生提交的电子学生思想报告以及所述纸质学生思想报告扫描识别版本;
所述报告分离子系统,用于对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理;
所述报告存储子系统,用于存储所述报告分离子系统对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本;
所述报告评估子系统,用于基于所述报告存储子系统存储的所述分离内容,对所有所述学生思想报告进行评估。


2.如权利要求1所述的一种基于文本语义特征分析的学生思想报告提炼与分析系统,其特征在于:
所述光学扫描识别模块,用于对提交的纸质学生思想报告进行光学扫描识别,生成纸质学生思想报告扫描识别版本,具体包括:
分别扫描所述纸质学生思想报告的著录项目段和正文段,得到著录项目段图像和正文段图像;
对于著录项目段图像,采用至少一种图像加密转换算法,生成所述著录项目段图像对应的第一加密身份识别ID;
对于正文段图像,采用至少一种光学字符识别方法获取所述正文段图像对应的至少一个第一字符集合。


3.如权利要求2所述的一种基于文本语义特征分析的学生思想报告提炼与分析系统,其特征在于:
所述报告分离子系统,用于对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理,具体包括:
对于所述电子学生思想报告,通过文档结构识别方法识别出所述电子学生思想报告的著录项目段和正文段;
对于所述电子学生思想报告的著录项目段,采用至少一种摘要加密算法,生成所述电子学生思想报告的著录项目段对应的第二加密身份识别ID;
对于所述电子学生思想报告的正文段,通过与预先配置的关注词数据进行匹配后,生成所述电子学生思想报告的正文段对应的至少一个第二字符集合。


4.如权利要求3所述的一种基于文本语义特征分析的学生思想报告提炼与分析系统,其特征在于:
所述报告存储子系统,用于存储所述报告分离子系统对所述电子文档提交接口接收的所述电子学生思想报告进行报告内容分离处理后的分离内容以及所述纸质学生思想报告扫描识别版本,具体包括:
所述报告存储子系统包括第三著录ID数据库和第四字符集合数据库;
将所述第一加密身份识别ID与所述第一字符集合建立第一映射关系;
将所述第二加密身份识别ID与所述第二字符集合建立第二映射关系;
将所述第一加密身份识别ID、第二加密身份识别ID、第一映射关系以及第二映射关系存储至所述第三著录ID数据库;
将所述第一字符集合和所述第二字符集合存储至所述第四字符集合数据库。


5.如权利要求3所述的一种基于文本语义特征分析的学生思想报告提炼与分析系统,其...

【专利技术属性】
技术研发人员:张敏敏
申请(专利权)人:江苏安全技术职业学院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1