一种问卷信息处理方法技术

技术编号:37054328 阅读:32 留言:0更新日期:2023-03-29 19:31
本发明专利技术提供一种问卷信息处理方法,属于信息处理技术领域,所述方法包括如下步骤,先将填好的电子问卷进行图片化,然后及时保存问卷的数据,进行图片识别出问卷的具体内容,然后分析电子问卷的选项内容得到问卷的具体权重数据。本发明专利技术通过电子问卷进行图片处理,避免了需要访问电子问卷的生成系统或者服务器,可以直接外部进行问卷收集和处理,可以不用把没有必要的一些数据存储到服务器,减少了中间的数据传输,可以实现高效收集电子问卷数据,返回的直接为权重比列数据,均是有用的数据,处理的效率更高,直接从网页端就进行数据的处理,避免了服务器的访问。避免了服务器的访问。避免了服务器的访问。

【技术实现步骤摘要】
一种问卷信息处理方法


[0001]本专利技术涉及领域,尤其涉及一种问卷信息处理方法。

技术介绍

[0002]在日常生活中,常常涉及需要让用户填写调查问卷,以通过调查问卷来评估某一指标。相关技术中,通常是首先由评估专家研究出一套指标体系,设计相应的问卷和计算模型,评估人员将问卷以电子或纸质的方式发送给用户填写,并通过手动的方式将纸质版问卷和/或电子版问卷汇总到不同的第三方数据统计分析软件中,依据相关计算模型进行评估。
[0003]现有电子问卷系统由最早的HTML表单专用网页问卷,到通用HTML网页问卷编辑器,再到通用问卷编程语言,经历了三个阶段的发展。通用的HTML网页问卷编辑器,用户可以自行编写问卷、添加题目和设置题目的跳转和校验逻辑、然后发布问卷以及回收问卷数据。但是这些电子问卷的生成方式慢,效率低,同时不能生成不同的问卷。因此衍生出了一种表格式的电子问卷,而在问卷处理时,需要及时的获取用户填报的内容,如果进行数据存储的方式,则需要数据库进行大量数据的存储,然后后期再对数据处理,过程非常麻烦。因此,本方案设计了一种表格式问卷信息处理方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种问卷信息处理方法,其特征在于:处理的问卷为表格式问卷,所述方法包括如下步骤:步骤1:将电子问卷界面进行截屏,然后对截屏的问卷进行表格识别,并将表格方框描绘出来;步骤2:将电子问卷截屏转换为DOCX,解压DOCX后获取XML格式的底层文件,利用XML节点获取所有文本、文本属性及单元格属性,建立文本集合Text;步骤3:构建本体模型,根据相关领域创建语义模型,建立表格标题关键字;步骤4:过滤干扰字符,利用表格标题关键字的字号属性过滤干扰字符,并利用特殊关键字过滤字号属性识别失效的干扰字符;步骤5:根据电子问卷表格标题关键字查找属于本体模型的表头内容,确定表头所有文本,利用单元格长度属性将表头按列分割,并将表头的列数作为表格列数;步骤6:还原表格结构,利用单元格长度属性获取表格每行的列数,若列数小于表头列数,则从上一行中高度异常的单元格中取出换行节点或段落节点后的文本,插入该行中,并将该行内同一单元格内的拆分字符拼接成完整的字符串,利用单元格高度属性与长度属性判断表格结束位置;步骤7:抽取表格数据,识别电子问卷的题目和选项数据,然后根据题目和选项的权重进行问卷信息统计。2.根据权利要求1所述的一种问卷信息处理方法,其特征在于:步骤1的具体过程为,用户填完电子问卷,点击提交时,则网页自动对所填报的所有页面进行截图,截取的页面图片即为需要处理的图片式的电子问卷,然后对图片式的电子问卷进行预处理,得到图片上表格的方框横线条,然后将表格方框的横线条进行画黑,实现表格的还原。3.根据权利要求1所述的一种问卷信息处理方法,其特征在于:步骤2的具体过程为,转换为DOCX,还原文本行的结构,且表格结构部分还原,保留字符间的相对位置,解压DOCX后获取XML格式的底层文件,利用XML获取原文档中的文本字符串、文本属性、单元格长度属性和单元格高度属性,判断XML中的字符格式,将所有全角字符转为半角字符,并还原字符间的连接关系,构建Text文本集合。4.根据权利要求1所述的一种问卷信息处理方法,其特征在于:步骤3的具体过程为,根据不同的电子问卷领域建立不同的本体模型,本体模型包含若干个等级,每个一级概念下包含若干二级概念。5.根据权利要求1所述的一种问卷信息处理方法,其特征在于:步骤5的具体过程...

【专利技术属性】
技术研发人员:尹鲁
申请(专利权)人:长沙冉星信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1