System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及推荐算法,具体涉及一种完型填空智能出题方法、装置、设备及介质。
技术介绍
1、汉语水平考试(简称hsk)为测试母语非汉语者的汉语水平而设立的一项国际汉语能力标准化考试。旨在提升留学生中文的听说读写水平,让留学生可以轻松地理解听到或读到的汉语信息,以口头或书面的形式用汉语流利地表达自己的见解。
2、然而,mct题库资源的建设仍然停留在初级和传统阶段,至今市面上仍没有能够实现mct完形填空题的智能生成。在信息化时代,教育与科技的融合是大势所趋,通过互联网、云技术和人工智能可以拓展mct题库构建工程,提升mct题库生成的智能化,实现mct考试的提效增速。而在如今大数据时代的背景下,海量的医疗知识字典、医疗知识图谱同样可以作为医疗知识库数据支撑,为mct题库智能生成注入新鲜活力,实现医学汉语资源的科学利用。然而,在教育留学生的中文水平的过程中,教师会遇到大量未经处理的中文语料,如果使用人工改写文本,不仅修改困难,而且时间成本极大,并且目前市场上还没有针对在这方面的智能自然语言改写方案。
3、有鉴于此,提出本申请。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种完型填空智能出题方法、装置、设备及介质,能够有效解决现有技术中在教育留学生的中文水平的过程中,教师会遇到大量未经处理的中文语料,如果使用人工改写文本,不仅修改困难,而且时间成本极大,并且目前市场上还没有针对在这方面的智能自然语言改写方案的问题。
2、本专利技术公开了一种完型填
3、获取待处理篇章,根据预设的hsk中文水平等级词典对所述待处理篇章进行出题语料筛选处理,并将筛选好的文本存储在预设的数组list_of_question中;
4、根据预设的标准等级词语词典对所述数据list_of_question中的每一句文本进行考点词挖空处理,生成题干挖空文本和挖空字词,其中,所述考点词挖空处理包括分词处理、挖空处理和替换处理;
5、将预设的反义关系系库存入afile文本中,根据所述挖空字词对所述afile文本进行对比遍历处理,生成反义词干扰项;
6、将预设的同义关系系库存入sfile文本中,根据所述挖空字词对所述sfile文本进行对比遍历处理,生成同义词干扰项;
7、将预设的抽象关系系库存入cfile文本中,根据所述挖空字词对所述cfile文本进行对比遍历处理,生成抽象词干扰项;
8、对所述反义词干扰项、所述同义词干扰项和所述抽象词干扰项进行预处理,生成题目列表,并将所述题目列表和所述题干挖空文本进行组合,生成完形填空题目,进行输出。
9、优选地,根据hsk中文水平等级词典对所述待处理篇章进行出题语料筛选处理,并将筛选好的文本存储在预设的数组list_of_question中,具体为:
10、根据预设的hsk中文水平等级词典对所述待处理篇章中的每一句文本进行等级分析处理,生成等级分析结果;
11、根据所述等级分析结果,选取与预设所需等级一致的文本,生成筛选文本,并将所述筛选文本作为出题语料;
12、对所述筛选文本进行分句处理,生成分句结果,并将所述分句结果存储在数组list_of_question中;
13、对所述数组list_of_question进行检测,当判断到所述数组list_of_question中存在空格或者单词的句子文本时,将该文本舍弃。
14、优选地,根据预设的标准等级词语词典对所述数据list_of_question中的每一句文本进行考点词挖空处理,生成题干挖空文本和挖空字词,具体为:
15、根据预设的标准等级词语词典对所述数据list_of_question进行分词处理,生成分词结果,并将所述分词结果存入text文本文件中;
16、打开所述标准等级词语词典,将其存入file文本文件中,并将所述file文本文件转换成列表存入level_dict文本中;
17、将所述text文本文件里所有出现在所述level_dict文本中的字词筛选出来,并存入数组ans中;
18、根据预设的不同等级对所述出题语料进行挖空,并把所有在所述level_dict文本中出现的字词存入所述数组ans中,得到挖空字词;
19、当判断到所述数组ans里多于一个字词,随机在所述数组ans中选择一个字词作为答案,把结果存入answer文本中;
20、对所述text文本文件进行查找,查找所述数组ans所在的位置,把所述数组ans的位置换成数学符号(),存入题目中,完成空后的出题语料文本q,形成题干挖空文本;
21、依照前述步骤依次对所述数组list_of_question中的每一句文本进行处理,直到处理完所述数组list_of_question中的每一句文本。
22、优选地,将预设的反义关系系库存入afile文本中,根据所述挖空字词对所述afile文本进行对比遍历处理,生成反义词干扰项,具体为:
23、将预设的反义关系系库打开,并存入afile文本中;
24、对所述入afile文本进行遍历,筛选出所述数组ans中挖空得到的字词,进行对比处理,当判断到所述标准等级词语词典里的第一列j[0]存在该字词时,把第二列j[1]的字词存入obstruction_1文本中;
25、当判断到遍历整个所述afile文件也没找到与所述数组ans相对应对的字词时,将所述标准等级词语词典打开存入file文本文件,并将所述afile文件转换成列表存入words文本中;
26、在所述words文本中随机选取一个字词作为反义词干扰项,并将所述反义词干扰项存入ran文本。
27、优选地,将预设的同义关系系库存入sfile文本中,根据所述挖空字词对所述sfile文本进行对比遍历处理,生成同义词干扰项,具体为:
28、将预设的同义关系库打开,并存入sfile文本中;
29、对所述入sfile文本进行遍历,筛选出所述数组ans中挖空得到的字词,进行对比处理,当判断到所述标准等级词语词典里的第一列j[0]存在该字词时,把第二列j[1]的字词存入obstruction_2文本中;
30、当判断到遍历整个所述sfile文件也没找到与所述数组ans相对应对的字词时,将所述标准等级词语词典打开存入file文本文件,并将所述sfile文件转换成列表存入words文本中;
31、在所述words文本中随机选取一个字词作为同义词干扰项,并将所述同义词干扰项存入ran文本。
32、优选地,将预设的抽象关系系库存入cfile文本中,根据所述挖空字词对所述cfile文本进行对比遍历处理,生成抽象词干扰项,具体为:
33、将预设的抽象关系系库打开,并存入cfile文本中;
34、对所述入cfile文本文档来自技高网...
【技术保护点】
1.一种完型填空智能出题方法,其特征在于,包括:
2.根据权利要求1所述的一种完型填空智能出题方法,其特征在于,根据HSK中文水平等级词典对所述待处理篇章进行出题语料筛选处理,并将筛选好的文本存储在预设的数组list_of_question中,具体为:
3.根据权利要求2所述的一种完型填空智能出题方法,其特征在于,根据预设的标准等级词语词典对所述数据list_of_question中的每一句文本进行考点词挖空处理,生成题干挖空文本和挖空字词,具体为:
4.根据权利要求3所述的一种完型填空智能出题方法,其特征在于,将预设的反义关系系库存入afile文本中,根据所述挖空字词对所述afile文本进行对比遍历处理,生成反义词干扰项,具体为:
5.根据权利要求4所述的一种完型填空智能出题方法,其特征在于,将预设的同义关系系库存入sfile文本中,根据所述挖空字词对所述sfile文本进行对比遍历处理,生成同义词干扰项,具体为:
6.根据权利要求5所述的一种完型填空智能出题方法,其特征在于,将预设的抽象关系系库存入cfile文本中,根
7.根据权利要求1所述的一种完型填空智能出题方法,其特征在于,对所述反义词干扰项、所述同义词干扰项和所述抽象词干扰项进行预处理,生成题目列表,并将所述题目列表和所述题干挖空文本进行组合,生成完形填空题目,具体为:
8.一种完型填空智能出题装置,其特征在于,包括:
9.一种完型填空智能出题设备,其特征在于,包括处理器、存储器以及存储在存储器中且被配置由处理器执行的计算机程序,处理器执行计算机程序时实现如权利要求1至7任意一项所述的一种完型填空智能出题方法。
10.一种可读存储介质,其特征在于,存储有计算机程序,计算机程序能够被该存储介质所在设备的处理器执行,以实现如权利要求1至7任意一项所述的一种完型填空智能出题方法。
...【技术特征摘要】
1.一种完型填空智能出题方法,其特征在于,包括:
2.根据权利要求1所述的一种完型填空智能出题方法,其特征在于,根据hsk中文水平等级词典对所述待处理篇章进行出题语料筛选处理,并将筛选好的文本存储在预设的数组list_of_question中,具体为:
3.根据权利要求2所述的一种完型填空智能出题方法,其特征在于,根据预设的标准等级词语词典对所述数据list_of_question中的每一句文本进行考点词挖空处理,生成题干挖空文本和挖空字词,具体为:
4.根据权利要求3所述的一种完型填空智能出题方法,其特征在于,将预设的反义关系系库存入afile文本中,根据所述挖空字词对所述afile文本进行对比遍历处理,生成反义词干扰项,具体为:
5.根据权利要求4所述的一种完型填空智能出题方法,其特征在于,将预设的同义关系系库存入sfile文本中,根据所述挖空字词对所述sfile文本进行对比遍历处理,生成同义词干扰项,具体为:...
【专利技术属性】
技术研发人员:蘇翠航,杨家迅,胡广磊,左天悦,陈思延,姚伟谅,王华珍,
申请(专利权)人:华侨大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。