一种基于文本AI学习的考题自动生成方法和装置制造方法及图纸

技术编号:20160722 阅读:26 留言:0更新日期:2019-01-19 00:13
本申请提供的一种基于文本AI学习的考题自动生成方法包括:获取考题素材的文本;对所述文本进行特征提取,生成文本特征向量;利用预先训练的向量匹配模型根据所述文本特征向量将所述文本与样本库中的样本进行匹配,其中,所述样本包括样本考题以及与样本考题对应的样本考题素材;利用预先训练的出题规律模式确定模型根据所述目标样本考题素材与对应的目标样本考题之间的文本特征差异,确定出题规律模式;根据所述出题规律模式,将所述考题素材的文本转换成考题。本申请还提供了基于文本AI学习的考题自动生成装置。本申请通过人工智能来生成考题,节约了人力成本和时间成本,降低了生成考题的成本,可以适用于互联网测试的海量题库自动构造。

【技术实现步骤摘要】
一种基于文本AI学习的考题自动生成方法和装置
本申请涉及人工智能
,尤其涉及一种基于文本AI学习的考题自动生成方法和装置。
技术介绍
人工智能(ArtificialIntelligence,AI)是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大。其中,在文本学习领域,人工智能技术已经应用于自然语言的语义识别、机器翻译等许多方面。考试作为一种考查参试者所掌握的知识和技能的方式,往往离不开考题,各行各业的人才选拔往往通过不同类型的考题来实现。现有技术中的考题,通常是由人工来完成命题的,即根据考试大纲,选取考题素材,提取素材中的知识点,将知识点作为考点,将所选素材中与该知识点相关的信息作为考题题干,进而生成考题。由于该过程是由人工来完成的,在生成考题的过程中需要大量的时间梳理考题素材,并整理成考题,造成了人力和时间的浪费,进而提高了生成考题的成本。尤其是随着全民学习型社会的来临,目前各种在线考试系统和知识测试APP越来越普及,都需要建设海量题库作为支撑,因此如何高效率自动生成适当的考题成为一个亟待解决的问题。
技术实现思路
有鉴于此,本申请的目的在于提出一种基于文本AI学习的考题自动生成方法和装置,来解决现有技术中生成考题的过程由人工来完成造成的人力和时间的浪费,进而提高生成考题成本的技术问题。基于上述目的,在本申请的一个方面,提出了一种基于文本AI学习的考题自动生成方法,包括:获取考题素材的文本;对所述文本进行特征提取,生成文本特征向量;利用预先训练的向量匹配模型根据所述文本特征向量将所述文本与样本库中的样本进行匹配,其中,所述样本包括样本考题以及与样本考题对应的样本考题素材;利用预先训练的出题规律模式确定模型根据所述目标样本考题素材与对应的目标样本考题之间的文本特征差异,确定出题规律模式;根据所述出题规律模式,将所述考题素材的文本转换成考题。在一些实施例中,所述对所述文本进行特征提取,生成文本特征向量,包括:提取所述文本中的词组,对所述词组进行属性分类,统计各类别词组的词频,根据词组类别和各类别词组的词频生成文本特征向量。在一些实施例中,所述提取所述文本中的词组,对所述词组进行属性分类,统计各类别词组的词频,包括:对所述文本进行分词,将所述文本切分为多个词组,对每个词组进行归类,确定每个词组的属性类别,并对每个属性类别的词组进行词频统计。在一些实施例中,对每个词组进行归类,确定每个词组的属性类别,具体包括:构建词组属性分类表,所述词组属性分类表包括词组属性类别以及对应该类别的词组语义,对每个词组进行语义识别,确定所述词组的词组属性类别。在一些实施例中,在对所述文本进行分词,将所述文本切分为多个词组,对每个词组进行语义识别之后,还包括:对语义识别后的多个词组进行去停用词过滤去噪,滤除所述多个词组中包含的噪音词组。在一些实施例中,所述利用预先训练的向量匹配模型根据所述文本特征向量将所述文本与样本库中的样本进行匹配,包括:预先训练神经网络模型,生成向量匹配模型,并利用所述向量匹配模型,计算当前素材文本的所述文本特征向量与所述样本库中的样本考题素材的文本特征向量的标准差,并当该标准差小于预设阈值时,匹配成功,并将匹配成功的样本考题素材作为目标样本考题素材。在一些实施例中,所述利用预先训练的出题规律模式确定模型根据所述目标样本考题素材与对应的目标样本考题之间的文本特征差异,确定出题规律模式,包括:计算所述目标样本考题素材与对应的目标样本考题的文本特征向量,根据目标样本考题素材与对应的目标样本考题的文本特征向量中的同类词组的词组频率的差异,确定出题规律模式。基于上述目的,在本申请的另一方面,提出了一种基于文本AI学习的考题自动生成装置,包括:文本获取模块,用于获取考题素材的文本;文本特征向量生成模块,对所述文本进行特征提取,生成文本特征向量;向量匹配模块,用于根据所述文本特征向量将所述考题素材文本与样本库中的样本进行匹配;出题规律模式确定模块,用于根据所述目标样本考题素材与对应的目标样本考题之间的文本特征差异,确定出题规律模式;考题生成模块,用于根据所述出题规律模式,将所述考题素材的文本转换成考题。在一些实施例中,所述文本特征向量生成模块,具体用于:提取所述文本中的词组,对所述词组进行属性分类,统计各属性类别词组的词频,根据词组属性类别和各类别词组的词频生成文本特征向量。在一些实施例中,所述出题规律模式确定模块,具体用于:计算所述目标样本考题素材与对应的目标样本考题的文本特征向量,根据目标样本考题素材与对应的目标样本考题的文本特征向量中的同类词组的词组频率的差异,确定出题规律模式。本申请实施例提供的一种基于文本AI学习的考题自动生成方法和装置,其对所述文本进行特征提取,生成文本特征向量;利用预先训练的向量匹配模型根据所述文本特征向量将所述文本与样本库中的样本进行匹配,利用预先训练的出题规律模式确定模型根据所述目标样本考题素材与对应的目标样本考题之间的文本特征差异,确定出题规律模式;根据所述出题规律模式,将所述考题素材的文本转换成考题。本申请实施例的基于文本AI学习的考题自动生成方法和装置,通过人工智能来生成考题,节约了人力成本和时间成本,进而降低了生成考题的成本,同时使得生成考题的过程更加方便快捷,可以适用于互联网测试的海量题库自动构造。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请实施例一的基于文本AI学习的考题自动生成方法的流程图;图2是本申请实施例二的基于文本AI学习的考题自动生成方法的流程图;图3是本申请实施例三的基于文本AI学习的考题自动生成装置的结构示意图;图4是本申请实施例四的利用本申请实施例的基于文本AI学习的考题自动生成装置的生成考题的流程示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。作为本申请的一个实施例,如图1所示,是本申请实施例一的基于文本AI学习的考题自动生成方法的流程图。从图中可以看出,本实施例提供的基于文本AI学习的考题自动生成方法,包括以下步骤:S101:获取考题素材的文本。在本实施例中,考题素材的文本可以是人工输入的,也可以是系统自动获取。本实施例及以下实施例中的考题素材,是指一段文本文字,其内容可以是对一个概念下定义,例如“光色是光学里一种以K(kevin)为计算单位表示光颜色的数值,生活中一般接触到的光色为2700K~6500K,工业照明和特殊领域(如汽车照明)会使用超过7000K光色的光源照明”,或者举例子对某一概念进行解释,例如“高速公路标明了车道的行驶速度,最高车速不得超过每小时120公里,最低车速不得低于每小时6本文档来自技高网...

【技术保护点】
1.一种基于文本AI学习的考题自动生成方法,其特征在于,包括:获取考题素材的文本;对所述文本进行特征提取,生成文本特征向量;利用预先训练的向量匹配模型根据所述文本特征向量将所述文本与样本库中的样本进行匹配,其中,所述样本包括样本考题以及与样本考题对应的样本考题素材;利用预先训练的出题规律模式确定模型根据所述目标样本考题素材与对应的目标样本考题之间的文本特征差异,确定出题规律模式;根据所述出题规律模式,将所述考题素材的文本转换成考题。

【技术特征摘要】
1.一种基于文本AI学习的考题自动生成方法,其特征在于,包括:获取考题素材的文本;对所述文本进行特征提取,生成文本特征向量;利用预先训练的向量匹配模型根据所述文本特征向量将所述文本与样本库中的样本进行匹配,其中,所述样本包括样本考题以及与样本考题对应的样本考题素材;利用预先训练的出题规律模式确定模型根据所述目标样本考题素材与对应的目标样本考题之间的文本特征差异,确定出题规律模式;根据所述出题规律模式,将所述考题素材的文本转换成考题。2.根据权利要求1所述的方法,其特征在于,所述对所述文本进行特征提取,生成文本特征向量,包括:提取所述文本中的词组,对所述词组进行属性分类,统计各类别词组的词频,根据词组类别和各类别词组的词频生成文本特征向量。3.根据权利要求2所述的方法,其特征在于,所述提取所述文本中的词组,对所述词组进行属性分类,统计各类别词组的词频,包括:对所述文本进行分词,将所述文本切分为多个词组,对每个词组进行归类,确定每个词组的属性类别,并对每个属性类别的词组进行词频统计。4.根据权利要求3所述的方法,其特征在于,对每个词组进行归类,确定每个词组的属性类别,具体包括:构建词组属性分类表,所述词组属性分类表包括词组属性类别以及对应该类别的词组语义,对每个词组进行语义识别,确定所述词组的词组属性类别。5.根据权利要求4所述的方法,其特征在于,在对所述文本进行分词,将所述文本切分为多个词组,对每个词组进行语义识别之后,还包括:对语义识别后的多个词组进行去停用词过滤去噪,滤除所述多个词组中包含的噪音词组。6.根据权利要求5所述的方法,其特征在于,所述利用预先训练的向量匹配模型根据所述文本特征向量将所述文本与样本库中的样本进行...

【专利技术属性】
技术研发人员:赵宇枫
申请(专利权)人:重庆工业职业技术学院
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1