一种智能课堂感知的方法及系统技术方案

技术编号:24169047 阅读:20 留言:0更新日期:2020-05-16 02:21
本发明专利技术公开了一种智能课堂感知的方法及系统,通过空间向量模型计算每个词语的TF‑IDF值计算每个特征词对文本类型的影响程度,选择高于维度阈值特征作为特征维度,以知识点训练及感知模块获取到的训练样本的空间向量矩阵训练支持向量机得到分类器,利用的分类器识别文本表达中关于知识的意图分类并输出知识点主题和意图;对课堂中的实时人声表述进行主动跟踪,感应理解实时提及的知识点及意图,并调取匹配的知识点的析义、题库、资源等,在教育终端进行辅助教学显示;降低了特征空间维度,消耗更少的计算机资源,能够快速即使的对于课堂教育中的教与学中的用户做出及时准确的反馈,提升了目前智能课堂教学的用户体验。

A method and system of intelligent classroom perception

【技术实现步骤摘要】
一种智能课堂感知的方法及系统
本公开属于智能教学辅助
,具体涉及一种智能课堂感知的方法及系统,适用课堂教育中的教与学。
技术介绍
近年来,互联网及人工智能不断发展,人工智能云服务平台的迅速兴起,为一些智能应用落地提供了便捷,人工智能不再是遥不可及。人工智能在教育领域的应用也有了长足的发展:智能硬件及终端产品的不断冒起,着实为教育行业信息化提供了极大的便捷与帮助,课堂教学智能化、辅助教学智能化逐渐形成一种趋势。
技术实现思路
为解决上述问题,本公开提供一种智能课堂感知的方法及系统的技术方案,对课堂中的“实时人声表述”进行主动跟踪,感应(理解)实时提及的知识点及意图,并调取匹配的知识点的析义、题库、资源等,在教育终端进行辅助教学显示。为了实现上述目的,根据本公开的一方面,提供一种智能课堂感知的方法,所述方法的步骤依赖于智能课堂感知系统,所述智能课堂感知系统包括知识库资源库模块、实时语音接入模块、知识点训练及感知模块、响应呈现终端;所述的知识点训练及感知模块包括知识点训练子模块、知识点感知子模块;所述方法具体包括以下步骤:S100:知识点训练子模块导入训练样本文本,对训练样本进行预处理得到已处理样本文本;S200:基于N-Gram对已处理样本文本进行特征提取,建立特征词典;进行特征筛选,降低特征空间的维数;并为已处理样本文本构建词频矩阵作为空间向量模型;S300:通过空间向量模型计算每个词语的TF-IDF值,计算每个特征词对文本类型的影响程度,设置一个维度阈值,选择高于维度阈值特征作为特征维度,用于已处理样本文本的文本空间向量表达;S400:通过支持向量机对已处理样本文本的空间向量构成的矩阵进行训练得到分类器;S500:实时语音接入模块采集语音并进行语音转译得到转译文本并传输到知识点感知子模块;S600:知识点感知子模块对转译文本进行预处理得到已处理转译文本并提取知识点的主题词;S700:根据训练支持向量机时筛选后的特征将已处理转译文本进行文本向量表达;S800:通过分类器识别文本表达中关于知识的意图分类并将输出作为知识点主题和意图;S900:通过终端呈现模块输出知识点主题和意图。进一步地,在S100中,对训练样本进行预处理得到已处理样本文本的方法具体包括以下步骤:S101:通过中文分词器HanLP或FudanNLP调用知识库资源库模块加载知识库中的知识点主题词辅助分词;S102:将停用词表里的词进行删除处理;S103:将同义词、近义词归一处理为其中一个默认的词版本;S104:将训练文本中的知识点主题词统一表示为唯一的标识词。进一步地,在S300中,计算每个特征词对文本类型的影响程度即计算每个特征词在文本中出现的频率,即词频,词频越大代表这个词对文本类型的影响程度越大。进一步地,在S300中,所述维度阈值为文本降维的最终维度。所述特征词典用于使得词语和其id一一对应。所述特征筛选:由于初始特征词典规模巨大,样本空间向量的维度通常达到数万级别,特征选择可以降低特征空间维度,并消耗更少的计算机资源。已处理样本文本的文本空间向量是一个二维矩阵,行代表每个特征词在每条训练样本里出现的次数,词频矩阵的列代表每条训练样本里包含的特征词语及该特征词语出现的次数。进一步地,在S600中,知识点感知子模块对转译文本进行预处理得到已处理转译文本并提取知识点的主题词的方法具体包括以下步骤:S601:通过中文分词器HanLP或FudanNLP调用知识库资源库模块加载知识库中的知识点主题词辅助分词;S602:将停用词表里的词进行删除处理;S603:将同义词、近义词归一处理为其中一个默认的词版本;S604:将转译文本中的知识点主题词统一表示为唯一的标识词。进一步地,所述训练样本文本为预先输入的测试文本,或者通过语音输入转换成的文本文件。本专利技术还提供了一种智能课堂感知的系统,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:训练样本预处理单元,用于通过知识点训练子模块导入训练样本文本,对训练样本进行预处理得到已处理样本文本;词频矩阵构建单元,用于基于N-Gram对已处理样本文本进行特征提取,建立特征词典;进行特征筛选,降低特征空间的维数;并为已处理样本文本构建词频矩阵作为空间向量模型;样本向量表达单元,用于通过空间向量模型计算每个词语的TF-IDF值,计算每个特征词对文本类型的影响程度,设置一个维度阈值,选择高于维度阈值特征作为特征维度,用于已处理样本文本的文本空间向量表达;分类器训练单元,用于通过支持向量机对已处理样本文本的空间向量构成的矩阵进行训练得到分类器;语音转译单元,用于实时语音接入模块采集语音并进行语音转译得到转译文本并传输到知识点感知子模块;转译文本预处理单元,用于知识点感知子模块对转译文本进行预处理得到已处理转译文本并提取知识点的主题词;文本向量表达单元,用于根据训练支持向量机时筛选后的特征将已处理转译文本进行文本向量表达;意图分类识别单元,用于通过分类器识别文本表达中关于知识的意图分类并将输出作为知识点主题和意图;终端呈现单元,用于通过终端呈现模块输出知识点主题和意图。本公开的有益效果为:本专利技术提供一种智能课堂感知的方法及系统,降低了特征空间维度,消耗更少的计算机资源,能够快速即使的对于课堂教育中的教与学中的用户做出及时准确的反馈,提升了目前智能课堂教学的用户体验。附图说明通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:图1为智能课堂感知系统的系统结构图;图2为知识点训练子模块内部流程图;图3为实时语音接入模块转译语音文本流程图;图4为知识点感知子模块内部流程图。具体实施方式以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本公开提出一种智能课堂感知的方法,所述方法的步骤依赖于智能课堂感知系统,如图1所示,图1为智能课堂感知系统的系统结构图,所述智能课堂感知系统包括知识库资源库模块、实时语音接入模块、知识点训练及感知模块、响应呈现终端;所述的知识点训练及感知模块包括知识点训练子模块、知识点感知子模块;如图2所示,图2为知识点训练子模块内部流程图,知识点训练子模块的流程包括以下步本文档来自技高网...

【技术保护点】
1.一种智能课堂感知的方法,其特征在于,所述方法依赖于智能课堂感知系统,所述智能课堂感知系统包括知识库资源库模块、实时语音接入模块、知识点训练及感知模块、响应呈现终端;所述的知识点训练及感知模块包括知识点训练子模块、知识点感知子模块;/n所述方法具体包括以下步骤:/nS100:知识点训练子模块导入训练样本文本,对训练样本进行预处理得到已处理样本文本;/nS200:基于N-Gram对已处理样本文本进行特征提取,建立特征词典;进行特征筛选,降低特征空间的维数;并为已处理样本文本构建词频矩阵作为空间向量模型;/nS300:通过空间向量模型计算每个词语的TF-IDF值,计算每个特征词对文本类型的影响程度,设置一个维度阈值,选择高于维度阈值特征作为特征维度,用于已处理样本文本的文本空间向量表达;/nS400:通过支持向量机对已处理样本文本的空间向量构成的矩阵进行训练得到分类器;/nS500:实时语音接入模块采集语音并进行语音转译得到转译文本并传输到知识点感知子模块;/nS600:知识点感知子模块对转译文本进行预处理得到已处理转译文本并提取知识点的主题词;/nS700:根据训练支持向量机时筛选后的特征将已处理转译文本进行文本向量表达;/nS800:通过分类器识别文本表达中关于知识的意图分类并将输出作为知识点主题和意图;/nS900:通过终端呈现模块输出知识点主题和意图。/n...

【技术特征摘要】
1.一种智能课堂感知的方法,其特征在于,所述方法依赖于智能课堂感知系统,所述智能课堂感知系统包括知识库资源库模块、实时语音接入模块、知识点训练及感知模块、响应呈现终端;所述的知识点训练及感知模块包括知识点训练子模块、知识点感知子模块;
所述方法具体包括以下步骤:
S100:知识点训练子模块导入训练样本文本,对训练样本进行预处理得到已处理样本文本;
S200:基于N-Gram对已处理样本文本进行特征提取,建立特征词典;进行特征筛选,降低特征空间的维数;并为已处理样本文本构建词频矩阵作为空间向量模型;
S300:通过空间向量模型计算每个词语的TF-IDF值,计算每个特征词对文本类型的影响程度,设置一个维度阈值,选择高于维度阈值特征作为特征维度,用于已处理样本文本的文本空间向量表达;
S400:通过支持向量机对已处理样本文本的空间向量构成的矩阵进行训练得到分类器;
S500:实时语音接入模块采集语音并进行语音转译得到转译文本并传输到知识点感知子模块;
S600:知识点感知子模块对转译文本进行预处理得到已处理转译文本并提取知识点的主题词;
S700:根据训练支持向量机时筛选后的特征将已处理转译文本进行文本向量表达;
S800:通过分类器识别文本表达中关于知识的意图分类并将输出作为知识点主题和意图;
S900:通过终端呈现模块输出知识点主题和意图。


2.根据权利要求1所述的一种智能课堂感知的方法,其特征在于,在S100中,对训练样本进行预处理得到已处理样本文本的方法具体包括以下步骤:
S101:通过中文分词器HanLP或FudanNLP调用知识库资源库模块加载知识库中的知识点主题词辅助分词;
S102:将停用词表里的词进行删除处理;
S103:将同义词、近义词归一处理为其中一个默认的词版本;
S104:将训练文本中的知识点主题词统一表示为唯一的标识词。


3.根据权利要求1所述的一种智能课堂感知的方法,其特征在于,在S300中,所述维度阈值为文本降维的最终维度。


4.根据权利要求1所述的一种智能课堂感知的方法,其特征在于,已处理样本文本的文本空间向量是一个二维矩阵,行代表每个特征词在每条训练样本里出现的次数,词频矩阵的列代表每条训练样本里包含的特征词语及该特征词语出现的次数。


5.根据权利要求1所述的一种智能课堂感知的方法,其特征在于,在S600中,知识点感知子模块对转译文本进行预处理得到已处理转译文本并提取知识点的主题词的方法具体包括以下步骤:
S601:通过中文分词器HanLP或FudanNLP调用知识库资源库模块加载知识库中的知识点主题词辅助分词;
S602:将停用词表里的词进行删除处理;
S603:将同义词...

【专利技术属性】
技术研发人员:张玉良杨广龙郑健
申请(专利权)人:广东高乐教育科技有限公司
类型:发明
国别省市:广东;44

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1