一种题目分类方法及系统技术方案

技术编号：15542178 阅读：30 留言：0更新日期：2017-06-05 11:14

本发明专利技术涉及分类领域，尤其涉及一种题目分类方法及系统。本发明专利技术通过提取第一题目中的符号；根据所述的符号进行分类，得到第一分类；根据所述第一分类集合相应的第一题目。实现充分利用题目中的信息，从而提高题目按知识点分类的精确度。

Title Classification Method and system

The invention relates to the field of classification, in particular to a subject classification method and a system. The invention obtains the first classification by extracting the symbols in the first title; classifies the symbols according to the symbols; and obtains the first classification according to the corresponding first topic of the first classification set. To make full use of the information in the subject, so as to improve the accuracy of the classification of the topic according to the knowledge.

全部详细技术资料下载

【技术实现步骤摘要】
一种题目分类方法及系统
本专利技术涉及分类领域，尤其涉及一种题目分类方法及系统。
技术介绍
大数据时代每天所产生的数据量爆炸式的增长。K12教育作为中国最重要的教育形式之一，每天产生的数据量不可忽视。中国在线教育的规模正以每年30％以上的速度增长，市场估值将超过1600亿元。K12在线教育资源成为了各个企业必争之地，若能对日益增长的题目数据加以分析利用，合理归类到相应知识点中，则能提高应用的用户体验。在K12的在线教育中，绝大多数教学网站和应用，都需要大量的题库资源作为基础支撑。通常这些题目资源需在教学系统中被归类于其涉及的知识点之下，以便于学生对自身薄弱的知识点选择相应的题目进行练习。目前的题目知识点标注方法仅以人工为主，需要大量的教学相关人员为不同学龄段、不同学科的知识点进行归类。事实上单个学科在单个学龄段的知识点就可能超过千数，这很难保证相关人员在分类归档时不发生知识点遗漏或出错。而各教学网站或应用目前已经归档的题目资源仅是K12教育题中的很小一部分。尚未归类的题目，加上每一年新增的大量新题，都需要大量的教学人员为这些题目资源归类，这更是加大了难度和出错的概率。如何利用已经标以知识点的题目为未知知识点的题目进行分类便成为一种需求。根据现有题目分类的相关方法，只是将题目分类成不同的学科，例如：A题属于数学，B题属于语文，而无法精确到具体的知识点。
技术实现思路
本专利技术所要解决的技术问题是：提供一种题目分类方法及系统，实现提高题目按知识点分类的精确度。为了解决上述技术问题，本专利技术采用的技术方案为：本专利技术提供一种题目分类方法，包括：提取第一题目中的...

【技术保护点】
一种题目分类方法，其特征在于，包括：提取第一题目中的符号；根据所述的符号进行分类，得到第一分类；根据所述第一分类集合相应的第一题目。

【技术特征摘要】
1.一种题目分类方法，其特征在于，包括：提取第一题目中的符号；根据所述的符号进行分类，得到第一分类；根据所述第一分类集合相应的第一题目。2.根据权利要求1所述的题目分类方法，其特征在于，根据所述的符号进行分类，得到第一分类，具体为：根据预设的转义字符转换所述符号，得到第二题目；提取所述第二题目的特征，得到第一向量；根据预设的知识点分类模型，得到与所述第一向量相应的第一分类。3.根据权利要求2所述的题目分类方法，其特征在于，提取所述第二题目的特征，得到第一向量，具体为：解析所述第二题目，得到中文字符栈和非中文字符栈；使用切词算法对所述中文字符栈中的字符进行切词处理，并使用预设的正则表达式匹配所述非中文字符栈中存储的公式，得到第三题目；从所述第三题目中删除停止词，得到第四题目；提取所述第四题目的特征，得到第一向量。4.根据权利要求3所述的题目分类方法，其特征在于，从所述第三题目中删除停止词，得到第四题目，具体为：计算所述第三题目中各个词的权重；根据所述权重将所述第三题目中的词排序，形成第一队列；从所述第三题目中删除与预设个数元素相应的词，得到第四题目。5.根据权利要求1所述的题目分类方法，其特征在于，根据所述的符号进行分类，得到第一分类，具体为：根据预设的转义字符转换所述符号，得到第二题目；根据所述第二题目构建词频向量；所述词频向量中元素的个数为预设训练数据集中不同词的数量，所述词频向量中元素的值为与所述元素相应的词在所述第二题目中出现的次数；根据预设的维度建立语义特征抽取模型；根据所述语义特征抽取模型构建与所述第二题目相应的语义向量...

【专利技术属性】
技术研发人员：刘德建，詹博悍，章亮，陈霖，吴拥民，陈宏展，
申请(专利权)人：福建天泉教育科技有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人