一种题目分类及推送的方法及系统技术方案

技术编号:15248337 阅读:70 留言:0更新日期:2017-05-02 09:09
本发明专利技术涉及分类领域,尤其涉及一种题目分类及推送的方法及系统。本发明专利技术通过根据预设知识点分类模型分类第一题目,得到第一分类集合和第一关联度集合;所述第一关联度集合中的元素为所述第一题目与所述第一分类集合中各分类的关联度;计算所述第一题目与所述第一分类集合中各分类包含的题目的相似度,得到与所述第一分类集合中各分类对应的相似度集合;根据所述相似度集合和所述第一关联度集合,得到第二关联度集合;根据所述第二关联度集合,得到近似题集合;推送所述近似题集合。实现提高题目分类的准确性和推送的近题目的相关性。

Method and system for classifying and pushing questions

The invention relates to the field of classification, in particular to a method and a system for classifying and pushing questions. The present invention according to the preset knowledge classification model classification problem, get the first set and the first classification correlation set; correlation elements of the first degree in the collection for the classification of the first title and the first classification in the collection; the classification of similarity calculation of the first title and the first classification the collection contains the title, get set and the similarity of each classification corresponding to the first classification in the collection; according to the similarity set and the first correlation set, second correlation set; according to the second associated degree set, approximate problem sets; push the approximate problem set. To improve the accuracy of the classification of topics and the relevance of the purpose of the push.

【技术实现步骤摘要】

本专利技术涉及分类领域,尤其涉及一种题目分类及推送的方法及系统
技术介绍
大数据时代,每天所产生的数据量爆炸式的增长。K12教育作为中国最重要的教育形式之一,每天产生的数据量不可忽视。中国在线教育的规模正以每年30%以上的速度增长,市场估值将超过1600亿元。k12在线教育资源成为了各个企业必争之地,若能对日益增长的题目数据加以分析利用,合理分类到相应知识点中,当学生遇到难解或薄弱题后,推送与该知识点关联度大的题目供学生深入练习,能提高应用的用户体验。申请号为201510246727.2的专利文献提供一种题目推荐方法,通过接收检索题目;获取所述检索题目的题目属性信息,并根据所述题目属性信息获取初步检索结果;获取用户的用户描述信息,并根据所述用户描述信息对所述初步检索结果进行排序,得到排序后的结果;从所述排序后的结果后选择预设个数的结果,确定为推荐题目。实现提高推荐题目与检索题目的相关性,从而提高推荐效果。但是,上述专利文献根据用户描述信息对所述初步检索结果进行排序,其分类结果的准确性依赖于用户描述信息的准确性。
技术实现思路
本专利技术所要解决的技术问题是:提供一种题目分类及推送的方法及系统,实现提高题目分类的准确性和推送题目的相关性。为了解决上述技术问题,本专利技术采用的技术方案为:本专利技术提供一种题目分类及推送的方法,包括:S1、根据预设知识点分类模型分类第一题目,得到第一分类集合和第一关联度集合;所述第一关联度集合中的元素为所述第一题目与所述第一分类集合中各分类的关联度;S2、计算所述第一题目与所述第一分类集合中各分类包含的题目的相似度,得到与所述第一分类集合中各分类对应的相似度集合;S3、根据所述相似度集合和所述第一关联度集合,得到第二关联度集合;S4、根据所述第二关联度集合,得到近似题集合;S5、推送所述近似题集合。本专利技术还提供一种题目分类及推送的系统,包括:分类模块,根据预设知识点分类模型分类第一题目,得到第一分类集合和第一关联度集合;所述第一关联度集合中的元素为所述第一题目与所述第一分类集合中各分类的关联度;计算模块,用于计算所述第一题目与所述第一分类集合中各分类包含的题目的相似度,得到与所述第一分类集合中各分类对应的相似度集合;第一处理模块,用于根据所述相似度集合和所述第一关联度集合,得到第二关联度集合;第二处理模块,用于根据所述第二关联度集合,得到近似题集合;推送模块,用于推送所述近似题集合。本专利技术的有益效果在于:区别于现有技术直接根据分类模型的分类结果推送相关的近似题,本专利技术通过将第一题目与根据知识点分类模型得到的知识点分类中的题目进行相似度分析,根据相似度计算第一题目与所述知识点分类的关联度,再从关联度较大的知识点分类中提取与第一题目相似度高的题目作为近似题推送给用户,能够提高推送的近似题与第一题目的相关性。附图说明图1为本专利技术一种题目分类及推送的方法的流程框图;图2为本专利技术一种题目分类及推送的系统的结构框图;标号说明:1、分类模块;2、计算模块;3、第一处理模块;4、第二处理模块;5、推送模块。具体实施方式为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。本专利技术最关键的构思在于:通过将第一题目与根据知识点分类模型得到的知识点分类中的题目进行相似度分析,重新计算第一题目与各知识点分类的关联度,能够提高推送的近似题与第一题目的相关性。如图1所示,本专利技术提供一种题目分类及推送的方法,包括:S1、根据预设知识点分类模型分类第一题目,得到第一分类集合和第一关联度集合;所述第一关联度集合中的元素为所述第一题目与所述第一分类集合中各分类的关联度;S2、计算所述第一题目与所述第一分类集合中各分类包含的题目的相似度,得到与所述第一分类集合中各分类对应的相似度集合;S3、根据所述相似度集合和所述第一关联度集合,得到第二关联度集合;S4、根据所述第二关联度集合,得到近似题集合;S5、推送所述近似题集合。进一步地,所述S1具体为:部署不同的预设知识点分类模型于预设分类集群中的各节点;发送所述第一题目至所述预设分类集群中的各节点,得到所述第一分类集合和所述第一关联度集合。由上述描述可知,使用分布式集群有利于处理大规模批量题目的近似题推送任务,提高推送的效率。进一步地,还包括:获取所述近似题集合中各题目对应的分类,得到第二分类集合;根据所述第二分类集合更新所述预设知识点分类模型。由上述描述可知,定期根据分类结果更新知识点分类模型,能够提高分类模型分类的精确度,从而提高推送近似题的相关性。进一步地,发送所述第一题目至所述预设分类集群中的各节点,得到所述第一分类集合和所述第一关联度集合,具体为:发送所述第一题目至所述预设分类集群中的各节点,得到与所述节点相应的分类集合和关联度集合;根据所述节点上部署的知识点分类模型得到所述节点的权重值;根据所述节点的权重值和所述节点相应的分类集合和关联度集合,得到所述第一分类集合和所述第一关联度集合。由上述描述可知,分别在分类集群中的节点上部署多种不同的分类模型,因此,各节点得到的分类结果不同,根据各节点上部署的分类模型确定其权重值,综合分析权重值及相应的分类结果,得到与第一题目关联度大的知识点分类。实现根据实际的应用场景调整各节点的权重值,有利于根据用户的不同需求推送最符合用户期望的近似题。进一步地,所述S1具体为:根据预设的转义字符转换所述第一题目中的符号,得到第二题目;提取所述第二题目的特征,得到特征向量;所述特征向量包括词频向量和语义向量;根据所述预设知识点分类模型,得到与所述特征向量相应的第一分类集合和第一关联度集合。由上述描述可知,由于不同来源的题目的描述方式可能不同,尤其是不同的公式编辑器对公式中的符号的描述差异较大,因此,通过预设的转义字符转换所述公式中的符号,可归一化不同描述方式但代表相同意思的符号,从而准确并充分利用题目中的信息,提高题目分类的精确度,从而提高推送题目的相关性及获取近似题的效率。例如:待推送近似题的题目1为“使函数有意义的的正整数取值范围组成的集合的元素有?”。待推送近似题的题目2为“使函数有意义的y=(5-x)1/2的正整数取值范围组成的集合的元素有?”。实际上,题目1和题目2本质上是相同的,但是现有的方法无法充分利用题目中公式的信息,只是推送计算变量的取值范围从而使函数有意义的题目,而无法更具有针对性地推送计算变量的取值范围从而使带有根号的函数有意义的题目。且现有的方法无法识别和判断相同的题目,造成需重复解析同一题目从而获得近似题,效率低。进一步地,根据所述预设知识点分类模型,得到与所述特征向量相应的第一分类集合和第一关联度集合,具体为:部署基于词频的知识点分类模型于预设分类集群中的节点;部署基于语义的知识点分类模型于预设分类集群中的节点;发送所述第一题目至所述预设分类集群中的各节点,得到所述第一分类集合和所述第一关联度集合。由上述描述可知,通过所述分类集群得到的与第一题目相关的知识点分类包括从词频和语义两个维度得到的分类结果,由于综合考虑了题目中的词频和语义,能够提高分类的精确度,从而提高推送的近似题与第一题目的相关性。进一步地,提取所述第二题目的特征,得到特征向量;所述特征向量包括词频向量和语义向量本文档来自技高网
...

【技术保护点】
一种题目分类及推送的方法,其特征在于,包括:S1、根据预设知识点分类模型分类第一题目,得到第一分类集合和第一关联度集合;所述第一关联度集合中的元素为所述第一题目与所述第一分类集合中各分类的关联度;S2、计算所述第一题目与所述第一分类集合中各分类包含的题目的相似度,得到与所述第一分类集合中各分类对应的相似度集合;S3、根据所述相似度集合和所述第一关联度集合,得到第二关联度集合;S4、根据所述第二关联度集合,得到近似题集合;S5、推送所述近似题集合。

【技术特征摘要】
1.一种题目分类及推送的方法,其特征在于,包括:S1、根据预设知识点分类模型分类第一题目,得到第一分类集合和第一关联度集合;所述第一关联度集合中的元素为所述第一题目与所述第一分类集合中各分类的关联度;S2、计算所述第一题目与所述第一分类集合中各分类包含的题目的相似度,得到与所述第一分类集合中各分类对应的相似度集合;S3、根据所述相似度集合和所述第一关联度集合,得到第二关联度集合;S4、根据所述第二关联度集合,得到近似题集合;S5、推送所述近似题集合。2.根据权利要求1所述的题目分类及推送的方法,其特征在于,所述S1具体为:部署不同的预设知识点分类模型于预设分类集群中的各节点;发送所述第一题目至所述预设分类集群中的各节点,得到所述第一分类集合和所述第一关联度集合。3.根据权利要求2所述的题目分类及推送的方法,其特征在于,还包括:获取所述近似题集合中各题目对应的分类,得到第二分类集合;根据所述第二分类集合更新所述预设知识点分类模型。4.根据权利要求2所述的题目分类及推送的方法,其特征在于,发送所述第一题目至所述预设分类集群中的各节点,得到所述第一分类集合和所述第一关联度集合,具体为:发送所述第一题目至所述预设分类集群中的各节点,得到与所述节点相应的分类集合和关联度集合;根据所述节点上部署的知识点分类模型得到所述节点的权重值;根据所述节点的权重值和所述节点相应的分类集合和关联度集合,得到所述第一分类集合和所述第一关联度集合。5.根据权利要求1所述的题目分类及推送的方法,其特征在于,所述S1具体为:根据预设的转义字符转换所述第一题目中的符号,得到第二题目;提取所述第二题目的特征,得到特征向量;所述特征向量包括词频向量和语义向量;根据所述预设知识点分类模型,得到与所述特征向量相应的第一分类集合和第一关联度集合。6.根据权利要求5所述的题目分类及推送的方法,其特征在于,根据所述预设知识点分类模型,得到与所述特征向量相应的第一分类集合和第一关联度集合,具体为:部署基于词频的知识点分类模型于预设分类集群中的节点;部署基于语义的知识点分类模型于预设分类集群中的节...

【专利技术属性】
技术研发人员:刘德建章亮詹博悍陈霖吴拥民陈宏展
申请(专利权)人:福建天泉教育科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1