【技术实现步骤摘要】
知识点关系标注方法及系统
本专利技术涉及智能教育
,特别涉及知识点关系标注方法及系统。
技术介绍
目前,将智能化技术应用到教学过程中,提高教学质量,已经成为了各个学校、培训机构的技术流行趋势。当前,对于试题中涉及到的知识点,通常都是人工标注,非常的耗费精力,并且,人工标注时,由于标注人主观影响,标注结果的准确性也很难保证,因此,急需一种能够智能、自动、准确的标注试题对应的知识点的技术。
技术实现思路
本专利技术实施例提供了一种知识点关系标注方法及系统。本专利技术实施例提供了一种知识点关系标注方法,包括:对试题内容进行分割,获得所述试题内容中的每一个单元句;根据预设字符串设置规则,确定所述试题内容中的每一个单元句各自对应的字符串向量;根据所述试题内容中的每一个单元句各自对应的字符串向量、以及各个知识点对应的字符串向量,确定所述试题内容中的每一个单元句所涉及的知识点;根据所述试题内容中每一个单元句所涉及的知识点,对所述试题内容涉及到的知识点进行标注。 >在一个实施例中,所本文档来自技高网...
【技术保护点】
1.一种知识点关系标注方法,其特征在于,包括:/n对试题内容进行分割,获得所述试题内容中的每一个单元句;/n根据预设字符串设置规则,确定所述试题内容中的每一个单元句各自对应的字符串向量;/n根据所述试题内容中的每一个单元句各自对应的字符串向量、以及各个知识点对应的字符串向量,确定所述试题内容中的每一个单元句所涉及的知识点;/n根据所述试题内容中每一个单元句所涉及的知识点,对所述试题内容涉及到的知识点进行标注。/n
【技术特征摘要】
1.一种知识点关系标注方法,其特征在于,包括:
对试题内容进行分割,获得所述试题内容中的每一个单元句;
根据预设字符串设置规则,确定所述试题内容中的每一个单元句各自对应的字符串向量;
根据所述试题内容中的每一个单元句各自对应的字符串向量、以及各个知识点对应的字符串向量,确定所述试题内容中的每一个单元句所涉及的知识点;
根据所述试题内容中每一个单元句所涉及的知识点,对所述试题内容涉及到的知识点进行标注。
2.如权利要求1所述的方法,其特征在于,
所述根据所述试题内容中的每一个单元句各自对应的字符串向量、以及各个知识点对应的字符串向量,确定所述试题内容中的每一个单元句所涉及的知识点,包括:
步骤A1、利用公式(1)得到所述试题内容中的每一个单元句与知识点之间的关联度:
其中,Ttj表示所述试题内容中的第t个单元句与第j个知识点之间的关联度;bj表示第j个知识点对应的字符串向量;ati表示第t个单元句对应的字符串向量中的第i个字符串元素向量;n表示第t个单元句对应的字符串向量中字符串元素向量的总数;∩表示交集符号;||表示对向量取模;
步骤A2、利用公式(2)对步骤A1得到的所述关联度进行修正:
其中,表示第t个单元句与第j个知识点之间的修正后关联度;bjΔati表示bj和ati的对称差集;
当等于或大于预设阈值时,表示所述第t个单元句中的ati涉及到了第j个知识点,记录所述第t个单元句中的ati涉及到了第j个知识点;当小于预设阈值时,表示所述第t个单元句中的ati未涉及第j个知识点,不执行任何操作;
步骤A3、循环执行所述步骤A1-A2,确定所述试题内容中第t个单元句中每个字符串元素向量与每个知识点之间的修正后关联度,并记录所述第t个单元句中每个字符串元素向量所涉及到的知识点;
步骤A4、循环执行所述步骤A1-A3,确定所述试题内容中每一个单元句中每个字符串元素向量所涉及的所有知识点,并记录所述试题内容中每一个单元句中每个字符串元素向量所涉及到的知识点。
3.如权利要求2所述的方法,其特征在于,所述根据所述试题内容中每一个单元句所涉及的知识点,对所述试题内容涉及到的知识点进行标注,包括:
步骤A51、统计所述试题内容中每一个单元句中每个字符串元素向量所涉及的知识点,确定所述试题内容中同一知识点对应的所有单元句;
步骤A61、将所述试题内容中同一知识点对应的所有单元句进行同一方式的标注,所述标注包括将所有单元句的文本采用同一种颜色进行突出显示、以及对所述所有单元句加批注框,所述批注框中写明对应的同一知识点的知识点内容。
4.如权利要求2或3所述的方法,其特征在于,所述步骤A4之后,还包括:
步骤A52、统计所述试题内容中所有单元句中所有字符串元素向量所涉及到的所有知识点的总数目X;
步骤A53、根据如下公式(3)计算所述X个知识点中,每个知识点在所述试题内容中的重要程度值:
其中,fk表示涉及到第k个知识点的所有字符串元素向量的总数目;Yk表示第k个知识点在所述试题内容中的重要程度值;
步骤A54、将每个知识点对应的重要程度值按照从大到小的顺序排序,将排在前U位的知识点作为所述试题内容涉及到的知识点。
5.如权利要求4所述的方法,其特征在于,
按照如下公式(4)计算所述U的取值:
其中,INT()为取整函数;g为所述试题内容的总占用存储空间大小;Gk为涉及到第k个知识点的所有字符串元素向量对应的试题内容部分的总占用存储空间大小。
6.一种知识点关系标...
【专利技术属性】
技术研发人员:许昭慧,
申请(专利权)人:上海松鼠课堂人工智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。