【技术实现步骤摘要】
一种试题匹配方法及装置
[0001]本公开涉及数据处理
,尤其涉及文本数据处理
,特别涉及一种试题匹配方法及装置。
技术介绍
[0002]教育辅助平台可以获取海量的试题,并向用户提供试题,以供用户针对试题涉及的知识点进行测试、练习等。
[0003]教育辅助平台期望在用户解答平台所提供试题的过程中,为用户提供与所解答试题相似的其他试题,以辅助用户巩固试题涉及的知识点,或者在用户解题遇到困难时,为用户提供该其他试题的解题过程。
[0004]因此,需要一种试题匹配方案,以使得教育辅助平台对自身获取的试题进行匹配,得到相似试题。
技术实现思路
[0005]本公开提供了一种试题匹配方法及装置。
[0006]根据本公开的一方面,提供了一种试题匹配方法,包括:
[0007]对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;
[0008]将各个试题对应的内容参数分割为多个子参数;
[0009]对相同子参数对应的试题进行匹配,得到相似试题。
[0010]根据本公开的另一方面,提供了一种试题匹配装置,包括:
[0011]内容转换模块,用于对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;
[0012]参数分割模块,用于将各个试题对应的内容参数分割为多个子参数;
[0013]试题匹配模块,用于对相同子参数对应的试题进行匹配,得到相似试题。
[0014]根据本公开的另一方面, ...
【技术保护点】
【技术特征摘要】
1.一种试题匹配方法,包括:对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;将各个试题对应的内容参数分割为多个子参数;对相同子参数对应的试题进行匹配,得到相似试题。2.根据权利要求1所述的方法,其中,所述对相同子参数对应的试题进行匹配,得到相似试题,包括:根据子参数的数值,对各个试题对应的子参数进行分组,得到各个预设计算节点对应的各个参数组,其中,数值相同的子参数属于同一参数组;针对每一参数组,获得该参数组对应的计算节点对待匹配试题进行匹配得到的相似试题,其中,所述待匹配试题为:该参数组中数值相同的子参数对应的试题。3.根据权利要求1或2所述的方法,其中,所述将各个试题对应的内容参数分割为多个子参数,包括:针对每一试题,将该试题对应的内容参数分割为多个预设位数的中间参数,根据各个中间参数及各个中间参数的排列顺序,确定该试题对应的多个子参数。4.根据权利要求3所述的方法,其中,所述根据各个中间参数及各个中间参数的排列顺序,确定该试题对应的多个子参数,包括:按照各个中间参数的排列顺序,轮流确定各个中间参数所属的子参数,并将同一子参数对应的中间参数连接,得到该试题对应的多个子参数。5.根据权利要求3所述的方法,其中,所述将该试题对应的内容参数分割为多个预设位数的中间参数,根据各个中间参数及各个中间参数的排列顺序,确定该试题对应的多个子参数,包括:在存在多个所述预设位数的情况下,针对每一预设位数,将该试题对应的内容参数分割为多个该预设位数的中间参数,根据各个中间参数及各个中间参数的排列顺序,确定该试题对应的多个子参数。6.根据权利要求1或2所述的方法,其中,所述对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数,包括:针对每一试题,对该试题的试题内容进行局部敏感哈希simhash计算,得到该试题的simhash值,作为表征该试题的试题内容的内容参数。7.根据权利要求1或2所述的方法,其中,在得到相似试题之后,还包括:若相似试题中存在来源于解题视频的第一试题,则为各个第二试题挂载所述第一试题来源的解题视频,其中,所述第二试题为:所述相似试题中除所述第一试题外的其他试题;若相似试题中存在来源于试卷文档的第三试题,则为各个第四试题挂载所述第三试题来源的试卷文档,其中,所述第四试题为:所述相似试题中除所述第三试题外的其他试题。8.根据权利要求1所述的方法,其中,所述对相同子参数对应的试题进行匹配,得到相似试题,包括:获得相同子参数对应的试题之间的相似度;根据所获得相似度,在相同子参数对应的试题中确定相似试题。9.根据权利要求1或2所述的方法,其中,所述试题内容包括以下信息中至少一项:
试题题干、试题选项、试题中的图片内容、试题公式中的字符。10.一种试题匹配装置,包括:内容转换模块,用于对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;参数分割模块,用于将各个试题对应的内容参数分割为多个子...
【专利技术属性】
技术研发人员:郑阳,亓子依,薛璐影,吴广发,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。