相似试题检索方法、系统、设备及存储介质技术方案

技术编号:41013696 阅读:43 留言:0更新日期:2024-04-18 21:50
本发明专利技术公开了一种相似试题检索方法、系统、设备及存储介质,采用本发明专利技术的方案,不仅能在哈希码中保留更多的关键试题语义信息,同时能提高哈希码的检索效率以及减少存储成本,为实施高效且精确的相似题检索提供帮助;通过在两个真实试题数据集上的实验与目前在相似题查找任务和语义哈希任务上的基准模型进行实验对比,不仅在准确率方面证明了本发明专利技术的有效性,还从效率实验上证明了本发明专利技术的高效性。

【技术实现步骤摘要】

本专利技术涉及相似题检索,尤其涉及一种相似试题检索方法、系统、设备及存储介质


技术介绍

1、在线教育系统已经成为当今教育行业不可或缺的一部分。随着在线教育系统的蓬勃发展,试题数据成倍增加,用户可以接触到海量的试题数据。通常情况下,相似的试题被认为是具有相同考查目的的试题,因此相似题检索系统能够帮助用户在大量的试题资源中找到与用户给定试题相关的其他试题,使得学生可以通过检索相似的试题进行个性化学习,或者教师可以利用这些试题对学生进行认知分析。

2、近年来,研究者提出相似题检索(finding similar exercise,fse)任务,用于提供个性化学习和认知分析。其主要的目标在于,对于用户给出的一个试题查询,系统要返回一些与查询试题相似的试题。最近提出的有关fse的研究工作主要集中在利用预训练语言模型以及融合多模态试题数据的方法进行精准的试题相似度识别。这些方法主要考虑试题文本、图片的相似度或者是试题考察知识点的相似度,并利用相关性标注进行监督式训练,在相似题检索任务的精度指标方面已经取得了不错的效果,但是它们忽略了效率问题。随着试题数量本文档来自技高网...

【技术保护点】

1.一种相似试题检索方法,其特征在于,包括:

2.根据权利要求1所述的一种相似试题检索方法,其特征在于,所述随机从训练数据集中采样多个试题,并构建每一试题的正负样本,通过语义哈希模型获得每一试题,以及每一试题正负样本的哈希码,并计算对比学习损失函数包括:

3.根据权利要求1所述的一种相似试题检索方法,其特征在于,所述对于试题的文本信息通过预训练的文本模型提取出文本表征通过卷积处理,获得试题的局部表征,再通过池化获得全局表征包括:

4.根据权利要求1或3所述的一种相似试题检索方法,其特征在于,计算最大化全局与局部表征的目标损失函数表示为:

5...

【技术特征摘要】

1.一种相似试题检索方法,其特征在于,包括:

2.根据权利要求1所述的一种相似试题检索方法,其特征在于,所述随机从训练数据集中采样多个试题,并构建每一试题的正负样本,通过语义哈希模型获得每一试题,以及每一试题正负样本的哈希码,并计算对比学习损失函数包括:

3.根据权利要求1所述的一种相似试题检索方法,其特征在于,所述对于试题的文本信息通过预训练的文本模型提取出文本表征通过卷积处理,获得试题的局部表征,再通过池化获得全局表征包括:

4.根据权利要求1或3所述的一种相似试题检索方法,其特征在于,计算最大化全局与局部表征的目标损失函数表示为:

5.根据权利要求1或3所述的一种相似试题检索方法,其特征在于,所述当试题具备对应的图...

【专利技术属性】
技术研发人员:何理扬佟威陈恩红刘淇黄振亚李锐黄威
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1