一种法考客观题上下文检索方法和系统技术方案

技术编号:38971522 阅读:29 留言:0更新日期:2023-09-28 09:35
本发明专利技术公开了一种法考客观题上下文检索方法和系统,涉及在线教育技术领域,所述方法包括:获取待检索语句;考虑法律专有名词的重要性、完整性和非专有名词的多样性对所述待检索语句进行预处理,得到目标检索分词,根据BM25算法和所述目标检索分词从预构建的法考语料库中获取检索结果;展示所述检索结果。本发明专利技术基于传统的BM25算法,结合法考客观题的特点进行改进优化,能够从大量的法考书籍和法规法条中为一道客观题关联若干个相关的上下文,提高了检索精度和效率。提高了检索精度和效率。提高了检索精度和效率。

【技术实现步骤摘要】
一种法考客观题上下文检索方法和系统


[0001]本专利技术涉及在线教育
,具体涉及一种法考客观题上下文检索方法和系统。

技术介绍

[0002]司法考试是国家统一法律职业资格考试,近几年参加司法考试的人数越来越多,且司法考试难度较大,司法考试分为客观题和主观题两部分,只有通过了客观题才可以参加主观题。司法考试的参考教材数量多,知识点丰富,学员在进行客观题练习的时候,如果可以依据题目和选项快速定位到相关知识点对应的参考教材,可以为学员节省大量时间。如果依靠专业人员进行人工对应,由于题目众多,会耗费大量的时间和人力。文本检索技术旨在从大量的语料库中找到与目标文本相似的若干篇上下文,该技术可以很好的用于解决上述问题。目前对于文本检索技术的研究,大致集中在以下两个方面:
[0003]第一,基于统计学习方法的文本检索方法。此类方法通常对一篇文档进行字、词或词组方面进行统计求出文档两两间的相似程度,类似于Jaccard系数、TF

IDF和BM25等方法。这类算法的速度通常较快,效果不差,经过任务相关的优化,会得到较好的准确率本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种法考客观题上下文检索方法,其特征在于,所述方法包括:获取待检索语句,其中,所述待检索语句包括客观题的题目及所述题目对应的至少一个选项;考虑法律专有名词的重要性、完整性和非专有名词的多样性对所述待检索语句进行预处理,得到目标检索分词,根据BM25算法和所述目标检索分词从预构建的法考语料库中获取检索结果,所述检索结果至少包括一条上下文;展示所述检索结果。2.根据权利要求1所述的一种法考客观题上下文检索方法,其特征在于,考虑法律专有名词的重要性、完整性和非专有名词的多样性对所述待检索语句进行预处理,得到目标检索语句包括:根据停用词表过滤所待检索语句中的停用词;根据法律词典识别过滤后的待检索语句中的关键词,复制所述关键词并拼接在过滤后的待检索语句的末尾,得到目标检索语句,所述法律词典包括若干法律专有名词;优先利用第一分词器对所述目标检索语句进行分词,再利用第二分词器对所述目标检索语句进行分词,得到目标检索分词,其中,所述第一分词器以常规词典为分词表,所述第二分词器以所述法律词典为分词表。3.根据权利要求2所述的一种法考客观题上下文检索方法,其特征在于,根据BM25算法和所述目标检索分词从预构建的法考语料库中获取检索结果包括:利用BM25算法计算所述目标检索分词与所述法考语料库中各个上下文之间的相似度;根据所述相似度对各个上下文进行降序排序,将前k个上下文作为检索结果。4.根据权利要求3所述的一种法考客观题上下文检索方法,其特征在于,构建所述法考语料库包括:获取法考参考书籍和法条法规;对所述法考参考书籍所对应的第一上下文和所述法条法规所对应的第二上下文进行清洗,并按照分割标识对所述第一上下文进行分割,得到法考语料库,其中,所述分割标识包括换行符和结束符。5.一种法考客...

【专利技术属性】
技术研发人员:刘琛杨旭川陈旭阳顾颃陈鹏钢
申请(专利权)人:重庆觉晓科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1