题库的更新方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36578014 阅读:11 留言:0更新日期:2023-02-04 17:36
本公开提出一种题库的更新方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:获取候选题目的第一描述信息及对应的第一参考答案;基于第一描述信息,分别遍历第一题库及第二题库;在第一题库中未包含候选题目、且第二题库中包含候选题目的情况下,确定第一参考答案与候选题目对应的第二答案的第一匹配度;在第一匹配度大于第二阈值的情况下,更新第二题库中候选题目的第二答案的置信度;在更新后的第二答案的置信度大于第一阈值的情况下,利用候选题目及第一参考答案更新第一题库。由此,基于获取的候选题目及对应的第一参考答案,对第一题库进行自动更新,不仅扩充了题库题目,提高了搜题的成功率,而且降低了题库更新的成本。了题库更新的成本。了题库更新的成本。

【技术实现步骤摘要】
题库的更新方法、装置、电子设备及存储介质


[0001]本公开涉及数据处理
,尤其涉及一种题库的更新方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机技术的不断发展和完善,网上搜题已经在人类生活中扮演着重要的角色。用户可以通过上传题目的照片、或者自动输入题目的方式,从题库中搜索题目对应的正确答案。但是,在题库中不包含用户搜索的题目的情况下,就会导致用户无法获取对应的题目及答案。由此,如何提高用户搜题的成功率成为亟需解决的问题。

技术实现思路

[0003]本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004]本公开第一方面实施例提出了一种题库的更新方法,包括:
[0005]获取候选题目的第一描述信息及对应的第一参考答案;
[0006]基于所述第一描述信息,分别遍历第一题库及第二题库,其中,所述第一题库中每个第一题目对应的第一答案的置信度大于或等于第一阈值,所述第二题库中每个第二题目对应的第二答案的置信度小于所述第一阈值;
[0007]在所述第一题库中未包含所述候选题目、且所述第二题库中包含所述候选题目的情况下,确定所述第一参考答案与所述候选题目对应的第二答案的第一匹配度;
[0008]在所述第一匹配度大于第二阈值的情况下,更新所述第二题库中所述候选题目对应的第二答案的置信度;
[0009]在所述更新后的第二答案的置信度大于所述第一阈值的情况下,利用所述候选题目及所述第一参考答案更新所述第一题库。
[0010]可选的,在所述获取候选题目的第一描述信息及对应的参考答案之前,包括:
[0011]接收答案上传请求,其中,所述答案上传请求中包括第三题目的标签;
[0012]在所述第三题目的标签为预设的标签的情况下,确定所述第三题目为所述候选题目。
[0013]可选的,还包括:
[0014]获取题目搜索请求,其中,所述搜索请求中包括待搜索的第四题目的第二描述信息;
[0015]基于所述第二描述信息,分别遍历所述第一题库及所述第二题库;
[0016]在所述第一题库及所述第二题库中均未包含所述第四题目的情况下,确定所述第四题目的标签为所述预设的标签;
[0017]发布所述第四题目。
[0018]可选的,所述基于所述第一描述信息,分别遍历第一题库及第二题库,包括:
[0019]确定所述第一描述信息与每个科目对应的参考描述信息的第二匹配度;
[0020]根据每个所述第二匹配度,确定所述候选题目所属的科目;
[0021]根据所述候选题目所属的科目,确定待遍历的第一目标题库及第二目标题库;
[0022]基于所述第一描述信息,分别遍历所述第一目标题库及所述第二目标题库。
[0023]可选的,还包括:
[0024]获取标注数据集,其中,所述标注数据集中包括多个参考题目、每个参考题目的第三描述信息及每个参考题目所属的科目;
[0025]根据所述每个参考题目所属的科目,将所述多个参考题目进行聚类,以确定每个科目对应的参考题目集;
[0026]将每个所述参考题目集中的第三描述信息进行融合,以确定每个所述科目对应的参考描述信息的类型和/或内容。
[0027]可选的,所述利用所述候选题目及所述第一参考答案更新所述第一题库,包括:
[0028]确定所述候选题目当前对应的搜索参数;
[0029]在所述搜索参数满足预设条件的情况下,利用所述候选题目及所述第一参考答案更新所述第一题库。
[0030]可选的,所述确定所述候选题目当前对应的搜索参数,包括:
[0031]根据所述候选题目在当前时刻之前的预设时段内的被搜索次数及被搜索频率,确定所述候选题目当前对应的初始搜索参数;
[0032]获取所述预设时段内的题目搜索日志,其中,所述题目搜索日志中包括每个搜索题目的第四描述信息;
[0033]确定每个所述第四描述信息中包含的各个第一分词;
[0034]根据每个所述第一分词在所述题目搜索日志中的出现频率,确定参考分词集;
[0035]根据所述第一描述信息中每个第二分词与所述参考分词集中每个参考分词的第三匹配度,确定修正系数;
[0036]根据所述修正系数,对所述初始搜索参数进行修正,以获取所述候选题目当前对应的搜索参数。
[0037]可选的,所述第一描述信息为文本信息,所述基于所述第一描述信息,分别遍历第一题库及第二题库,包括:
[0038]确定所述文本信息对应的第一哈希值;
[0039]将所述第一哈希值进行切分,以获取多个第一子哈希值;
[0040]计算每个第一子哈希值,分别与所述第一题库中每个第一题目对应的每个第二子哈希值的第四匹配度,及与所述第二题库中每个第二题目对应的每个第三子哈希值的第五匹配度;
[0041]根据每个所述第一题目对应的多个所述第四匹配度,确定每个所述第一题目是否为所述候选题目;
[0042]根据每个所述第二题目对应的多个所述第五匹配度,确定每个所述第二题目是否为所述候选题目。
[0043]本公开第二方面实施例提出了一种题库的更新装置,包括:
[0044]第一获取模块,用于获取候选题目的第一描述信息及对应的第一参考答案;
[0045]遍历模块,用于基于所述第一描述信息,分别遍历第一题库及第二题库,其中,所
述第一题库中每个第一题目对应的第一答案的置信度大于或等于第一阈值,所述第二题库中每个第二题目对应的第二答案的置信度小于所述第一阈值;
[0046]确定模块,用于在所述第一题库中未包含所述候选题目、且所述第二题库中包含所述候选题目的情况下,确定所述第一参考答案与所述候选题目对应的第二答案的第一匹配度;
[0047]第一更新模块,用于在所述第一匹配度大于第二阈值的情况下,更新所述第二题库中所述候选题目对应的第二答案的置信度;
[0048]第二更新模块,用于在所述更新后的第二答案的置信度大于所述第一阈值的情况下,利用所述候选题目及所述第一参考答案更新所述第一题库。
[0049]可选的,所述第一获取模块,具体用于:
[0050]接收答案上传请求,其中,所述答案上传请求中包括第三题目的标签;
[0051]在所述第三题目的标签为预设的标签的情况下,确定所述第三题目为所述候选题目。
[0052]可选的,还包括:
[0053]第二获取模块,用于获取题目搜索请求,其中,所述搜索请求中包括待搜索的第四题目的第二描述信息;
[0054]所述第二获取模块,还用于基于所述第二描述信息,分别遍历所述第一题库及所述第二题库;
[0055]所述第二获取模块,还用于在所述第一题库及所述第二题库中均未包含所述第四题目的情况下,确定所述第四题目的标签为所述预设的标签;
[0056]所述第二获取模块,还用于发布所述第四题目。
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种题库的更新方法,其特征在于,包括:获取候选题目的第一描述信息及对应的第一参考答案;基于所述第一描述信息,分别遍历第一题库及第二题库,其中,所述第一题库中每个第一题目对应的第一答案的置信度大于或等于第一阈值,所述第二题库中每个第二题目对应的第二答案的置信度小于所述第一阈值;在所述第一题库中未包含所述候选题目、且所述第二题库中包含所述候选题目的情况下,确定所述第一参考答案与所述候选题目对应的第二答案的第一匹配度;在所述第一匹配度大于第二阈值的情况下,更新所述第二题库中所述候选题目对应的第二答案的置信度;在所述更新后的第二答案的置信度大于所述第一阈值的情况下,利用所述候选题目及所述第一参考答案更新所述第一题库。2.如权利要求1所述的方法,其特征在于,在所述获取候选题目的第一描述信息及对应的参考答案之前,包括:接收答案上传请求,其中,所述答案上传请求中包括第三题目的标签;在所述第三题目的标签为预设的标签的情况下,确定所述第三题目为所述候选题目。3.如权利要求2所述的方法,其特征在于,还包括:获取题目搜索请求,其中,所述搜索请求中包括待搜索的第四题目的第二描述信息;基于所述第二描述信息,分别遍历所述第一题库及所述第二题库;在所述第一题库及所述第二题库中均未包含所述第四题目的情况下,确定所述第四题目的标签为所述预设的标签;发布所述第四题目。4.如权利要求1所述的方法,其特征在于,所述基于所述第一描述信息,分别遍历第一题库及第二题库,包括:确定所述第一描述信息与每个科目对应的参考描述信息的第二匹配度;根据每个所述第二匹配度,确定所述候选题目所属的科目;根据所述候选题目所属的科目,确定待遍历的第一目标题库及第二目标题库;基于所述第一描述信息,分别遍历所述第一目标题库及所述第二目标题库。5.如权利要求4所述的方法,其特征在于,还包括:获取标注数据集,其中,所述标注数据集中包括多个参考题目、每个参考题目的第三描述信息及每个参考题目所属的科目;根据所述每个参考题目所属的科目,将所述多个参考题目进行聚类,以确定每个科目对应的参考题目集;将每个所述参考题目集中的第三描述信息进行融合,以确定每个所述科目对应的参考描述信息的类型和/或内容。6.如权利要求1

5任一所述的方法,其特征在于,所述利用所述候选题目及所述第一参考答案更新所述第一题库,包括:确定所述候选题目当前对应的搜索参数;在所述搜索参数满足预设条件的情况下,利用所述候选题目及所述第一参考答案更...

【专利技术属性】
技术研发人员:翁秋洁陈博贾若愚单想马广龙唐育洋叶智宇柳景明
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1