【技术实现步骤摘要】
一种检索方法、系统及相关设备
[0001]本申请涉及人工智能(artificial intelligence,AI)领域,尤其涉及一种检索方法、系统及相关设备。
技术介绍
[0002]类案检索指的是在给定一个查询案例的情况下,从法律案例语料库中检索出其相关案例。由于相关案例可能成为影响判决结果的参考,甚至直接参与到最终的判决结果当中,因此类案检索对于确保法律领域的公正至关重要,不仅能够帮助法律工作者更加高效的提供法律服务,也能让非法律专业人士能够对案情涉及到的法律问题有更加专业、清楚的认识。
[0003]但是,类案检索存在大量文本相同而非相关案例的场景,例如交通肇事和故意伤害中关于“不同伤残等级”的文本相同,但是二者并不是相关案例。因此类案检索不仅要判断文本的相似性,更需要识别案件在法律问题和法律程序方法的相似性,使得类案检索的精度差,用户使用体验差。
技术实现思路
[0004]本申请提供了一种检索方法、系统及相关设备,用于解决类案检索精度差的问题,提高用户的使用体验。
[0005]第一方面,提供了一种检索方法,该方法包括以下步骤:获取用户输入的查询文本,根据查询文本获取多个候选文书,其中,多个候选文书与查询文本之间的文本相关度高于阈值,确定多个候选文书中每个候选文书与查询文本之间的法律相关度,按照法律相关度对多个候选文书进行排序,获得排序结果,向用户显示排序结果。
[0006]实施第一方面描述的方法,通过获取用户输入的查询文本,然后获取多个与查询文本之间的文本相关度较高的多个 ...
【技术保护点】
【技术特征摘要】
1.一种检索方法,其特征在于,所述方法包括:获取用户输入的查询文本,根据所述查询文本获取多个候选文书,其中,所述多个候选文书与所述查询文本之间的文本相关度高于阈值;确定所述多个候选文书中每个候选文书与所述查询文本之间的法律相关度,按照所述法律相关度对所述多个候选文书进行排序,获得排序结果;向所述用户显示所述排序结果。2.根据权利要求1所述的方法,其特征在于,所述确定所述多个候选文书中每个候选文书与所述查询文本之间的法律相关度包括:将所述每个候选文书和查询文本输入法律相关度模型,获得所述每个候选文书与所述查询文本之间的法律相关度,其中,所述法律相关度模型是使用样本集对AI模型进行训练后获得的,所述样本集包括输入样本和所述输入样本的标签,所述输入样本包括查询样本和候选文书样本,所述输入样本的标签包括所述候选文书样本与所述查询样本之间的法律相关度。3.根据权利要求2所述的方法,其特征在于,所述输入样本的标签包括第一标签和第二标签,所述第一标签用于指示所述候选文书样本与所述查询样本之间的要件事实的相关度,所述第二标签用于指示所述候选文书样本与所述查询样本之间的案情事实之间的相关度。4.根据权利要求3所述的方法,其特征在于,所述法律相关度模型包括特征提取网络和预测函数,所述确定所述多个候选文书中每个候选文书与所述查询文本之间的法律相关度包括:将所述每个候选文书拆分为多个片段;将所述多个片段输入所述特征提取网络,获得所述多个片段对应的多个语义特征;将所述多个片段对应的多个语义特征进行聚合获得聚合结果;将所述聚合结果输入所述预测函数,获得所述每个候选文书与所述查询文本之间的法律相关度。5.根据权利要求2至4任一权利要求所述的方法,其特征在于,所述样本集是对样本数据进行数据增强后获得的,所述数据增强时使用的方案包括:在第二样本是第一样本的候选文书样本的情况下,所述第一样本是所述第二样本的候选文书样本。6.根据权利要求5所述的方法,其特征在于,所述数据增强时使用的方案还包括:在多个第二样本是所述第一样本的候选文书样本时,所述多个第二样本中的任意一个目标样本的候选文书样本包括所述第一样本以及除所述目标样本以外的其他第二样本。7.根据权利要求1至6任一权利要求所述的方法,其特征在于,所述候选文书与所述查询文本之间的文本相关度,是根据所述查询文本中的单词和双词在候选文书中出现的概率来确定的。8.根据权利要求1至7任一权利要求所述的方法,其特征在于,所述候选文书与所述查询文本之间的文本相关度,是根据所述查询文本的长度以及所述查询文本中的词语与所述候选文书中出现的频率确定的。9.一种检索系统,其特征在于,所述系统包括:候选生成单元,用于获取用户输入的查询文本,根据所述查询文本获取多个候选文书,
其中,所述多个候选文书与所述查询文本之间的文本相关度高于阈值;排序单元,确定所述多个候选文书中每个候选文书与所述查询文本之间的法律相关度,按照所述法律相关度对所述多个候选文书进行排序,获得排序...
【专利技术属性】
技术研发人员:陈冲,田奇,史佳欣,
申请(专利权)人:深圳华为云计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。