System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于人机协作类案的检索方法、设备及存储介质技术_技高网
当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于人机协作类案的检索方法、设备及存储介质技术

技术编号:43298903 阅读:15 留言:0更新日期:2024-11-12 16:15
本发明专利技术公开了一种基于人机协作类案的检索方法、设备及存储介质,包括以下步骤:S1、将历史法律案例文档中的句子聚类;S2、通过ProtoEM算法获得法律从业者和机器的联合概率决策,并使用联合概率决策更新混淆矩阵;S3、以概率方式结合法律从业者对于关键句子的决策和机器对于关键句子的决策,将法律从业者的离散决策适配到混淆矩阵中,建立联合决策模型;S4、利用联合决策模型检索匹配法律案例。本发明专利技术的检索结果更加准确和全面,有效提升法律实务中的工作效率和决策质量。

【技术实现步骤摘要】

本专利技术涉及人工智能应用,尤其涉及一种基于人机协作类案的检索方法、设备及存储介质


技术介绍

1、在法律领域,法律从业者通常需要参考大量与待办案件相似的法律案例(即类案)帮助对案件进行更加客观的判断。类案的定义为已经被裁定并且在法律基本事实,争议焦点和法律适用性方面与待判断案件相似的案件。在律师进行辩护时,类案可以为辩护提供参考,对辩护的合理性有重大意义。与一般的信息检索不同,法律类案的检索在很大程度上依赖于法律从业者的隐性知识,例如专业知识和工作经验。法律从业者愿意投入更多的精力,以获得准确和全面的结果,确保司法裁决的公平性和公正性。然而,尽管法律从业者具有丰富的法律隐性知识,但他们缺乏从大型法律案例数据库中检索相关案例的能力,特别是在司法判决场景中有限的时间限制下。最近,使用人工智能模型(本专利技术称作“机器”)来支持法律案例检索的现象日益普遍。这些机器之所以备受青睐,是因为它们能够精准识别数值之间的微小差异,并在确定相关性时考虑复杂的特征集,因此成为自动分析和检索大型语料库的首选。虽然机器有很多优点,但新的研究发现,机器缺少足够的法律知识,在法律场景下的检索性能会受到影响。考虑到法律从业者的隐性知识通常难以用机器编码表达,这一点变得尤为明显。将法律从业者的隐性知识,例如专业知识和工作经验准确地表达和编码成为机器可理解的形式是一项挑战。因此,完全依赖机器而忽视法律从业者的隐性知识将难以提供可靠且正确的结果。

2、现有技术中,关于人机协作类案检索主要存在以下两个方面的挑战:一是如何建立人机协作范式,二是如何估计人类决策的不确定性。

3、如何建立人机协作范式,利用法律从业者的隐性知识:隐性知识通常源于法律从业者对法律领域的长期实践经验、专业素养和深刻理解。尽管如此,如何将这些知识有效地融入机器以提升法律案件检索的效率和准确性仍是一大挑战。在实现人机协作的过程中,传统的量化测量方法往往难以捕捉法律从业者的直觉、经验和专业判断,尤其是在处理复杂案件时。因此,探索一种灵活而智能的机制,让法律从业者能够将其专业判断和知识以机器可理解的方式表达出来,以便于与机器进行有效的互动和协作,显得尤为重要。此外,由于隐性知识通常是非结构化且个体化的,难以用传统语言清晰描述,故对这些知识的机器解读需要更多的研究与探索。总体而言,要实现法律从业者与机器之间的有效合作,需要找到一种既能利用法律从业者的专业知识和经验,又能兼顾机器的计算能力与智能性的新型合作模式。这种模式有望为法律领域的信息检索和案件处理带来根本性的改变,显著提升效率、准确性和智能化水平。

4、如何估计人类决策的不确定性,将离散的人类决策与连续的模型输出相结合,提升类案检索效果:在类案检索任务中,法律从业者面对的是复杂多变的决策场景,其中充斥着不确定性。这种不确定性既可能源自案例本身的多样性和复杂性,也可能来自法律从业者对案件细节及相关法律条文的解释和理解。在这样的背景下,实现有效的人机协作便显得尤为困难。首先,法律从业者的决策通常基于其丰富的专业知识和经验,涉及众多主观因素,通常表现为类别标签、评级或二元选择(如:相关或不相关)。这些决策是离散的,属于有限的选择范畴,缺乏连续性。因此,在与机器协作时,如何将这些主观且离散的决策转换为连续的数值型结果,如相似度得分、概率或预测值,便成为关键问题。其次,由于法律案例的复杂性和多样性,机器往往难以准确模拟法律从业者的决策过程,这进一步影响了人机协作的效果。目前,估计人类决策不确定性的方法往往依赖于真实标签的辅助,但在法律领域,关键句子往往缺少这种标签,使得这些方法难以适用。因此,本专利技术提出一种新的方法来估计人类决策的不确定性,不依赖于真实标签的存在。这需要对人类决策过程进行深入的理解和建模,以及对人类行为和语言进行详尽地分析和解读。


技术实现思路

1、本专利技术的目的在于提供一种基于人机协作类案的检索方法、设备及存储介质,通过将法律从业者的隐性知识融合到机器中,以实现更加精确的类案检索。

2、为实现上述目的,本专利技术提供如下技术方案:一种基于人机协作类案的检索方法,包括以下步骤:

3、s1、将历史法律案例文档中的句子通过k-means算法聚类;

4、s2、通过protoem算法获得法律从业者和机器的联合概率决策,并使用联合概率决策为每个原型创建一个混淆矩阵,并且通过最大化目标函数不断更新混淆矩阵,其量化了法律从业者在类似决策行为中的不确定性,而无需得知真实标签。

5、s3、以概率方式结合法律从业者对于关键句子的决策和机器对于关键句子的决策,将法律从业者的离散决策通过混淆矩阵转换为概率决策,建立联合决策模型;

6、s4、利用联合决策模型使用选定后的关键句子去检索匹配法律案例。

7、在一些实施例中,s1中,包括以下步骤:

8、首先,将历史法律案例文档中的文本分割成单独的句子;

9、然后,将句子输入到legal-bert模型中对每个句子进行特征编码;

10、最后,确定聚类的数量,使用k-means算法对编码后的句子特征进行聚类。

11、在一些实施例中,s2中,所述每个原型的混淆矩阵计算表达式为:

12、

13、式中,1[·]为一个指示函数;hi为法律从业者对于关键句子的决策;mi为机器对于关键句子的决策;yi为真实决策;k为第k个句子;φt-1上一步的目标函数值,是法律从业者和机器做出的联合决策。

14、在一些实施例中,s3中,所述混淆矩阵为:

15、

16、式中,di为第i个句子;是原型pk上的平均句子嵌入。

17、在一些实施例中,s3中,所述联合决策模型为:

18、

19、式中,hi为法律从业者对于关键句子的决策;mi为机器对于关键句子的决策;yi为真实决策;k为第k个句子;mij为mi的第j个维度;j真实标签的句子类别;c为句子的类别;[φi]kq为每个元素通过此时的决策q和法律从业者对于关键句子的决策hi在句子di上的不一致率;[φi]kj为每个元素通过真实决策yi和法律从业者对于关键句子的决策hi在句子di上的不一致率。

20、一种设备,其特征在于,所述设备包括存储器和处理器,其中,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现所述的基于人机协作类案的检索方法。

21、一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,用以实现所述的基于人机协作类案的检索方法。

22、与现有技术相比较,本专利技术具有如下有益效果:

23、本专利技术通过co-retrieval算法,使用基于概率的方法将法律从业者的决策和机器的决策进行融合,同时使用protoem算法在缺少真实标签的情况下对法律从业者决策的不确定性进行评估;本专利技术的检索结果更加准确和全面,有效提升法律实本文档来自技高网...

【技术保护点】

1.一种基于人机协作类案的检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于人机协作类案的检索方法,其特征在于,S1中,包括以下步骤:

3.根据权利要求1所述的一种基于人机协作类案的检索方法,其特征在于,S2中,联合概率决策为每个原型创建一个混淆矩阵为:

4.根据权利要求1所述的一种基于人机协作类案的检索方法,其特征在于,S3中,所述混淆矩阵为:

5.根据权利要求1所述的一种基于人机协作类案的检索方法,其特征在于,S3中,所述联合决策模型为:

6.一种设备,其特征在于,所述设备包括存储器和处理器,其中,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现权利要求1-5任一项所述的基于人机协作类案的检索方法。

7.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,用以实现权利要求1-5任一项所述的基于人机协作类案的检索方法。

【技术特征摘要】

1.一种基于人机协作类案的检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于人机协作类案的检索方法,其特征在于,s1中,包括以下步骤:

3.根据权利要求1所述的一种基于人机协作类案的检索方法,其特征在于,s2中,联合概率决策为每个原型创建一个混淆矩阵为:

4.根据权利要求1所述的一种基于人机协作类案的检索方法,其特征在于,s3中,所述混淆矩阵为:

5.根据权利要求1所述的一种基于人机协作类...

【专利技术属性】
技术研发人员:雷文强杨欣威黄晨
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1