System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 庭审笔录生成方法、装置、设备及可读存储介质制造方法及图纸_技高网

庭审笔录生成方法、装置、设备及可读存储介质制造方法及图纸

技术编号:41282723 阅读:6 留言:0更新日期:2024-05-11 09:32
本申请公开了一种庭审笔录生成方法、装置、设备及可读存储介质,大语言模型通过预训练、微调、基于人类反馈的强化学习的方式,展现出了巨大的超强的语言理解能力、逻辑推理能力以及生成能力。利用大语言模型对样本庭审语音转写文本进行多轮次规整处理后得到高质量的样本庭审笔录。利用高质量的样本庭审笔录训练得到的庭审笔录生成模型也将学习到超强的庭审笔录生成能力,因此,基于庭审笔录生成模型实现利用庭审语音转写文本生成庭审笔录的方案,能够提升庭审笔录的生成效率及准确度。

【技术实现步骤摘要】

本申请涉及自然语言处理,更具体的说,是涉及一种庭审笔录生成方法、装置、设备及可读存储介质


技术介绍

1、庭审笔录又称法庭笔录或审判笔录,是法院裁判案件不可缺少的书面材料,是法院依法作出裁决的重要依据,也是日后进行审判监督的重要材料,应当客观、真实、及时、准确地反映庭审的全部活动。随着信息技术的发展,语音转写技术在庭审方面已经得到应用,具体的,在法院庭审过程中,采用庭审语音系统实时录制庭审语音(即,法官及当事人等各角色在庭审过程中的全部语音信息),并得到庭审语音转写为文本,但是,庭审语音的录制与转写受到多方面因素的影响,导致庭审语音转写文本从格式上及内容上均与庭审笔录有较大差别,因此,需要对庭审语音转写文本进行整理,以生成庭审笔录。

2、目前,需要由专门的庭审人员按照固定格式对庭审语音转写文本进行整理,以生成庭审笔录,受限于庭审人员对案件内容及法律法规的了解程度,该方式会导致生成的庭审笔录的效率及准确率较低。

3、因此,如何提供一种利用庭审语音转写文本生成庭审笔录的方案,以提升庭审笔录的生成效率及准确度,成为本领域技术人员亟待解决的技术问题。


技术实现思路

1、鉴于上述问题,本申请提出了一种庭审笔录生成方法、装置、设备及可读存储介质,以提升庭审笔录的生成效率及准确度。具体方案如下:

2、一种庭审笔录生成方法,所述方法包括:

3、获取庭审语音转写文本以及与所述庭审语音转写文本对应的法律文书;

4、将所述庭审语音转写文本和所述法律文书,输入庭审笔录生成模型,得到所述庭审笔录生成模型输出的庭审笔录,所述庭审笔录生成模型是利用样本庭审语音转写文本、所述样本庭审语音转写文本对应的样本法律文书以及所述样本庭审语音转写文本和所述样本法律文书对应的样本庭审笔录训练得到的,所述样本庭审笔录是利用大语言模型对所述样本庭审语音转写文本进行多轮次规整处理后得到的。

5、可选地,利用大语言模型对所述样本庭审语音转写文本进行多轮次规整处理得到所述样本庭审笔录的方式,包括:

6、利用大语言模型对所述样本庭审语音转写文本依次进行纠错处理、规范化处理以及对话归纳处理,得到所述样本庭审笔录。

7、可选地,利用大语言模型对所述样本庭审语音转写文本进行多轮次规整处理得到所述样本庭审笔录的方式,包括:

8、针对每一当前轮次,利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的样本庭审语音转写文本;当前轮次为首轮次时,当前轮次待规整处理的所述样本庭审语音转写文本为所述样本庭审语音转写文本,当前轮次为非首轮次时,当前轮次待规整处理的所述样本庭审语音转写文本为当前轮次的上一轮次规整处理后的样本庭审语音转写文本;

9、将最后一轮次规整处理后的样本庭审语音转写文本,作为所述样本庭审笔录。

10、可选地,所述利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的样本庭审语音转写文本,包括:

11、利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的原始样本庭审语音转写文本;

12、从所述当前轮次规整处理后的原始样本庭审语音转写文本中,确定当前轮次规整处理后的候选样本庭审语音转写文本;

13、从所述当前轮次规整处理后的候选样本庭审语音转写文本中,确定当前轮次规整处理后的目标候选样本庭审语音转写文本,作为所述当前轮次规整处理后的样本庭审语音转写文本。

14、可选地,所述利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的样本庭审语音转写文本,包括:

15、获取与所述当前轮次规整处理匹配的prompt格式模板;

16、基于所述与所述当前轮次规整处理匹配的prompt格式模板,生成与所述当前轮次规整处理匹配的prompt;

17、将所述与所述当前轮次规整处理匹配的prompt输入所述大语言模型,得到所述当前轮次规整处理后的样本庭审语音转写文本。

18、可选地,所述从所述当前轮次规整处理后的候选样本庭审语音转写文本中,确定当前轮次规整处理后的目标候选样本庭审语音转写文本,包括:

19、利用所述大语言模型对所述当前轮次规整处理后的每个候选样本庭审语音转写文本进行打分;

20、选取分数最高的作为当前轮次规整处理后的目标候选样本庭审语音转写文本。

21、可选地,所述将所述庭审语音转写文本和所述法律文书,输入庭审笔录生成模型,得到所述庭审笔录生成模型输出的庭审笔录,包括:

22、将所述庭审语音转写文本和所述法律文书进行拼接,输入庭审笔录生成模型,所述庭审笔录生成模型对所述庭审语音转写文本和所述法律文书进行编码,得到所述庭审笔录生成模型输出的庭审笔录,其中,所述庭审笔录生成模型在每个编码时刻,都能关注到所述法律文书。

23、一种庭审笔录生成装置,所述装置包括:

24、获取单元,用于获取庭审语音转写文本以及与所述庭审语音转写文本对应的法律文书;

25、生成单元,用于将所述庭审语音转写文本和所述法律文书,输入庭审笔录生成模型,得到所述庭审笔录生成模型输出的庭审笔录,所述庭审笔录生成模型是利用样本庭审语音转写文本、所述样本庭审语音转写文本对应的样本法律文书以及所述样本庭审语音转写文本和所述样本法律文书对应的样本庭审笔录训练得到的,所述样本庭审笔录是利用大语言模型对所述样本庭审语音转写文本进行多轮次规整处理后得到的。

26、可选地,所述装置还包括样本庭审笔录生成单元,所述样本庭审笔录生成单元,包括:

27、利用大语言模型对所述样本庭审语音转写文本依次进行纠错处理、规范化处理以及对话归纳处理,得到所述样本庭审笔录。

28、可选地,所述样本庭审笔录生成单元,包括:

29、当前轮次规整处理单元,用于针对每一当前轮次,利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的样本庭审语音转写文本;当前轮次为首轮次时,当前轮次待规整处理的所述样本庭审语音转写文本为所述样本庭审语音转写文本,当前轮次为非首轮次时,当前轮次待规整处理的所述样本庭审语音转写文本为当前轮次的上一轮次规整处理后的样本庭审语音转写文本;

30、样本庭审笔录确定单元,用于将最后一轮次规整处理后的样本庭审语音转写文本,作为所述样本庭审笔录。

31、可选地,所述当前轮次规整处理单元,具体用于:

32、利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的原始样本庭审语音转写文本;

33、从所述当前轮次规整处理后的原始样本庭审语音转写文本中,确定当前轮本文档来自技高网...

【技术保护点】

1.一种庭审笔录生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,利用大语言模型对所述样本庭审语音转写文本进行多轮次规整处理得到所述样本庭审笔录的方式,包括:

3.根据权利要求1或2所述的方法,其特征在于,利用大语言模型对所述样本庭审语音转写文本进行多轮次规整处理得到所述样本庭审笔录的方式,包括:

4.根据权利要求3所述的方法,其特征在于,所述利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的样本庭审语音转写文本,包括:

5.根据权利要求3所述的方法,其特征在于,所述利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的样本庭审语音转写文本,包括:

6.根据权利要求4所述的方法,其特征在于,所述从所述当前轮次规整处理后的候选样本庭审语音转写文本中,确定当前轮次规整处理后的目标候选样本庭审语音转写文本,包括:

7.根据权利要求1所述的方法,其特征在于,所述将所述庭审语音转写文本和所述法律文书,输入庭审笔录生成模型,得到所述庭审笔录生成模型输出的庭审笔录,包括:

8.一种庭审笔录生成装置,其特征在于,所述装置包括:

9.一种庭审笔录生成设备,其特征在于,包括存储器和处理器;

10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的庭审笔录生成方法的各个步骤。

...

【技术特征摘要】

1.一种庭审笔录生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,利用大语言模型对所述样本庭审语音转写文本进行多轮次规整处理得到所述样本庭审笔录的方式,包括:

3.根据权利要求1或2所述的方法,其特征在于,利用大语言模型对所述样本庭审语音转写文本进行多轮次规整处理得到所述样本庭审笔录的方式,包括:

4.根据权利要求3所述的方法,其特征在于,所述利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前轮次规整处理后的样本庭审语音转写文本,包括:

5.根据权利要求3所述的方法,其特征在于,所述利用所述大语言模型对当前轮次待规整处理的所述样本庭审语音转写文本进行规整处理,得到当前...

【专利技术属性】
技术研发人员:高建清闫莉朱虹双袁小龙孔常青潘嘉刘聪王士进胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1