System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种电子卷宗智能标注管理系统技术方案_技高网

一种电子卷宗智能标注管理系统技术方案

技术编号:40975680 阅读:4 留言:0更新日期:2024-04-18 21:23
本发明专利技术公开了一种电子卷宗智能标注管理系统,涉及电子卷宗管理技术领域,该系统包括信息录入模块、粗分类模块、标注模块、审核验证模块、分析评估模块以及对比检索模块,信息录入模块,以电子扫描的方式将纸质卷宗的内容信息上传至数据库存储,形成电子卷宗;粗分类模块,在数据库中进行关键词匹配,根据匹配结果,将电子卷宗分为三类;其技术要点为:针对每类电子卷宗,对标记的关键词进行审核验证,在审核出问题时,可将标记错误的关键词剔除,而后将剩余正确的样本数据继续训练深度学习模型,增加了训练数据的总量,从而提高训练深度学习模型的准确度,如此循环操作,能够进一步的提高对关键词审核验证的准确性和效率。

【技术实现步骤摘要】

本专利技术涉及电子卷宗管理,具体为一种电子卷宗智能标注管理系统


技术介绍

1、电子卷宗管理技术是指利用信息技术手段对电子卷宗进行组织、存储、检索、共享和保护的一套技术和方法,通过电子卷宗管理技术,可以实现电子卷宗的数字化、全生命周期管理和智能化处理;电子卷宗管理技术的关键点包括数字化处理、存储和管理以及数据分析和挖掘等,其中的数字化处理是将纸质卷宗或其他形式的物理档案转化为电子格式,进行数字化处理,包括扫描、图像处理以及ocr技术。

2、现有授权公告号为cn110321439b,名称为一种电子标注管理方法及系统的专利中指出的技术方案包括接收用户针对当前卷宗输入的标注内容,并将所述标注内容与所述当前卷宗进行绑定后,将所述标注内容写入标注列表中;接收所述用户输入的检索关键词,并在所述标注列表中展示与所述检索关键词相匹配的目标标注内容;当所述目标标注内容被触发时,自动定位至与所述目标标注内容相绑定的目标卷宗,并向所述用户展示所述目标卷宗以及所述目标卷宗内的所述目标标注内容,上述专利提供的电子标注管理方法及系统,虽然能够全面地辅助法官进行无纸化办公,以提高阅览卷宗和审理案件的效率,但其无法保证对于关键词标注操作的准确性。

3、结合上述专利和现有技术,在对司法案件的电子卷宗进行管理标注过程中,通常会使用到搭建于服务器内的电子卷宗管理系统,由于其自动化的设计,导致其并不需要或是很少需要人工介入,故具有一定的智能性,然而在进行关键词标注过后,还是需要人工验证,验证效率较低的同时,其关键词标注的准确性还是得不到显著提升


技术实现思路

1、(一)解决的技术问题

2、针对现有技术的不足,本专利技术提供了一种电子卷宗智能标注管理系统,针对每类电子卷宗,对标记的关键词进行审核验证,在审核出问题时,可将标记错误的关键词剔除,而后将剩余正确的样本数据继续训练深度学习模型,增加了训练数据的总量,从而提高训练深度学习模型的准确度,如此循环操作,能够进一步的提高对关键词审核验证的准确性和效率,解决了
技术介绍
中提出的问题。

3、(二)技术方案

4、为实现以上目的,本专利技术通过以下技术方案予以实现:

5、一种电子卷宗智能标注管理系统,该系统包括:

6、信息录入模块,以电子扫描的方式将纸质卷宗的内容信息上传至数据库存储,形成电子卷宗;

7、粗分类模块,在数据库中进行关键词匹配,根据匹配结果,将电子卷宗分为民事案件、刑事案件以及行政案件三类;

8、标注模块,搭建深度学习模型,学习并训练预先标注的训练数据,且训练数据包括人名、地名以及时间,使用训练完成的深度学习模型对三类电子卷宗进行自动标注;

9、审核验证模块,在每类电子卷宗中,依据每个电子卷宗对应的关键词,建立并执行搜索查询,若是搜索关键词内容重合,则表示标注正确,不做响应;反之,则表示标注错误,执行标记并剔除对应关键词的策略,并用标准正确的样本数据继续训练深度学习模型,并再次进行自动标注操作,直至不做响应为止;

10、分析评估模块,获取评估参数,且评估参数包括每类电子卷宗在审核验证过程中标注对应关键词错误的次数和,对应关键词在对应类电子卷宗中出现错误的频次值,搭建数据分析模型,依据经过预处理的评估参数,生成对应关键词的搜索评估值evk;

11、对比检索模块,获取电子卷宗中,每个关键词的搜索评估值evk,并对各个搜索评估值evk进行对比,按照从小到大的顺序进行排序,并发出提示信号。

12、进一步的,关键词匹配的具体过程为:提取电子卷宗中的关键词,并与预定义的关键词列表进行匹配,民事案件包含的关键词包括“合同”、“赔偿”以及“纠纷”;刑事案件包含的关键词包括“犯罪”、“侦查”以及“审判”;行政案件包含的关键词包括“行政争议”和“行政执法”。

13、进一步的,对三类电子卷宗进行自动标注的具体过程如下:

14、s101、数据准备:对三类需要标注的电子卷宗页面进行预处理;

15、s102、深度学习模型训练:利用深度学习技术,设计并训练深度学习模型,该模型学习已标注的训练数据,即人名、地名以及时间;

16、s103、特征抽取:使用文本处理技术,对电子卷宗页面中的文字进行特征抽取;

17、s104、标注实体识别:利用训练好的深度学习模型,对电子卷宗页面进行自动标注,模型基于已学习的模式和规则,识别出人名、地名以及时间这类关键信息,并对其进行标注和输出。

18、进一步的,建立并执行搜索查询的过程如下:

19、s201、根据已知的关键词,构建在数据库中执行的搜索查询,采用正则表达式查询;

20、s202、将构建完成的搜索查询应用于数据库,执行查询操作;

21、s203、利用自然语言处理技术进行文本匹配,自动判断对应的电子卷宗中是否包含关键词,即搜索得出的关键词内容是否重合。

22、进一步的,对评估参数进行预处理的过程还包括计算次数值,每类电子卷宗在审核验证过程中标注对应关键词错误次数的计算方式为:将对应关键词在对应类电子卷宗中出现错误的次数累加,得到次数。

23、进一步的,对评估参数进行预处理的过程包括计算频次值,对应关键词在对应类电子卷宗中出现错误的频次值的计算方式为:将对应关键词在对应类电子卷宗中出现错误的次数除以训练深度学习模型的次数,得到频次值。

24、进一步的,获取评估参数时使用到数据可视化工具,且数据可视化工具包括matplotlib或tableau。

25、进一步的,生成所有电子卷宗中,对应关键词的搜索评估值evk所依据的公式如下:

26、

27、式中,evlt表示对应类电子卷宗中,对应关键词的搜索评估系数,zs表示总次数,pc表示频次和,a1、a2分别为总次数zs和频次和pc的预设比例系数,且a1>a2>0,g为常数修正系数,t=1、2、3。

28、进一步的,提示信号的内容为:显示搜索排序第一的对应关键词,排序越靠前的关键词,检索得到的准确性越高。

29、一种电子卷宗智能标注管理方法,包括如下具体步骤:s1、以电子扫描的方式将纸质卷宗的内容信息上传至数据库存储,形成电子卷宗;

30、s2、在数据库中进行关键词匹配,根据匹配结果,将电子卷宗分为民事案件、刑事案件以及行政案件三类;

31、其中,关键词匹配的具体过程为:提取电子卷宗中的关键词,并与预定义的关键词列表进行匹配,民事案件包含的关键词包括“合同”、“赔偿”以及“纠纷”;刑事案件包含的关键词包括“犯罪”、“侦查”以及“审判”;行政案件包含的关键词包括“行政争议”和“行政执法”;

32、s3、搭建深度学习模型,学习并训练预先标注的训练数据,且训练数据包括人名、地名以及时间,使用训练完成的深度学习模型对三类电子卷宗进行自动标注;

33、其中,对三类电子卷宗本文档来自技高网...

【技术保护点】

1.一种电子卷宗智能标注管理系统,其特征在于,该系统包括:信息录入模块,以电子扫描的方式将纸质卷宗的内容信息上传至数据库存储,形成电子卷宗;

2.根据权利要求1所述的一种电子卷宗智能标注管理系统,其特征在于:关键词匹配的具体过程为:提取电子卷宗中的关键词,并与预定义的关键词列表进行匹配,民事案件包含的关键词包括“合同”、“赔偿”以及“纠纷”;刑事案件包含的关键词包括“犯罪”、“侦查”以及“审判”;行政案件包含的关键词包括“行政争议”和“行政执法”。

3.根据权利要求2所述的一种电子卷宗智能标注管理系统,其特征在于:对三类电子卷宗进行自动标注的具体过程如下:

4.根据权利要求3所述的一种电子卷宗智能标注管理系统,其特征在于:建立并执行搜索查询的过程如下:

5.根据权利要求4所述的一种电子卷宗智能标注管理系统,其特征在于:对评估参数进行预处理的过程包括计算次数值,每类电子卷宗在审核验证过程中标注对应关键词错误次数的计算方式为:将对应关键词在对应类电子卷宗中出现错误的次数累加,得到次数。

6.根据权利要求5所述的一种电子卷宗智能标注管理系统,其特征在于:对评估参数进行预处理的过程还包括计算频次值,对应关键词在对应类电子卷宗中出现错误的频次值的计算方式为:将对应关键词在对应类电子卷宗中出现错误的次数除以训练深度学习模型的次数,得到频次值。

7.根据权利要求6所述的一种电子卷宗智能标注管理系统,其特征在于:获取评估参数时使用到数据可视化工具,且数据可视化工具包括matplotlib或Tableau。

8.根据权利要求7所述的一种电子卷宗智能标注管理系统,其特征在于:生成所有电子卷宗中,对应关键词的搜索评估值Evk所依据的公式如下:

9.根据权利要求8所述的一种电子卷宗智能标注管理系统,其特征在于:提示信号的内容为:显示搜索排序第一的对应关键词。

...

【技术特征摘要】

1.一种电子卷宗智能标注管理系统,其特征在于,该系统包括:信息录入模块,以电子扫描的方式将纸质卷宗的内容信息上传至数据库存储,形成电子卷宗;

2.根据权利要求1所述的一种电子卷宗智能标注管理系统,其特征在于:关键词匹配的具体过程为:提取电子卷宗中的关键词,并与预定义的关键词列表进行匹配,民事案件包含的关键词包括“合同”、“赔偿”以及“纠纷”;刑事案件包含的关键词包括“犯罪”、“侦查”以及“审判”;行政案件包含的关键词包括“行政争议”和“行政执法”。

3.根据权利要求2所述的一种电子卷宗智能标注管理系统,其特征在于:对三类电子卷宗进行自动标注的具体过程如下:

4.根据权利要求3所述的一种电子卷宗智能标注管理系统,其特征在于:建立并执行搜索查询的过程如下:

5.根据权利要求4所述的一种电子卷宗智能标注管理系统,其特征在于:对评估参数进行预处理的过程包括计算次数值,每类电子卷...

【专利技术属性】
技术研发人员:张慧丽杨唯郭伟
申请(专利权)人:河南简德网络科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1