当前位置: 首页 > 专利查询>三峡大学专利>正文

一种法律文本的量子聚类系统及方法技术方案

技术编号:19057153 阅读:21 留言:0更新日期:2018-09-29 12:14
一种法律文本的量子聚类系统及方法,包括法律文书输入系统、法律文本量子聚类挖掘系统、数据库、法律文书输出系统;有关法律文本通过法律文书输入系统输入并由法律文本量子聚类挖掘系统进行预处理和清洗并存入数据库。再由法律文本量子聚类挖掘系统对完成初步处理和清洗的法律文本进行聚类分析,包括使用量子态波函数描述所处理的法律文本或记录,对所有文本和记录进行分组,并将相似的文本和记录集中于一个聚集中,能够利用量子态函数的叠加特性、相干特性、纠缠特性迅速地处理大量文本,发现任意形状的文本聚类和文本的异常现象和行为,并将量子聚类挖掘结果图形化输出,供用户决策参考。

【技术实现步骤摘要】
一种法律文本的量子聚类系统及方法
本专利技术属于法律文本聚类分析领域和量子计算领域,具体涉及一种法律文本的量子聚类系统及方法。
技术介绍
在如今飞速发展的互联网时代,互联网在各个领域的运用越来越广泛,全球信息量急剧增加。同样,在法律领域,文本聚类方法作为能够帮助用户快速有效地找到所需信息的方法,它具有广泛的应用。文本聚类目前已经形成了多种门类,如划分方法、层次方法、基于密度的方法、基于的网格方法、知识工程方法、统计学习的方法、智能聚类方法(如人工神经网络、模糊系统和进化算法等),都取得了一定的效果。但是目前的法律文本的传统聚类方法与系统缺点也是很明显的。首先,传统的聚类方法都没有有效地解决对大规模无序文本的快速计算和处理问题。随着国家法治化建设的全面展开和人们法制观念的增强,法院要处理的案件也与日俱增,司法机关案多人少的形势逾来逾严峻,容易延长办案周期,影响办案质量。单纯地增加人手并不足够应付法律文本所呈现的指数型增长。其次,传统算法难以发现任意形状的聚类。比如基于距离的聚类算法通常只能发现近似球状簇,如何发现任意形状的簇在聚类算法设计中显得尤为重要。不同形状的簇在同一个案件也会导致不同的聚类结果,从而做出不一样的判决。再次,传统类算法处理噪声数据的能力较弱。在现实中,一些数据虽然数量很少,但是对算法结果或审判结果影响很严重,比如关键证据链。由于案件的复杂性、疑难性,传统的聚类算法难免会遗漏掉其中的某些信息,忽视证据的完整性,造成裁判案件偏差,极有可能导致冤假错案的发生,甚至引发社会矛盾和群体性事件。最后,传统的聚类算法可伸缩性较差。对于无序数据库,传统的聚类算法搜索的规模随着数据库规模的增长而成线性增长,在经典算法中需要O(N)时间才能完成整个搜索过程。好的可伸缩性要求聚类算法在不同数据集上均具有很强的鲁棒性,无论对于大数据集还是小数据集均是有效的。法律是国家维护社会秩序的最基本手段,随着社会的发展,人们更渴望得到及时、公正客观的裁判和处理方案,为了维护法律的稳定和社会群众对法律的信仰,维护社会稳定,这就要求法院和其他机构在适用法律文本时更加准确与恰当。但是,我国目前还没有关于法律文本的量子聚类方法与系统。
技术实现思路
为了克服上述现有技术的缺陷,本专利技术提供了一种法律文本的量子聚类系统及方法,通过利用量子聚类的方法来挖掘法律文本中相关的法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本、以及其他相关文本的数据,聚类处理进行细化加工,为司法从业人员提供准确可行的裁判方案。本专利技术采取的技术方案为:一种法律文本的量子聚类系统,包括法律文书输入系统、法律文本量子聚类挖掘系统、数据库、法律文书输出系统。所述法律文书输入系统安装于司法机关、公安机关、监察机关、仲裁机构;用于将刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、或者个人及单位信息文本输入并存入数据库;所述法律文本量子聚类挖掘系统安装于司法机关的法律信息管理系统;用于对输入的刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本进行初步处理和清洗并存入数据库;所述法律文本量子聚类挖掘系统,利用量子聚类方法对完成初步处理和清洗的法律文本进行聚类分析,包括使用量子态波函数描述所处理的法律文本或记录,对所有文本和记录进行分组,并将相似的文本和记录集中于一个聚集中;进一步地,能够根据上述文本类型进行聚类,也能够根据相关法律规定进行聚类,也能够根据司法机关、公安机关、监察机关、仲裁机构的不同进行聚类,也能够从程序和实体等方面进行聚类,或者根据需要进行聚类;进一步地,在量子聚类过程中,能够利用量子态函数的叠加特性、相干特性、纠缠特性迅速地处理大量文本,发现任意形状的文本聚类和文本的异常现象和行为,并将异常或不符合要求的文本内容进行排除和预警处理。所述法律文本量子聚类挖掘系统,利用量子聚类方法对数据库中的所有法律文本进行精确挖掘,从法律文本集合中搜索所有的高频簇,再对这些高频簇建立任意形状的关联规则,从而发现常规思维难以发现的两个或多个文本或变量之间存在的某种规律性;进一步地,能够利用量子态函数的叠加特性、相干特性、纠缠特性挖掘数量巨大的刑事、民事、行政和其他案件的文本群、人群、案件群的行为特征和区域特征,提高文本利用效率;进一步地,能够将挖掘结果以图形形式输出到法律文书输出系统,辅助用户对法律本文进行精确评估和计算。所述法律文本量子聚类挖掘系统,利用量子聚类方法对上述进行精确计算的结果再次审核挖掘,根据相关法律规定对司法机关、公安机关、监察机关、仲裁机构及与案件有关的事实情况,从程序和实体方面进行分析和审核挖掘,将不符合程序公正和实体公正的内容进行排除和处理,使程序公正和实体公正结合。所述数据库安装于司法机关的法律信息管理系统,用于存储法律文书输入系统101输入的有关法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本;所述数据库用于存储法律文本量子聚类挖掘系统预处理阶段、精处理阶段、审核阶段的所有计算结果和相关数据。所述法律文书输出系统安装于司法机关、和公安机关、监察机关、仲裁机构,通过打印、屏幕显示、或者客户终端方式输出量子聚类挖掘结果。所述法律文书输入系统为多元输入系统,安装于司法机关、公安机关、监察机关、仲裁机构,利用扫描仪,电子文档,监控设备将有关法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本输入并存入数据库。所述物证文本包括:刑事方面证明案件真实情况的一切物品和痕迹,包括作案工具、赃款赃物、脚印、指纹、血迹、体液、毛发等生物样本、清单、图片,照片、相关物品复制品、复制件等;民事或行政方面以其形状、质量、规格来证明案件事实的物品;所述书证文本包括:刑事、民事或行政等方面以文字、符号、图画等记载或表达人的一定思想的物品,包括合同书、遗嘱、授权委托书、房产证、结婚证、借据、日记、罚款单据、营业执照等文字材料;所述笔录文本包括:刑事犯罪嫌疑人,违法嫌疑人,被侵害人或证人的详细身份和话语记录的文字,包括被害人陈述,犯罪嫌疑人,刑事被告人供述、辩解,违法嫌疑人陈述和申诉,证人证言,鉴定意见笔录,现场记录,勘验笔录,检查笔录,侦查笔录,庭审笔录等;民事或行政方面的接待笔录,问话笔录,询问笔录,证人证言,勘验笔录,鉴定意见笔录,庭审笔录等;所述视听资料文本包括:刑事、民事或行政等方面以录音、录像等形式存储信息证明案件真实情况的资料,包括与案件真实情况有关的以录音、录像、光盘、监控等。所述电子数据文本包括:刑事、民事或行政,以电子计算机或其他高科技设备所存储的信息证明案件真实情况的资料,包括电子邮件、电子数据交换、网上聊天记录、博客、微博客、手机短信、电子签名、域名等相关电子数据资料。所述个人及单位信息文本包括:当事人,法定代理人,委托代理人,证人,司法机关、公安机关、监察机关、仲裁机构等从业人员的个人信息及其所在机关单位信息。所述法律本文档来自技高网
...

【技术保护点】
1.一种法律文本的量子聚类系统,包括法律文书输入系统(101)、法律文本量子聚类挖掘系统(102)、数据库(103)、法律文书输出系统(104);其特征在于:所述法律文书输入系统(101)安装于司法机关、公安机关、监察机关、仲裁机构;用于将刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、或者个人及单位信息文本输入并存入数据库(103);所述法律文本量子聚类挖掘系统(102)安装于司法机关的法律信息管理系统;用于对输入的刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本进行初步处理和清洗并存入数据库(103);所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对完成初步处理和清洗的法律文本进行聚类分析,包括使用量子态波函数描述所处理的法律文本或记录,对所有文本和记录进行分组,并将相似的文本和记录集中于一个聚集中;进一步地,能够根据上述文本类型进行聚类,也能够根据相关法律规定进行聚类,也能够根据司法机关、公安机关、监察机关、仲裁机构的不同进行聚类,也能够从程序和实体等方面进行聚类,或者根据需要进行聚类;进一步地,在量子聚类过程中,能够利用量子态函数的叠加特性、相干特性、纠缠特性迅速地处理大量文本,发现任意形状的文本聚类和文本的异常现象和行为,并将异常或不符合要求的文本内容进行排除和预警处理;所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对数据库(103)中的所有法律文本进行精确挖掘,从法律文本集合中搜索所有的高频簇,再对这些高频簇建立任意形状的关联规则,从而发现常规思维难以发现的两个或多个文本或变量之间存在的某种规律性;进一步地,能够利用量子态函数的叠加特性、相干特性、纠缠特性挖掘数量巨大的刑事、民事、行政和其他案件的文本群、人群、案件群的行为特征和区域特征,提高文本利用效率;进一步地,能够将挖掘结果以图形形式输出到法律文书输出系统(104),辅助用户对法律本文进行精确评估和计算;所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对案件进行预处理,初步挖掘计算案件性质和程度,并将结果存入数据库(103);所述数据库(103)安装于司法机关的法律信息管理系统,用于存储法律文书输入系统(101)输入的有关法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本;所述数据库(103)用于存储法律文本量子聚类挖掘系统(102)预处理阶段、精处理阶段、审核阶段的所有计算结果和相关数据;所述法律文书输出系统(104)安装于司法机关、和公安机关、监察机关、仲裁机构,通过打印、屏幕显示、或者客户终端方式输出量子聚类挖掘结果,供用户决策参考。...

【技术特征摘要】
1.一种法律文本的量子聚类系统,包括法律文书输入系统(101)、法律文本量子聚类挖掘系统(102)、数据库(103)、法律文书输出系统(104);其特征在于:所述法律文书输入系统(101)安装于司法机关、公安机关、监察机关、仲裁机构;用于将刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、或者个人及单位信息文本输入并存入数据库(103);所述法律文本量子聚类挖掘系统(102)安装于司法机关的法律信息管理系统;用于对输入的刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本进行初步处理和清洗并存入数据库(103);所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对完成初步处理和清洗的法律文本进行聚类分析,包括使用量子态波函数描述所处理的法律文本或记录,对所有文本和记录进行分组,并将相似的文本和记录集中于一个聚集中;进一步地,能够根据上述文本类型进行聚类,也能够根据相关法律规定进行聚类,也能够根据司法机关、公安机关、监察机关、仲裁机构的不同进行聚类,也能够从程序和实体等方面进行聚类,或者根据需要进行聚类;进一步地,在量子聚类过程中,能够利用量子态函数的叠加特性、相干特性、纠缠特性迅速地处理大量文本,发现任意形状的文本聚类和文本的异常现象和行为,并将异常或不符合要求的文本内容进行排除和预警处理;所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对数据库(103)中的所有法律文本进行精确挖掘,从法律文本集合中搜索所有的高频簇,再对这些高频簇建立任意形状的关联规则,从而发现常规思维难以发现的两个或多个文本或变量之间存在的某种规律性;进一步地,能够利用量子态函数的叠加特性、相干特性、纠缠特性挖掘数量巨大的刑事、民事、行政和其他案件的文本群、人群、案件群的行为特征和区域特征,提高文本利用效率;进一步地,能够将挖掘结果以图形形式输出到法律文书输出系统(104),辅助用户对法律本文进行精确评估和计算;所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对案件进行预处理,初步挖掘计算案件性质和程度,并将结果存入数据库(103);所述数据库(103)安装于司法机关的法律信息管理系统,用于存储法律文书输入系统(101)输入的有关法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本;所述数据库(103)用于存储法律文本量子聚类挖掘系统(102)预处理阶段、精处理阶段、审核阶段的所有计算结果和相关数据;所述法律文书输出系统(104)安装于司法机关、和公安机关、监察机关、仲裁机构,通过打印、屏幕显示、或者客户终端方式输出量子聚类挖掘结果,供用户决策参考。2.根据权利要求1所述一种法律文本的量子聚类系统,其特征在于:所述法律文书输入系统(101)为多元输入系统,利用扫描仪,电子文档,监控设备将有关法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本输入并存入数据库(103)。3.根据权利要求2所述一种法律文本的量子聚类系统,其特征在于:所述物证文本包括:刑事方面证明案件真实情况的一切物品和痕迹,包括作案工具、赃款赃物、脚印、指纹、血迹、体液、毛发等生物样本、清单、图片,照片、相关物品复制品、复制件等;民事或行政方面以其形状、质量、规格来证明案件事实的物品;以上所述书证文本包括:刑事、民事或行政等方面以文字、符号、图画等记载或表达人的一定思想的物品,包括合同书、遗嘱、授权委托书、房产证、结婚证、借据、日记、罚款单据、营业执照等文字材料;以上所述笔录文本包括:刑事犯罪嫌疑人,违法嫌疑人,被侵害人或证人的详细身份和话语记录的文字,包括被害人陈述,犯罪嫌疑人,刑事被告人供述、辩解,违法嫌疑人陈述和申诉,证人证言,鉴定意见笔录,现场记录,勘验笔录,检查笔录,侦查笔录,庭审笔录等;民事或行政方面的接待笔录,问话笔录,询问笔录,证人证言,勘验笔录,鉴定意见笔录,庭审笔录等;以上所述视听资料文本包括:刑事、民事或行政等方面以录音、录...

【专利技术属性】
技术研发人员:蔡政英张礼娜周琰王蕊
申请(专利权)人:三峡大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1