【技术实现步骤摘要】
一种法律文本的量子聚类系统及方法
本专利技术属于法律文本聚类分析领域和量子计算领域,具体涉及一种法律文本的量子聚类系统及方法。
技术介绍
在如今飞速发展的互联网时代,互联网在各个领域的运用越来越广泛,全球信息量急剧增加。同样,在法律领域,文本聚类方法作为能够帮助用户快速有效地找到所需信息的方法,它具有广泛的应用。文本聚类目前已经形成了多种门类,如划分方法、层次方法、基于密度的方法、基于的网格方法、知识工程方法、统计学习的方法、智能聚类方法(如人工神经网络、模糊系统和进化算法等),都取得了一定的效果。但是目前的法律文本的传统聚类方法与系统缺点也是很明显的。首先,传统的聚类方法都没有有效地解决对大规模无序文本的快速计算和处理问题。随着国家法治化建设的全面展开和人们法制观念的增强,法院要处理的案件也与日俱增,司法机关案多人少的形势逾来逾严峻,容易延长办案周期,影响办案质量。单纯地增加人手并不足够应付法律文本所呈现的指数型增长。其次,传统算法难以发现任意形状的聚类。比如基于距离的聚类算法通常只能发现近似球状簇,如何发现任意形状的簇在聚类算法设计中显得尤为重要。不同形状的簇在同一个案件也会导致不同的聚类结果,从而做出不一样的判决。再次,传统类算法处理噪声数据的能力较弱。在现实中,一些数据虽然数量很少,但是对算法结果或审判结果影响很严重,比如关键证据链。由于案件的复杂性、疑难性,传统的聚类算法难免会遗漏掉其中的某些信息,忽视证据的完整性,造成裁判案件偏差,极有可能导致冤假错案的发生,甚至引发社会矛盾和群体性事件。最后,传统的聚类算法可伸缩性较差。对于无序数据库,传统的 ...
【技术保护点】
1.一种法律文本的量子聚类系统,包括法律文书输入系统(101)、法律文本量子聚类挖掘系统(102)、数据库(103)、法律文书输出系统(104);其特征在于:所述法律文书输入系统(101)安装于司法机关、公安机关、监察机关、仲裁机构;用于将刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、或者个人及单位信息文本输入并存入数据库(103);所述法律文本量子聚类挖掘系统(102)安装于司法机关的法律信息管理系统;用于对输入的刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本进行初步处理和清洗并存入数据库(103);所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对完成初步处理和清洗的法律文本进行聚类分析,包括使用量子态波函数描述所处理的法律文本或记录,对所有文本和记录进行分组,并将相似的文本和记录集中于一个聚集中;进一步地,能够根据上述文本类型进行聚类,也能够根据相关法律规定进行聚类,也能够根据司法机关、公安机关、 ...
【技术特征摘要】
1.一种法律文本的量子聚类系统,包括法律文书输入系统(101)、法律文本量子聚类挖掘系统(102)、数据库(103)、法律文书输出系统(104);其特征在于:所述法律文书输入系统(101)安装于司法机关、公安机关、监察机关、仲裁机构;用于将刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、或者个人及单位信息文本输入并存入数据库(103);所述法律文本量子聚类挖掘系统(102)安装于司法机关的法律信息管理系统;用于对输入的刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本进行初步处理和清洗并存入数据库(103);所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对完成初步处理和清洗的法律文本进行聚类分析,包括使用量子态波函数描述所处理的法律文本或记录,对所有文本和记录进行分组,并将相似的文本和记录集中于一个聚集中;进一步地,能够根据上述文本类型进行聚类,也能够根据相关法律规定进行聚类,也能够根据司法机关、公安机关、监察机关、仲裁机构的不同进行聚类,也能够从程序和实体等方面进行聚类,或者根据需要进行聚类;进一步地,在量子聚类过程中,能够利用量子态函数的叠加特性、相干特性、纠缠特性迅速地处理大量文本,发现任意形状的文本聚类和文本的异常现象和行为,并将异常或不符合要求的文本内容进行排除和预警处理;所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对数据库(103)中的所有法律文本进行精确挖掘,从法律文本集合中搜索所有的高频簇,再对这些高频簇建立任意形状的关联规则,从而发现常规思维难以发现的两个或多个文本或变量之间存在的某种规律性;进一步地,能够利用量子态函数的叠加特性、相干特性、纠缠特性挖掘数量巨大的刑事、民事、行政和其他案件的文本群、人群、案件群的行为特征和区域特征,提高文本利用效率;进一步地,能够将挖掘结果以图形形式输出到法律文书输出系统(104),辅助用户对法律本文进行精确评估和计算;所述法律文本量子聚类挖掘系统(102),利用量子聚类方法对案件进行预处理,初步挖掘计算案件性质和程度,并将结果存入数据库(103);所述数据库(103)安装于司法机关的法律信息管理系统,用于存储法律文书输入系统(101)输入的有关法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本;所述数据库(103)用于存储法律文本量子聚类挖掘系统(102)预处理阶段、精处理阶段、审核阶段的所有计算结果和相关数据;所述法律文书输出系统(104)安装于司法机关、和公安机关、监察机关、仲裁机构,通过打印、屏幕显示、或者客户终端方式输出量子聚类挖掘结果,供用户决策参考。2.根据权利要求1所述一种法律文本的量子聚类系统,其特征在于:所述法律文书输入系统(101)为多元输入系统,利用扫描仪,电子文档,监控设备将有关法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本输入并存入数据库(103)。3.根据权利要求2所述一种法律文本的量子聚类系统,其特征在于:所述物证文本包括:刑事方面证明案件真实情况的一切物品和痕迹,包括作案工具、赃款赃物、脚印、指纹、血迹、体液、毛发等生物样本、清单、图片,照片、相关物品复制品、复制件等;民事或行政方面以其形状、质量、规格来证明案件事实的物品;以上所述书证文本包括:刑事、民事或行政等方面以文字、符号、图画等记载或表达人的一定思想的物品,包括合同书、遗嘱、授权委托书、房产证、结婚证、借据、日记、罚款单据、营业执照等文字材料;以上所述笔录文本包括:刑事犯罪嫌疑人,违法嫌疑人,被侵害人或证人的详细身份和话语记录的文字,包括被害人陈述,犯罪嫌疑人,刑事被告人供述、辩解,违法嫌疑人陈述和申诉,证人证言,鉴定意见笔录,现场记录,勘验笔录,检查笔录,侦查笔录,庭审笔录等;民事或行政方面的接待笔录,问话笔录,询问笔录,证人证言,勘验笔录,鉴定意见笔录,庭审笔录等;以上所述视听资料文本包括:刑事、民事或行政等方面以录音、录...
【专利技术属性】
技术研发人员:蔡政英,张礼娜,周琰,王蕊,
申请(专利权)人:三峡大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。