基于大数据的智能检务平台制造技术

技术编号:18445095 阅读:33 留言:0更新日期:2018-07-14 10:27
本发明专利技术提供了一种基于大数据的智能检务平台,包括:文档大数据单元,用于存储与案件相关的文档信息;语音采集单元,用于采集案件审理现场的语音信息;智能化语音‑文字转换单元,用于根据语音信息转换成文字。本平台极大地提高了审理现场的语音识别准确度,有利于提高审理效率。

Intelligent inspection platform based on large data

The invention provides an intelligent inspection platform based on large data, which includes the large data unit of the document to store the document information related to the case; the speech acquisition unit is used to collect the voice information of the case trial, and the intelligentized speech conversion unit is used to convert the speech information into text. This platform greatly improves the accuracy of speech recognition on trial sites, and helps to improve the efficiency of hearing.

【技术实现步骤摘要】
基于大数据的智能检务平台
本专利技术属于法律大数据处理
,具体涉及一种基于大数据的智能检务平台。
技术介绍
随着信息技术的不断发展,司法系统对自动化进程也提出了越来越高的要求。法院审理的各类案件信息已经足以构成大数据意义上的待处理数据。经检索,现有技术中申请号为CN201710426297.1提供了一种刑事案件智能辅助办案方法,适于对公安子系统、检察院子系统和法院子系统提供办案辅助,所述公安子系统、检察院子系统和法院子系统均与服务器通信,包括以下步骤:步骤21,公安子系统对一个案件中的一个或多个证据文件进行证据采集、录入和校验;步骤22,公安子系统获取输入的待审请求指令,并根据证据文件的校验结果判断是否符合提出待审请求的要求,若是,则通过服务器向检察院子系统发出待审请求;步骤23,检察院子系统获取公安子系统对该案件的证据文件及其校验结果;步骤24,检察院子系统对该案件的证据文件进行证据链审查;步骤25,检察院子系统获取输入的发出审查结果指令,并根据证据文件的证据链审查结果判断是否符合发出审查结果的要求,若是,则通过服务器向公安子系统或法院子系统发出审查结果。然而,现有的案件大数据处理系统对于互联网信息的关联信息检索能力仍然有待提高。现有技术中,随着国家的法律越来越健全和完善,人们的法律意识越来越提高,司法类案件的数量也越来越多。并且人们在处理一件案件时,也习惯性的去查找相关的案件进行参考,以便对本身案件所涉及的案点和相关法律更知晓和了解。然而,对于现有的案件查询或检索来说,人们普遍是通过通用搜索引擎进行广泛的查询,而这种查询方式的查询准确率比较低,往往需要人们进行大量筛选后才能查询到有用的参考案件。此外,人们还可以通过司法部门的专用系统进行查询或检索,而这种的专用查询方式相比较通用搜索引擎来说,其准确率有所提高,但是其无论是在手续上,还是在操作方式上,都比较繁琐,并不能灵活的适用于民间进行检索,并且,常规的司法类案件检索,也普遍是基于关键字的全文检索系统来实现的,而这种的检索只能直接检索是否出现相关关键字,在准确率上也比较低。
技术实现思路
为了提高司法系统案件审查的自动化水平,本专利技术提供了一种基于大数据的智能检务平台,包括:文档大数据单元,用于存储与案件相关的文档信息;语音采集单元,用于采集案件审理现场的语音信息;智能化语音-文字转换单元,用于根据语音信息转换成文字。进一步地,所述智能化语音-文字转换单元包括:文档选取单元,用于根据所述语音信息选取文档;文档标记单元,用于根据所述语音信息标记所述文档;审理过程确认单元,用于根据所述语音信息生成审理过程确认文书。进一步地,所述语音采集单元为多声道语音采集单元。进一步地,所述多声道语音采集单元包括语音信息处理单元以及分布式设置的多个话筒。进一步地,所述文档选取单元包括文档名称确定单元,用于根据语音信息生成文字,并根据文字对应的文档名称从所述文档大数据单元中选取文档。进一步地,所述文档标记单元用于将所述文字添加到所述文档。进一步地,所述文档大数据单元为关系型文档大数据单元。进一步地,所述审理过程确认单元包括:文档建立单元,用于建立审理过程确认文档;内容生成单元,用于将所述文档和所述文字添加到所述审理过程确认文档。进一步地,所述文档名称确定单元包括:S(w)为语音信号能量谱密度函数,cn为倒谱系数,通过cn可得到倒谱距离l为:N为话筒个数,d为各话筒位置相对于主审法官位置的距离标准差,其中N(n)为所述语音信息中的噪声信号,S(n)为去除噪声后的语音信息的语音信号;pi(k)为基于倒谱距离的语音频率分量,话筒n的语音信号x(n)在n时刻的短时平均能量为:为Hamming窗函数;对各个话筒组成的pi(k)组成矩阵,该矩阵与En的特征值相乘,求得协方差矩阵G;对矩阵G求取特征值A,进而得到对于各个话筒的倒谱调整信号本专利技术的技术方案具有以下优点:实现了能够最大程度地降低审理现场噪声的基于大数据的智能检务平台,通过该平台,能够对语音转换成文字过程中的噪声加以有效降低,据测试,相比于现有技术的HMM等模型的语音-文字识别技术其识别有效性高出70%以上,因此非常适用于在法庭以外的任何场所进行案件审理时提供稳定和可靠的文字转换,极大地提高了在审理效率。附图说明图1示出了根据本专利技术的优选实施例的平台组成框图。具体实施方式如图1所示,一种基于大数据的智能检务平台,包括:文档大数据单元,用于存储与案件相关的文档信息;语音采集单元,用于采集案件审理现场的语音信息;智能化语音-文字转换单元,用于根据语音信息转换成文字。所述智能化语音-文字转换单元包括:文档选取单元,用于根据所述语音信息选取文档;文档标记单元,用于根据所述语音信息标记所述文档;审理过程确认单元,用于根据所述语音信息生成审理过程确认文书。所述语音采集单元为多声道语音采集单元。所述多声道语音采集单元包括语音信息处理单元以及分布式设置的多个话筒。所述文档选取单元包括文档名称确定单元,用于根据语音信息生成文字,并根据文字对应的文档名称从所述文档大数据单元中选取文档。所述文档标记单元用于将所述文字添加到所述文档。所述文档大数据单元为关系型文档大数据单元。所述审理过程确认单元包括:文档建立单元,用于建立审理过程确认文档;内容生成单元,用于将所述文档和所述文字添加到所述审理过程确认文档。所述文档名称确定单元包括:S(w)为语音信号能量谱密度函数,cn为倒谱系数,通过cn可得到倒谱距离l为:N为话筒个数,d为各话筒位置相对于主审法官位置的距离标准差,其中N(n)为所述语音信息中的噪声信号,S(n)为去除噪声后的语音信息的语音信号;pi(k)为基于倒谱距离的语音频率分量,话筒n的语音信号x(n)在n时刻的短时平均能量为:为Hamming窗函数;对各个话筒组成的pi(k)组成矩阵,该矩阵与En的特征值相乘,求得协方差矩阵G;对矩阵G求取特征值A,进而得到对于各个话筒的倒谱调整信号以上所述仅为本专利技术的较佳实施例而已,并不用以限制本专利技术,凡在本专利技术的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网
...

【技术保护点】
1.一种基于大数据的智能检务平台,其特征在于,包括:文档大数据单元,用于存储与案件相关的文档信息;语音采集单元,用于采集案件审理现场的语音信息;智能化语音‑文字转换单元,用于根据语音信息转换成文字。

【技术特征摘要】
1.一种基于大数据的智能检务平台,其特征在于,包括:文档大数据单元,用于存储与案件相关的文档信息;语音采集单元,用于采集案件审理现场的语音信息;智能化语音-文字转换单元,用于根据语音信息转换成文字。2.根据权利要求1所述的系统,其特征在于,所述智能化语音-文字转换单元包括:文档选取单元,用于根据所述语音信息选取文档;文档标记单元,用于根据所述语音信息标记所述文档;审理过程确认单元,用于根据所述语音信息生成审理过程确认文书。3.根据权利要求2所述的系统,其特征在于,所述语音采集单元为多声道语音采集单元。4.根据权利要求3所述的系统,其特征在于,所述多声道语音采集单元包括语音信息处理单元以及分布式设置的多个话筒。5.根据权利要求2所述的系统,其特征在于,所述文档选取单元包括文档名称确定单元,用于根据语音信息生成文字,并根据文字对应的文档名称从所述文档大数据单元中选取文档。6.根据权利要求2所述的系统,其特征在于,所述文档标...

【专利技术属性】
技术研发人员:蒋志群李弘珊
申请(专利权)人:成都安信思远信息技术有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1