一种自主可控平台下的文档共享智能管理系统技术方案

技术编号:27935218 阅读:8 留言:0更新日期:2021-04-02 14:15
本发明专利技术的目的是提供一种基于B/S架构的自主可控平台下的文档共享智能管理系统,它克服了现有技术的不足,能够完成基于B/S架构下的多种类型文档的智能管理、分享下载、在线浏览等功能,具备智能化、平台化和国产化典型特点。系统主要包含11个部分:文档在线浏览引擎、前台展示模块、文档上传模块、文档处理模块、文档下载模块、信息存储模块、智能化推荐模块、OCR识别模块、智能化内容管控模块、搜索引擎以及用户权限管理模块组成,通过前台展示和后台管理可以提供栏目管理、文档处理、搜索引擎、智能推荐、安全机制、订阅、统计分析等功能。

【技术实现步骤摘要】
一种自主可控平台下的文档共享智能管理系统
本专利技术涉及一种自主可控平台下的文档共享智能管理系统。该系统基于国产飞腾CPU、国产操作系统、数据库及基础应用软件开发与运行,可独立完成基于浏览器的多种类型文档的智能管理、智能分享、在线浏览等。该专利技术属于知识共享应用软件领域。
技术介绍
如今中国已进入知识经济时代,知识资源成为一个国家最重要的战略资源之一,更是提升国家核心竞争力的关键所在。随着社会竞争日益激烈,人们学习时间呈现碎片化趋势,更依赖通过互联网高效的提升自我。尤其自2012年以来,随着互联网教育行业兴起,通过网络获取知识、进行学习的人数越来越多,云计算、智能手机、平板电脑、大数据等技术逐步进入人们的生活,并在短时间内改变了人们的行为模式,这使得人们更迫切需要一个在线的知识分享平台。目前,平台化、智能化和国产化已成为军用信息系统的发展方向。由于客观原因,我国的军用文档共享管理系统大多功能不完整,且还远未达到平台化、智能化的程度。长期以来,受制于国产软硬件的技术发展水平,现有系统中大量使用了国外软硬件产品,系统软件不具备跨平台的能力,安全性难以得到保障。因此,设计一种分布式运行,可灵活扩展,且具备全体系平台化、智能化特点的分布式文档共享管理系统具有非常重要的意义。
技术实现思路
1、目的:本专利技术的目的是提供一种自主可控平台下的文档共享智能管理系统,它克服了现有技术的不足,能够完成基于B/S架构下的多种类型文档的智能管理、分享下载、在线浏览等功能,具备智能化、平台化和国产化典型特点。2、
技术实现思路
:如图1所示,本专利技术是一种基于B/S架构的自主可控平台下的文档共享智能管理系统1,系统1主要包含11个部分:文档在线浏览引擎2、前台展示模块3、文档上传模块4、文档处理模块5、文档下载模块6、信息存储模块7、智能化推荐模块10、OCR识别模块13、智能化内容管控模块19、搜索引擎20以及用户权限管理模块21组成,系统1分为前台系统和后台系统,前台系统主要完成文档上传下载、在线浏览、订阅、搜索等功能,后台系统主要完成栏目管理、用户管理、统计分析、文档审核等功能。它们各自的功能如下所述:前台展示模块3提供可视化操作界面给用户和系统管理员,文档在线浏览引擎2和文档处理5采用OpenOffice服务和基于js的PDF预览插件的技术栈,文档处理5在服务器端通过文档转码服务将文档转换为PDF,转码过程通过前台展示模块3实时呈现给用户,文档在线浏览引擎2接收文档处理5转码后的PDF文件并通过浏览器预览插件展示到web页面,实现了文档的在线浏览,全程无需人为干预,实现了智能化,其中OpenOffice服务在国产操作系统下做了兼容适配,解决了转码服务无法在自主可控平台上提供服务的问题;用户通过文档上传模块4、文档下载6等子模块完成各种类型文档的上传、下载。用户上传的文档由信息存储7存储在国产数据库中并可进行分布式存储,实现了自主可控平台下高性能、海量数据的存储。智能化内容管控模块19包括文档解析引擎22、内容智能管控18、文本检测引擎16、图片检测引擎17,系统针对国产自主可控平台二次开发了高性能文档解析引擎22,上传的全部文档自动经过文档解析引擎处理,将文档内容解析后分别由文本检测引擎16和图片检测引擎17对文本和图片内容进行检测,并过滤文本、图片中的敏感词,可设置敏感词库和智能规则库,对文档进行实时检测过滤,未通过审核的文档或图片由内容智能管控18锁定,并由系统管理员处理。用户权限管理模块21对用户、权限进行管理,支持不同用户在预览、阅读、下载、打印等操作时的精细化权限控制,该模块采用了RBAC模型进行用户权限管理,并提供多种角色,可设置用户黑白名单。智能化推荐模块10实现了自主可控平台下的智能推荐主要包括算法模型更新模块11和在线实时计算引擎12,算法模型更新模块11采用智能识别和语义分析双引擎模式,融合协同过滤、关联挖掘等多种推荐算法,支持双引擎推荐结果动态融合,自动为用户选择优化的算法组合,支持自定义模型调参,多种算法引擎可以动态调节核心参数,算法实时更新,无需干预可以实现算法模型自动升级,在线实时计算引擎12监控用户的行为操作,实时采集用户不同维度的使用习惯,结合文档点击量、下载量、收藏量、订阅量、评分等数据,根据算法模型更新模块12选择的算法组合进行实时计算,将结果返回到前台展示模块3,实现了高时效、高质量的个性化推荐。搜索引擎20集成了全文检索引擎,并针对国产操作系统、国产数据库进行了深度定制开发,解决了现有全文检索引擎与国产平台无法很好兼容的问题,提供了性能良好的全文检索功能。所述的信息存储模块7包含两部分:分布式存储8和国产数据库9。其中国产数据库9存储的是文档信息、处理流程、用户信息、敏感词信息、审核流程、运行环境配置、订阅数据、专题模板信息、推荐算法、系统监控、系统操作日志等。软件采用基于插件的扩展架构,通过插件开发实现对不同类型、品牌数据库的支持。分布式存储8提供分布式存储功能,目前支持曙光分布式存储、神通国产数据库、达梦国产数据库等。所述的OCR识别模块13主要包括OCR识别引擎15和文字处理引擎14。其中,OCR识别引擎15集成了OCR控件,并针对国产自主可控平台进行了深度二次开发,解决了在自主可控平台下OCR控件无法唤起、识别率低等问题,文字处理引擎14针对识别出的文字通过智能识别和语义分析双重模式进行处理,解决了国产平台下中文识别出现乱码、中文识别率低的问题。总体而言,文档共享智能管理系统在Eclipse平台下采用Java开发,支持浏览器在线浏览,个性化推荐算法采用Python开发,整合了多种推荐算法,数据支持国产神通数据库和国产达梦数据库。整个系统具备在windows和麒麟操作系统下兼容运行能力。3、优点及效果:从以上的描述可以看出,该文档共享智能管理系统与现有的技术相比,具备以下优点:(1)本专利技术提供了一个本地化文档资源共享、存储、检索系统,系统支持自主可控平台下的在线文档浏览、上传、打印、下载,通过对文档内容的解析提供了内容管控、文档推荐等功能,完成了军用文档共享管理系统在国产自主可控平台下的兼容,并且实现了平台化、智能化;(2)系统既支持分布式部署也支持单机运行,其中单机部署运行是分布式部署运行的一种特殊情况,分布式部署采用完全松耦合的组成方式,大大降低了系统复杂度,提升了分布式系统的可靠性;(3)系统采用了支持自主可控平台的高性能文档检测引擎,包括文本检测引擎和图片检测引擎,实现了对文本内容和图片内容的实时智能化监控,并且专利技术了基于自主可控平台下的智能审核管理系统,实现了内容统一管控、全程溯源、实时审查;(4)本系统专利技术了一种基于自主可控平台下的数字水印溯源方法,设计了一种数字水印加密算法,以解决现有技术中算法鲁棒性差,抗删除攻击性差、抗增加攻击差等问题,为用户提供了文档的安全管理功能,有效防止偷拍、截屏,通过数字水印中的用户相关信息可以快速定位,大大提高了文档溯源能力;(5)支持在windows、Linux和麒麟操作系统下兼容运行本文档来自技高网
...

【技术保护点】
1.本专利技术是一种基于B/S架构的自主可控平台下的文档共享智能管理系统,系统主要包含11个部分:文档在线浏览引擎、前台展示模块、文档上传模块、文档处理模块、文档下载模块、信息存储模块、智能化推荐模块、OCR识别模块、智能化内容管控模块、搜索引擎模块以及用户权限管理模块组成,系统分为前台系统和后台系统,前台系统主要完成文档上传下载、在线浏览、订阅、搜索等功能,后台系统主要完成栏目管理、用户管理、统计分析、文档审核等功能;它们各自的功能如下所述:前台展示模块提供可视化操作界面给用户和系统管理员,文档在线浏览引擎和文档处理采用OpenOffice服务和基于js的PDF预览插件的技术栈,文档处理在服务器端通过文档转码服务将各种类型的文档转换为PDF,转码过程通过前台展示模块实时呈现给用户,当转码发生错误时,可在后台进行重启等操作,文档在线浏览引擎接收文档处理转码后的PDF文件并通过浏览器预览插件展示到web页面,实现了文档的在线浏览,全程无需人为干预,实现了智能化,其中OpenOffice服务在国产操作系统下做了兼容适配,解决了转码服务无法在自主可控平台上提供服务的问题。/n

【技术特征摘要】
1.本发明是一种基于B/S架构的自主可控平台下的文档共享智能管理系统,系统主要包含11个部分:文档在线浏览引擎、前台展示模块、文档上传模块、文档处理模块、文档下载模块、信息存储模块、智能化推荐模块、OCR识别模块、智能化内容管控模块、搜索引擎模块以及用户权限管理模块组成,系统分为前台系统和后台系统,前台系统主要完成文档上传下载、在线浏览、订阅、搜索等功能,后台系统主要完成栏目管理、用户管理、统计分析、文档审核等功能;它们各自的功能如下所述:前台展示模块提供可视化操作界面给用户和系统管理员,文档在线浏览引擎和文档处理采用OpenOffice服务和基于js的PDF预览插件的技术栈,文档处理在服务器端通过文档转码服务将各种类型的文档转换为PDF,转码过程通过前台展示模块实时呈现给用户,当转码发生错误时,可在后台进行重启等操作,文档在线浏览引擎接收文档处理转码后的PDF文件并通过浏览器预览插件展示到web页面,实现了文档的在线浏览,全程无需人为干预,实现了智能化,其中OpenOffice服务在国产操作系统下做了兼容适配,解决了转码服务无法在自主可控平台上提供服务的问题。


2.所述的智能化内容管控模块包括文档解析引擎、内容智能管控、文本检测引擎、图片检测引擎,系统针对国产自主可控平台二次开发了高性能文档解析引擎,上传的全部文档自动经过文档解析引擎处理,将文档内容解析后分别由文本检测引擎和图片检测引擎对文本和图片内容进行检测,并过滤文本、图片中的敏感词,可设置敏感词库和智能规则库,对文档进行实时检测过滤,未通过审核的文档或图片由内容智能管控锁定,并由系统管理员处理。


3.所述的智能化推荐模块实现了自主可控平台下的智能推荐主要包括算法模型更新模块和在线实时计算...

【专利技术属性】
技术研发人员:卢少鹏焦冬冬周淦穆天华王泽彬邵武长沈亚楠马铭钖
申请(专利权)人:中国电子信息产业集团有限公司第六研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1