认知物联网大数据技术平台制造技术

技术编号:30017395 阅读:15 留言:0更新日期:2021-09-11 06:28
认知物联网大数据技术平台,包括核心模块、核心扩展模块、文本处理模块、信号/数据处理模块、定制技术模块以及接口功能模块,本发明专利技术解决了现有大数据技术从认知物联网获得的异构数据存在的存储、分析和提取信息困难的问题。题。题。

【技术实现步骤摘要】
认知物联网大数据技术平台


[0001]本专利技术涉及大数据领域,具体涉及一种认知物联网大数据技术平台。

技术介绍

[0002]由于人机交互技术和人工智能技术的飞速发展,将认知计算技术与互连设备产生的数据和这些设备可以执行的操作结合使用的认知物联网越来越普及,通过云技术、存储器以及传感器在认知物联网的大量应用,人们从认知物联网获得了海量的可用数据,然而由于这些数据的异构性,使得对其进行存储、分析和从中提取信息极为困难,因此,亟需构建专门的认知物联网大数据技术平台,以解决从认知物联网获得的异构数据存在的存储、分析和提取信息困难的问题。

技术实现思路

[0003]为了解决现有大数据平台存在的上述问题,本专利技术的目的是提供认知物联网大数据技术平台,以解决现有大数据技术从认知物联网获得的异构数据存在的存储、分析和提取信息困难的问题。
[0004]为了达到上述目的,本专利技术所采用的技术方案是:本专利技术提供了一种认知物联网大数据技术平台,包括核心模块、核心扩展模块、文本处理模块、信号/数据处理模块、定制技术模块以及接口功能模块,所述核心模块、所述核心扩展模块、所述文本处理模块、所述信号/数据处理模块、所述定制技术模块以及所述接口功能模块之间通过计算机应用程序接口相连并传送数据;
[0005]所述核心模块用于实现所述认知物联网大数据技术平台的核心功能,所述核心扩展模块用于实现所述认知物联网大数据技术平台的核心扩展功能,所述文本处理模块用于实现所述认知物联网大数据技术平台的文本处理功能,所述信号/数据处理模块用于实现所述认知物联网大数据技术平台的高级数据分析功能,所述定制技术模块用于实现所述认知物联网大数据技术平台的特定功能,所述接口功能模块用于实现所述认知物联网大数据技术平台的接口管理功能;
[0006]所述核心功能包括分布式消息处理功能、自动获取网站内容功能、管理工作流程功能、文本特征提取功能、管理地理定位信息功能、索引和搜索功能、文本修改功能、多种搜索引擎全局控制机制功能、文档预览功能、提取文档结构功能、摄取数据库的输入数据功能、高级搜索功能、各种数据源连接器功能、查询管理功能、自然语言处理功能、机器学习功能、逻辑理解功能;
[0007]所述核心扩展功能包括管理用户接口功能、域控制功能、支持LDAP认证系统功能、支持从系统数据库中提取数据功能、脚本管理功能、支持Web分布式创作和版本控制协议功能、支持应用程序之间的互操作性功能、与第三方硬件系统接口功能、许可证分配功能、处理备份策略管理流程中的操作工作流功能;
[0008]所述文本处理功能包括文件及数据库信息导入系统功能、文档拆分功能、文本特
征提取功能、建立文本索引功能、文本搜索功能、全文搜索功能、跨语言管理功能、文档分类功能、数据的爬取存储和管理功能、管理与一个或多个文档相关的逻辑细化流程功能、网页的可视化动态引擎功能、文档预览功能、演示报告生成功能、存储数据操作细化管理功能、管理系统通知功能、管理地理本地化数据功能、管理认证电子邮件系统功能、识别和提取扫描仪扫描的文档内容功能、协作编写文档功能、处理与不同知识领域相关的词汇功能、检查文档合规性功能、阅读具有非标准结构和字符的加密pdf功能、从文本中提取概念功能、管理文档版本功能;
[0009]所述高级数据分析功能包括从软件总线获取数据功能,从硬件设备下载数据功能,分析和发现重复模式、数据之间关系功能,高级统计功能,未来事件预测功能,评估和预测一系列事件动态功能,评估两个随机变量之间的关系功能,推导未来行为功能,检测、识别和突出异构数据时间序列中的异常情况功能,预定义规则的应用/验证功能,人群信息进行收集和汇总功能,搜索和分类从内部和外部来源检索的信息的配置文件功能,审查中的信息集分析功能,生成绩效全局指标功能,收敛到良好解决方案功能,对公司的运营流程偏差进行因果分析功能,跟踪所考虑的数量的未来行为功能,重新排列数据库中存在的数据结构功能,主观信息分析功能,海量数据的数据聚类功能;
[0010]所述特定功能包括定义操作程序的详尽监控过程功能,获取准确的研究信息功能,跟踪单个用户的行为和动作功能,预定义工作流功能,优化后的参数与流程情况比较功能,人与人之间的关系网络建模功能,对类似的个人进行分组功能,改进Wiki内容导航功能,调查功能,项目多重管理功能,日历管理和时间事件功能,高级日志分析功能,邮件系统管理功能,电子邮件附件管理功能,群发邮件管理功能,工单管理功能,XML提要管理功能;
[0011]所述接口管理功能包括移动设备界面管理功能,图形直观方式显示相关性功能,同步通信(即时消息)和异步通信(私人消息)支持功能,html代码验证功能,启用应用程序中各种实体的注释支持功能,指导用户使用系统功能。
[0012]进一步地,所述核心模块包括Celery模块、爬虫模块、工作流模块、特征提取器、地理数据模块、索引器、优化模块、元搜索模块、预览模块、拆分器、数据处理模块、搜索引擎、数据导入器、查询管理模块、自然语言处理模块、机器学习模块、意义引擎;所述Celery模块、所述爬虫模块、所述工作流模块、所述特征提取器、所述地理数据模块、所述索引器、所述优化模块、所述元搜索模块、所述预览模块、所述拆分器、所述数据处理模块、所述搜索引擎、所述数据导入器、所述查询管理模块、所述自然语言处理模块、所述机器学习模块以及所述意义引擎之间通过计算机应用程序接口相连并传送数据;
[0013]所述Celery模块用于提供异步任务和作业队列以实现所述分布式消息处理功能,支持计划和实时操作,使用基于Python的网络库Gevent在单节点和多节点上执行并发执行,能够在同步模式和异步模式下执行任务;
[0014]所述爬虫模块用于从互联网爬取网站以实现所述自动获取网站内容功能,与HTML模块集成以实现了解和探索页面模板功能、卷筒式自动提取功能、HTML解释及文本提取功能;
[0015]所述工作流模块为基于BPMN2.0标准的工作流程图和工作流程规范,以实现所述管理工作流程功能;
[0016]所述特征提取器用于从文本中提取IMEI代码、IP地址、电话号码、地理位置数据、
信用卡号,以实现所述文本特征提取功能;
[0017]所述地理数据模块用于根据标准拓补以及与标准拓补相关的数据以实现所述管理地理定位信息功能,通过GoogleMaps插件和JQuery传单插件可视化表示地理数据,允许管理本地化地理信息,地理空间分析IP地址能够映射到地理位置,能够识别地理距离、地理范围、地理边界框或地理多边形中的值;
[0018]所述索引器用于提供所述索引和搜索功能;
[0019]所述优化模块用于提供大小写修改、行距裁剪、字段的合并和拆分、自定义脚本,以实现所述文本修改功能;
[0020]所述元搜索模块作为所述爬虫模块的补充,用于从互联网搜索数据,通过扩展爬虫系统以在爬虫系统上能够使用多种搜索引擎执行查询,能够从查询结果中收集结果,提供支持以调用搜索引擎提供的We本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.认知物联网大数据技术平台,其特征在于,包括核心模块、核心扩展模块、文本处理模块、信号/数据处理模块、定制技术模块以及接口功能模块,所述核心模块、所述核心扩展模块、所述文本处理模块、所述信号/数据处理模块、所述定制技术模块以及所述接口功能模块之间通过计算机应用程序接口相连并传送数据;所述核心模块用于实现所述认知物联网大数据技术平台的核心功能,所述核心扩展模块用于实现所述认知物联网大数据技术平台的核心扩展功能,所述文本处理模块用于实现所述认知物联网大数据技术平台的文本处理功能,所述信号/数据处理模块用于实现所述认知物联网大数据技术平台的高级数据分析功能,所述定制技术模块用于实现所述认知物联网大数据技术平台的特定功能,所述接口功能模块用于实现所述认知物联网大数据技术平台的接口管理功能;所述核心功能包括分布式消息处理功能、自动获取网站内容功能、管理工作流程功能、文本特征提取功能、管理地理定位信息功能、索引和搜索功能、文本修改功能、多种搜索引擎全局控制机制功能、文档预览功能、提取文档结构功能、摄取数据库的输入数据功能、高级搜索功能、各种数据源连接器功能、查询管理功能、自然语言处理功能、机器学习功能、逻辑理解功能;所述核心扩展功能包括管理用户接口功能、域控制功能、支持LDAP认证系统功能、支持从系统数据库中提取数据功能、脚本管理功能、支持Web分布式创作和版本控制协议功能、支持应用程序之间的互操作性功能、与第三方硬件系统接口功能、许可证分配功能、处理备份策略管理流程中的操作工作流功能;所述文本处理功能包括文件及数据库信息导入系统功能、文档拆分功能、文本特征提取功能、建立文本索引功能、文本搜索功能、全文搜索功能、跨语言管理功能、文档分类功能、数据的爬取存储和管理功能、管理与一个或多个文档相关的逻辑细化流程功能、网页的可视化动态引擎功能、文档预览功能、演示报告生成功能、存储数据操作细化管理功能、管理系统通知功能、管理地理本地化数据功能、管理认证电子邮件系统功能、识别和提取扫描仪扫描的文档内容功能、协作编写文档功能、处理与不同知识领域相关的词汇功能、检查文档合规性功能、阅读具有非标准结构和字符的加密pdf功能、从文本中提取概念功能、管理文档版本功能;所述高级数据分析功能包括从软件总线获取数据功能,从硬件设备下载数据功能,分析和发现重复模式、数据之间关系功能,高级统计功能,未来事件预测功能,评估和预测一系列事件动态功能,评估两个随机变量之间的关系功能,推导未来行为功能,检测、识别和突出异构数据时间序列中的异常情况功能,预定义规则的应用/验证功能,人群信息进行收集和汇总功能,搜索和分类从内部和外部来源检索的信息的配置文件功能,审查中的信息集分析功能,生成绩效全局指标功能,收敛到良好解决方案功能,对公司的运营流程偏差进行因果分析功能,跟踪所考虑的数量的未来行为功能,重新排列数据库中存在的数据结构功能,主观信息分析功能,海量数据的数据聚类功能;所述特定功能包括定义操作程序的详尽监控过程功能,获取准确的研究信息功能,跟踪单个用户的行为和动作功能,预定义工作流功能,优化后的参数与流程情况比较功能,人与人之间的关系网络建模功能,对类似的个人进行分组功能,改进Wiki内容导航功能,调查功能,项目多重管理功能,日历管理和时间事件功能,高级日志分析功能,邮件系统管理功
能,电子邮件附件管理功能,群发邮件管理功能,工单管理功能,XML提要管理功能;所述接口管理功能包括移动设备界面管理功能,图形直观方式显示相关性功能,同步通信和异步通信支持功能,html代码验证功能,启用应用程序中各种实体的注释支持功能,指导用户使用系统功能。2.根据权利要求1所述的认知物联网大数据技术平台,其特征在于,所述核心模块包括Celery模块、爬虫模块、工作流模块、特征提取器、地理数据模块、索引器、优化模块、元搜索模块、预览模块、拆分器、数据处理模块、搜索引擎、数据导入器、查询管理模块、自然语言处理模块、机器学习模块、意义引擎;所述Celery模块、所述爬虫模块、所述工作流模块、所述特征提取器、所述地理数据模块、所述索引器、所述优化模块、所述元搜索模块、所述预览模块、所述拆分器、所述数据处理模块、所述搜索引擎、所述数据导入器、所述查询管理模块、所述自然语言处理模块、所述机器学习模块以及所述意义引擎之间通过计算机应用程序接口相连并传送数据;所述Celery模块用于提供异步任务和作业队列以实现所述分布式消息处理功能,支持计划和实时操作,使用基于Python的网络库Gevent在单节点和多节点上执行并发执行,能够在同步模式和异步模式下执行任务;所述爬虫模块用于从互联网爬取网站以实现所述自动获取网站内容功能,与HTML模块集成以实现了解和探索页面模板功能、卷筒式自动提取功能、HTML解释及文本提取功能;所述工作流模块为基于BPMN2.0标准的工作流程图和工作流程规范,以实现所述管理工作流程功能;所述特征提取器用于从文本中提取IMEI代码、IP地址、电话号码、地理位置数据、信用卡号,以实现所述文本特征提取功能;所述地理数据模块用于根据标准拓补以及与标准拓补相关的数据以实现所述管理地理定位信息功能,通过GoogleMaps插件和JQuery传单插件可视化表示地理数据,允许管理本地化地理信息,地理空间分析IP地址能够映射到地理位置,能够识别地理距离、地理范围、地理边界框或地理多边形中的值;所述索引器用于提供所述索引和搜索功能;所述优化模块用于提供大小写修改、行距裁剪、字段的合并和拆分、自定义脚本,以实现所述文本修改功能;所述元搜索模块作为所述爬虫模块的补充,用于从互联网搜索数据,通过扩展爬虫系统以在爬虫系统上能够使用多种搜索引擎执行查询,能够从查询结果中收集结果,提供支持以调用搜索引擎提供的Web服务或模拟用户导航,以实现所述多种搜索引擎全局控制机制功能;所述预览模块用于提供HTML、PDF、图像以及视频的预览,以实现所述文档预览功能;所述拆分器用于将PDF或文档拆分为多个独立的部分,并允许用户单独查看拆分的独立的部分,以实现所述提取文档结构功能;所述数据处理模块能够处理各种数据格式,以实现所述摄取数据库的输入数据功能;所述搜索引擎用于提供所述高级搜索功能,包括特定语义和上文、经过训练的神经网络、统计、定义模糊度的搜索组合,智能特征提取搜索,多国语言搜索,词性标记搜索,支持文档拆分搜索和上下文分析搜索;
所述数据整合模块用于为各种数据源提供所述各种数据源连接器功能,通过使用反射来提取表和关系,以自动创建模式并从外部数据库中提取数据,所述各种数据源包括关系数据库、NoSQL数据库、消息队列、日志文件、来自互联网和维基百科网站的数据、Hadoop应用程序、文件系统、Microsoft Office文档、PDF、OpenXML格式、OpenOffice文档、XML、图片、导入数据库的存档文件;所述查询管理模块通过将查询执行分布在集群的各个节点上,提供首选项以在保存数据的分片上执行查询,从而实现所述查询管理功能,所述查询管理模块提供的查询语法包括布尔值、模糊查询、基于Gremlin的图形查询、DisMax、GeoReferential以及脚本;所述自然语言处理模块通过内置的NLP模块提供的自然分析和理解语言的方法,包括上下文自然语言处理和先进的神经用户行为分析,从自然语言中提取明确而有意义的信息,以实现所述自然语言处理功能;所述上下文自然语言处理具有从原始文本中理解和识别概念的能力,能够理解和分类表征查询的主题;所述先进的神经用户行为分析能够根据用户情况调整答案;所述NLP模块建立在神经模型、模糊模型、语义模型以及统计模型的基础之上,包括最大熵和推理算法;所述机器学习模块用于提供机器学习功能,允许学习实体和关系之间存在学习关系而无需进行显式编程,学习过程受内容和对象关系驱动,并且考虑了行为和行为的历史分析,所述学习过程包括概念分析、与最终用户的交互,所述与最终用户的交互包括强制学习、通过示例学习、通过交互学习;所述意义引擎用于通过理解分析信息的含义,以实现所述逻辑理解功能;所述理解分析信息的过程,包括概念化以确定所分析信息的模式和特征,情境化以识别信息的情境并映射特征,含义以对信息进行完整的描述。3.根据权利要求1所述的认知物联网大数据技术平台,其特征在于,所述核心扩展模块包括管理用户接口模块、域控制模块、LDAP模块、LotusDomino模块、Fabric模块、WEBDAV模块、Web服务模块、适配连接器、证书模块以及海量存储存档器,所述管理用户接口模块、所述域控制模块、所述LDAP模块、所述LotusDomino模块、所述Fabric模块、所述WEBDAV模块、所述Web服务模块、所述适配连接器、所述证书模块以及所述海量存储存档器之间通过计算机应用程序接口相连并传送数据;所述管理用户接口模块通过与市场上主流浏览器兼容的Web用户界面来管理与单个模块的管理相关的参数,以实现所述管理用户接口功能,所述参数通过分层和规范化的结构表示,所述管理用户接口功能支持网页界面、桌面、移动设备、功能配置器/系统参数、多租户逻辑;所述域控制模块通过在单个网站上将系统的单个功能一对一映射,以保证唯一的关联用户功能,从而实现所述域控制功能;所述域控制功能能够从网站使用配置管理,支持多租户逻辑;所述LDAP模块用于提供所述支持LDAP认证系统功能,所述LDAP模块的功能包括目录和已定义方案的管理、与开放式LDAP集成、支持openssl;所述LotusDomino模块为LotusDomino IBM系统的集成模块,以实现所述支持从系统数据库中提取数据功能,所述LotusDomino模块的功能包括与数据库和视图直接连接、数据集成和规范化;
所述Fabric模块用于提供所述脚本管理功能,通过使用每个SSH的终端来管理脚本,以实现系统分布式部署和配置的自动化;所述Fabric模块的功能包括使用Python编写脚本,支持SSH安全连接,多种环境管理,分布式和并行任务管理;所述WEBDAV模块通过公开HTTP协议对文件档案的访问,以提供所述支持Web分布式创作和版本控制协议功能;所述WEBDAV模块还提供了阻塞正在写入的资源、管理并发写入的可能性,所述WEBDAV模块还提供了RFC2518和RFC4918中包含的功能和操作支持;所述Web服务模块通过使用Web服务的通信机制,以及通过公开套件的所有模块的特定功能以实现所述支持应用程序之间的互操作性功能;所述Web服务模块支持SOAP标准、REST标准以及密码学;所述适配连接器通过标准硬件接口的专有公开协议信息,提供所述与第三方硬件系统接口功能,支持通过串口、USB、以太网硬件进行通讯,通过解析器编辑的Web界面引导生成;所述证书模块用于实现所述许可证分配功能,包括时间许可、软件和系统许可证的控制、多租户架构中的许可证控制;所述海量存储存档器用于实现所述处理备份策略管理流程中的操作工作流功能,所述海量存储存档器在存档方面与当前的存档方法保持一致,包括备份工作流中映射的策略、程序的准确性控制。4.根据权利要求1所述的认知物联网大数据技术平台,其特征在于,所述文本处理模块包括导入模块、分配器、文本特征提取模块、文本索引器、文本搜索器、语义搜索模块、语言管理模块、分类模块、Spider模块、文档工作流引擎、演示引擎、文本预览模块、报告引擎、历史/时间线模块、管家模块、地理数据/地理名称模块、电邮认证模块、OCR模块、合作写作模块、本体模块、一致性检查器、高级PDF处理器、极端内容处理器以及版本控制器,所述管理用户接口模块、所述域控制模块、所述LDAP模块、所述LotusDomino模块、所述Fabric模块、所述WEBDAV模块、所述Web服务模块、所述适配连接器、所述证书模块以及所述海量存储存档器之间通过计算机应用程序接口相连并传送数据;所述导入模块用于实现所述文件及数据库信息导入系统功能,所述导入模块允许将有关文件的信息上传至系统,与数据库和文件系统连接以恢复需要储存的信息,所述信息是通过专有协议发布的文档、日志或数据;所述分配器用于根据预定义的逻辑通过所述导入模块拆分导入的文档,从而实现所述文档拆分功能;所述分配器核实文件结构之后,能够按照章、段、小段或按页进行拆分;所述分配器对文档的拆分功能取决于文档的原始格式,所述分配器对于拆分的单独部分保存文档中存在的层次关系,允许重建及可导航性;所述分配器还可以通过专有试探法拆分管理非格式化文档;所述文本特征提取模块用于提供所述文本特征提取功能,所述文本特征提取模块允许提取相关数据并呈现在系统上传的文档中;所述文本特征提取模块能够提取的特征包括税号、信用卡代码、驾驶执照追踪号码、电子邮件地址、身份证追踪号码、护照追踪号码、Imei代码、Imsi代码、IP地址、Mac地址、网址、车牌、摩托车牌照、日历日期、姓名、增值税号、电话号码、街道和地址、地理定位数据,所述地理定位数据可配置为国家和居民人数;所述文本索引器用于构建链接到上传信息的一系列索引,以实现所述建立文本索引功能,所述文本索引器为分布式和冗余的结构以保证最大可靠性,所述文本索引器的索引基
本元素包括用于索引系统使用的引擎、保存索引信息的路径、参数配置、定义数据索引规则的字段、数据过滤器;所述文本搜索器用于提供所述文本搜索功能,所述文本搜索器能够在使用所述导入模块上传的文档中进行全文检索和语义检索;所述文本搜索器对应的搜索文本可由一个或多个词组成,支持布尔运算符和、或、非,通过使用嵌套括号支持运算符的优先级控制,过滤与文档相关的元数据,支持字段修饰符;所述语义搜索模块通过引入信息的相关性概念,克服并扩展全文搜索的对应性概念,以实现所述全文搜索功能;所述语义搜索模块能够同时考虑词的本身含义和词在上下文的含义,所述语义搜索模块还考虑信息的结构并通过使用语义专有词汇表来链接;所述语义搜索模块支持多种语言搜索,所述语义搜索模块还支持字段修饰符;所述语义搜索模块还支持进一步的字段修饰符,允许进一步细化搜索;所述语义搜索模块返回的结果包括文档、在文档中的位置、相似度评分、对已执行查询的引用、摘要、相似文档;所述语义搜索模块从搜索返回的文档数量是可参数化的,搜索能够在系统中并行化,以增加对引入的查询的响应速度;所述语言管理模块用于管理词汇、识别和处理欧洲语言和亚洲语言,从给定语言的查询开始对多个数据库进行搜索,以实现所述跨语言管理功能;所述语言管理模块还管理由TNP可信网络平台直接定义和实现的语义网络;所述语言管理模块的功能包括词汇管理、欧洲语言和亚洲语言的管理、跨语言词汇管理、语义网络管理;所述分类模块通过创建链接到导入文档的信息领域的类别方案,以实现所述文档分类功能,所述分类模块支持IPTC国际新闻通讯委员会标准的分类方案,用于实现所述分类模块的引擎有贝叶斯、布尔、文档相似度、关键字、概念与类别关联度、统计、SVM或支持向量机,每个引擎以不同的方式工作,并根据需要和应用的知识领域需要做不同的配置,这些引擎可以同时应用,以保证分类的最大精度;所述Spider模块用于提供所述数据的爬取存储和管理功能,所述Spider模块包括进程类、管理不同的流程引擎、管理不同的存储支持、管理用于搜索数据预处理和后处理的中间件,所述进程类用于管理多级队列和要搜索的地址,所述管理不同的流程引擎用于按目标配置,所述管理不同的存储支持用于模块上传内容的保存、导入、索引;所述Spider模块能够通过多线程进程对预先选择为目标的url进行下载和分析,这些url是利用适用于http请求的库获取的,这些库不仅允许获取DOM文档对象模型,还允许获取其他信息,例如会话、cookie、标题等,一旦下载了链接的DOM,就会翻译一个中间件,用于提取和调整下一个要搜索的链接,因为通过使用配置阶段选择的正则表达式、过滤器和标签,可以提取它指向的链接,将从这个中间件中提取的链接排列起来,以便进一步分析;提取链接后,答案的对象移动到当前实例进行进一步处理;在这项活动中,通过临时创建的规则,实时进行深入的需求分析、特殊提取、关联、语义分析和其他感兴趣的操作;这些规则是在专用于客户的模块中创建的,其目的是满足特定的项目要求,所述Spider模块允许下载、解释和分类来自内部和外部来源的信息;通过所述Spider模块的扩展模块允许定义简单的应用程序调用,以满足不同的功能需求,而无需修改爬取本身的代码;所述扩展模块包括主站点处理模块、爬取启动模块、爬取结束模块、链接爬取开始模块、链接爬取结束模块、文档爬取开始模块、文档爬取结束模块;所述Spider模块能够完成的操作包括Cookie操作、网址操作、文件处理,所述
Cookie操作包括认证、修改、取消,所述网址操作包括会话数据消除、锚点消除、不必要地址消除、插入地址,所述文件处理包括添加元数据、文件禁用;所述文档工作流引擎用于提供所述管理与一个或多个文档相关的逻辑细化流程功能,所述文档工作流引擎为基于属于BPMN2.0标准的功能元素,使用图形Web编辑器来起草图表流,允许有效地映射文档管理的结构和步骤,精确识别与文档相关的版本、个人责任和修改操作的验证时刻,还允许映射和保留与文档相关的业务流程,将其标准化为通用标准;所述文档工作流引擎的元素包括文档、操作、网关、事件,所述文档为系统中需要管理的文档,所述操作为预定义的需要对文档执行的操作,所述网关用于检查操作之间的流程,支持布尔逻辑AND ORNOT,能够插入预定义控件,所述事件能够插入预定义事件,生成的事件包括来自系统的事件、细化开始序列的唯一标识符、细化停止序列的唯一标识符;所述文档工作流引擎管理的操作包括修订分配、审批分配、在文件系统中的搜索、电子邮件的发送、前端Web界面上的事件通知;所述文档工作流引擎管理的网关包括文件状态控制、在元数据或文档中定义的状态、修订的执行、审批的执行;所述文档工作流引擎管理的事件包括任务产生的信号、截止日期、系统事件;所述演示引擎用于提供所述网页的可视化动态引擎功能,所述演示引擎的可视化基于基本模板,所述基本模板根据人体工程学和技术界面需求进行预定义、可扩展和可定制,允许实现具有可重用和可定制元素的界面;所述演示引擎支持管理的动态内容包括分层模板、应用界面结构的可重用性、HTML5,所述演示引擎支持管理的静态内容包括格式规范化、性能的可扩展性;所述文本预览模块用于提供所述文档预览功能或文档的其中一部分的预览的创建功能,所述文本预览模块是以最常见的标准提供系统中包含的文档,而无需以原始格式下载和打开它们;所述文本预览模块用于打开文档的特定软件能够根据需要选择;所述文本预览模块预览的生成以同步方式进行,不是在用户请求期间生成,而是在数据库中输入文档时立即处理,类似功能的引入允许在不同类型的设备和格式上立即获得信息;所述文本预览模块还用于管理文档的缩略图,所述文本预览模块的功能包括生成文档预览、基于编程过滤器在部分文本的预览中突出显示、生成文档缩略图、预览和缩略图的异步生成;所述报告引擎用于提供所述演示报告生成功能,所述报告引擎能够基于预定义和可重复使用的模板生成报告,还支持转换格式以在移动设备上显示信息,报告的生成和显示也能够在推送模式下受到系统事件到期的影响;所述报告引擎能够在系统从导入的文档到系统日志的每个部分生成报告,所述报告引擎的功能包括生成关于系统元素的报告、生成文件状态报告、管理日志推送通知、支持异构设备上的可视化;所述历史/时间线模块用于实现所述存储数据操作细化管理功能,所述历史/时间线模块能够显示对系统数据库中存储的数据进行操作的时间序列,使得信息使用的可塑性成为可能,所述历史/时间线模块通过时间序列对数据或文件执行的操作序列、文件发布日期的分析、来自对受监控设备的日志操作的采样的数据序列相关联;所述历史/时间线模块的功能包括存储对文档文本的修改、存储链接到文档的事件、存储与文档相关的详细说明、存储对文档的访问、存储来自受监控设备的数据序列、单个文档的时间线管理;所述管家模块用于提供所述管理系统通知功能,所述管家模块能够将系统通知链接到系统事件、文档状态以及对数据进行操作的结果,所述系统通知能够发送给单个用户或组,
所述管家模块通过利用在单个模块生成的事件上定义调度的特性以实现可定制;所述地理数据/地理名称模块通过基于标准拓扑和与其链接的附加数据来实现所述管理地理本地化数据功能,将地理领域中阐述的信息语境化;所述地理数据/地理名称模块还链接了由所述文本预览模块设计的表示系统,用于数据的图形表示;所述地理数据/地理名称模块还包含ip映射地理位置的信息;所述地理数据/地理名称模块支持将地理信息作为插件插入到网页的表示系统中,以实现可视化的图形化管理表示;所述地理数据/地理名称模块包括的附件信息有地理坐标、人口、国家、货币、语言、不同语言的翻译、时区、邮政编码、标签;所述电邮认证模块通过使用可靠来源颁发的数字证书,以实现所述管理认证电子邮件系统功能;所述电邮认证模块向发件人提供具有法律价值的电子文档,证明电子邮件的发送和交付数字文档,证明发送和交付意味着向发件人提供收据,该收据代表已发生的消息发送和可能的附加文件的法律证据;所述电邮认证模块还包括电子邮件加密的支持模块;所述电邮认证模块的功能包括管理发送和接收经过认证的可靠电子邮件的报告、密码管理;所述OCR模块用于导入文档图像的扫描仪的管理,以实现所述识别和提取扫描仪扫描的文档内容功能;所述OCR模块通过一系列的OCR算法对通过扫描仪导入的文档图像进行处理,以提取文档的文本内容和图形内容;所述OCR模块通过连接的图像分类器识别图形内容中的相似图像和对象;所述OCR模块的功能包括OCR,管理图像、文本的分割,图像制作;所述图像制作包括基本过滤器集、搜索相似图像、在图像中搜索对象;所述合作写作模块通过使用通用和共享的编辑器来实现所述协作编写文档功能,所述合作写作模块将文本书写传送到订阅公共区域的一组用户,文档的编写是一个递归操作,其中每个用户都被要求公开其想法,评论其他人的想法;所述合作写作模块还支持共享白板来起草计划;所述合作写作模块能够从Microsoft office和OpenOffice中导入文档,并作为后续修改的基础;所述合作写作模块的功能包括管理员面板的管理、用户注册面板的管理、从办公套件导入文件、共享编辑器所见即所得、评论管理、插入图像、插入链接、共享白板、基本的图形组件;所述本体模块用于提供所述处理与不同知识领域相关的词汇功能,所述本体模块能够根据需要在系统中已有的词汇和可定义的词汇之间进行选择,通过语义网络表示词汇表,用逻辑形式描述复杂的场景;所述本体模块使用外部资源自动构建,然后由本领域专家参与进行细化;所述本体模块通过利用本体中的形式化知识,能够对数据应用推理算法和一致性控制,以确保丰富和精确的搜索结果;所述本体模块的功能包括现有的本体集合、用于创建或修改本体的编辑器、根据标准格式从网络导入本体、根据需要定义复杂性的推理引擎;所述一致性检查器用于根据预定义的结构在包含的...

【专利技术属性】
技术研发人员:马斯莫
申请(专利权)人:深圳前海墨斯科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1