【技术实现步骤摘要】
本专利技术涉及一种对文档进行处理的系统和方法,特别涉及一种,该系统和方法能处理多个文档构成的文档库,并能使不同应用软件对同一文档进行互操作。
技术介绍
目前关于各种非结构化文档的软件已经比较普及,形成了多种文档格式林立的状况。例如,一个内容管理软件往往要处理二三百种文档格式,而且这些格式还在不断更新,给软件开发商带来了巨大的困难。如何解决文档通用性、进行数字内容提取、格式兼容越来越成为人们的关注点,人们迫切希望解决以下问题1)文档不通用基本上只能用同一种软件在不同的人之间交换文档,但不能在不同的软件之间互相交换文档,形成信息封闭。2)文档信息提取困难文档描述信息丰富,数据结构复杂,实现难度较大。每一家公司都把自己的书面文档描述作为独家特有技术、基本上不提供开放接口。3)访问接口不统一、数据兼容困难或代价太高不同的文档处理软件之间,文件格式互不兼容,在处理过程中要么利用对方组件解析(前提是对方提供相应接口),要么自己投入研发力量从头到尾的解析对方的格式。4)信息安全较差目前针对书面文档的权限控制手段单一,主要是数据加密、口令认证。因为信息泄露,每年造成巨大损失的公司案例层出不穷。5)都是针对单个文档的处理,缺乏多文档管理手段每个人电脑中都有大量文档,但多个文档之间缺乏有效的组织管理,而且资源共享很难。如,字库/字体文件、全文数据检索等。6)行业竞争层次还停留在各自格式描述之争上由于书面文档数据结构复杂、数据描述丰富、文档数据长度不确定,每一个文档都千差万别。长期以来,大家都在关注文档格式标准,各大公司都努力将自己特有的文档格式发展为市场标准,各标准组织也 ...
【技术保护点】
一种文档处理系统,其包括文档库系统、存储器、应用软件,其中,文档库的数据存储在存储器中,文档库系统和应用软件通过一种标准调用接口连接起来,该标准调用接口根据预先定义的动作和对象而定义,应用软件对文档的操作都统一成对一种预定义的通用文档模型进行的操作,并通过该标准调用接口向文档库系统发出指令,文档库系统按照应用软件的指令,对存储在存储器中的文档库执行相应的操作。
【技术特征摘要】
1.一种文档处理系统,其包括文档库系统、存储器、应用软件,其中,文档库的数据存储在存储器中,文档库系统和应用软件通过一种标准调用接口连接起来,该标准调用接口根据预先定义的动作和对象而定义,应用软件对文档的操作都统一成对一种预定义的通用文档模型进行的操作,并通过该标准调用接口向文档库系统发出指令,文档库系统按照应用软件的指令,对存储在存储器中的文档库执行相应的操作。2.如权利要求1所述的文档处理系统,其中,所述动作包括打开、和/或关闭、和/或获取、和/或设置、和/或插入、和/或删除、和/或检索查询。3.如权利要求1所述的文档处理系统,其中,所述对象包括文档库、和/或文档集、和/或文档、和/或页、和/或层、和/或对象组、和/或状态、和/或文字、和/或图像、和/或图形、和/或路径、和/或源文件、和/或脚本、和/或插件、和/或流媒体、和/或链接、和/或印章、和/或二进制数据流、和/或书签、和/或批注、和/或语义信息、和/或元数据、和/或角色、和/或权限、和/或数字签名、和/或字库、和/或导航信息、和/或导读信息、和/或微缩版面、和/或索引信息、和/或历史痕迹。4.如权利要求3所述的文档处理系统,其中,文档库对象包括一个或多个文档集对象、和/或任意数量文档库辅助对象和/或任意数量的文档库共享对象。5.如权利要求4所述的文档处理系统,其中,文档库辅助对象是指元数据对象、和/或角色对象、和/或权限对象、和/或插件对象、和/或索引信息对象、和/或脚本对象、和/或数字签名对象、和/或历史痕迹对象,文档库共享对象是指文档库中的不同文档可能共同使用的对象。6.如权利要求5所述的文档处理系统,其中,文档库共享对象为字库对象、和/或图像对象。7.如权利要求3所述的文档处理系统,其中,每个文档集对象包括一个或多个文档对象、和/或任意数量的文档集对象和/或任意数量的文档集辅助对象。8.如权利要求7所述的文档处理系统,其中,文档集辅助对象是指元数据对象、和/或数字签名对象、和/或历史痕迹对象。9.如权利要求3所述的文档处理系统,其中,每个文档对象包括一个或多个页面对象、和/或任意数量的文档辅助对象和/或任意数量的文档共享对象。10.如权利要求3所述的文档处理系统,其中,文档辅助对象是指元数据对象、和/或字库对象、和/或导航信息对象、和/或导读信息对象、和/或微缩版面对象、和/或数字签名对象、和/或历史痕迹对象,文档共享对象是指文档中的不同页面可能共同使用的对象。11.如权利要求10所述的文档处理系统,其中,文档共享对象包括图像对象、和/或印章对象。12.如权利要求3所述的文档处理系统,其中,每个页面对象包括一个或多个层对象,和/或任意数量的页面辅助对象,页面辅助对象是指元数据对象、和/或数字签名对象、和/或历史痕迹对象。13.如权利要求3所述的文档处理系统,其中,每个层对象包括一个或多个版面对象、和/或任意数量的对象组和/或任意数量的层辅助对象,层辅助对象是指元数据对象、和/或数字签名对象、和/或历史痕迹对象,对象组包括任意数量的版面对象、和/或任意数量的对象组和/或可选的数字签名对象。14.如权利要求3所述的文档处理系统,其中,版面对象是指状态对象、和/或文字对象、和/或直线对象、和/或曲线对象、和/或圆弧对象、和/或路径对象、和/或渐变色对象、和/或图像对象、和/或流媒体对象、和/或元数据对象、和/或批注对象、和/或语义信息对象、和/或源文件对象、和/或脚本对象、和/或插件对象、和/或二进制数据流对象、和/或书签对象,和/或超链接对象。15.如权利要求14所述的文档处理系统,其中,状态对象进一步包括任意数量的字符集对象、和/或字体对象、和/或字号对象、和/或文字颜色对象,和/或光栅操作对象、和/或背景色对象、和/或线颜色对象、和/或填充色对象、和/或线型对象、和/或线宽对象、和/或线接头对象、和/或画刷对象、和/或阴影对象、和/或阴影颜色对象、和/或旋转对象、和/或空心字对象、和/或勾边字对象、和/或透明对象、和/或渲染模式...
【专利技术属性】
技术研发人员:王东临,郭旭,刘昌伟,姜海峰,
申请(专利权)人:北京书生国际信息技术有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。