专利文档的数据输出方法、终端及系统技术方案

技术编号:7898152 阅读:160 留言:0更新日期:2012-10-23 04:21
本发明专利技术提供一种专利文档的数据输出方法、终端及系统,计算机、软件技术领域。其中,所述的方法包括:步骤1,在标号诠释内容、文档标号,以及附图中包括有附图标号的附图标号附属区域三者之间,建立起对应关系;步骤2,当触发文档标号、标号诠释内容,以及附图标号附属区域三者其一时,关联的另外两种信息内容中至少其一,根据输出条件选择性输出。通过本发明专利技术,能够利用专利文档中内部数据之间的关联性,来让用户更加便利地获得专利文档内容的关联信息。

【技术实现步骤摘要】

本专利技术属于计算机、软件

技术介绍
专利文档是非常重要的技术文献。根据有关统计,全世界每年约90% -95%的专利技术创造成果可以在专利文献中查到,其中约有70%的专利技术成果从未在其它非专利文献上发表过。专利资料在企业的研发中,如果能够有效发挥作用的话,能够大幅度节约研发时间和研发成本,同时提高研发品质,减少重复劳动。很显然,并不是所有的专利资料都得到了有效应用。如何对数量庞大的专利资料进行便利、有效地阅读,是目前需要解决的重要课题。当前的专利阅读方式,主要是这样的用户通过网络直接阅览,或下载到电脑中离线浏览,或打印成印刷品浏览。其中,通过电子文档的形式进行阅读最为常见。而目前专利的文档类型,又以PDF格式的数字文档最为常见。当前发生的全世界范围内的绝大多数专利数据,都可以获得PDF格式的数据,t匕如,中国专利局的专利文档、欧洲专利局的专利文档、美国专利局的专利文档,等等,都可以获得PDF格式的数据。专利文档有着自己的专有格式。比如,专利技术专利文档,通常会包括有《说明书摘要》、《摘要附图》、《权利要求书》、《说明书》、《说明书附图》。当然,也有少部分的专利技术专利没有附图。本专利技术需要应用于有附图且有附图标号的专利文档。当前的技术中,在附图中包含附图标号的情况下,如何获得这些标号所对应的标号i全释内容?目前的技术,需要用户对照着《说明书附图》和《说明书》中的具体实施方式部分,反复地查阅,很麻烦。另一方面,在《说明书》的具体实施方式部分中,还会对应设置有或多或少的文档标号。这些文档标号所对应的附图信息,如果需要查看的话,同样要反复地对照着《说明书附图》去搜寻,很麻烦。这些不利因素,严重影响了专利文档的顺利阅读。
技术实现思路
本专利技术的目的,是提供一种专利文档的数据输出方法以及配套的终端、系统,利用本专利技术,能够更加便利地获得专利文档内容的关联信息。一种专利文档的数据输出方法,该方法包括有如下步骤步骤1,在标号诠释内容、文档标号,以及附图中包括有附图标号的附图标号附属区域三者之间,建立起对应关系;步骤2,当触发文档标号、标号诠释内容,以及附图标号附属区域三者其一时,关联的另外两种信息内容中至少其一,根据输出条件选择性输出。所述的方法,还包括有如下技术特征进一步,所述的步骤1,其对应关系的建立过程是,利用标号诠释 内容和文档标号相邻近的位置关系,建立起标号诠释内容和文档标号之间的对应关系,以及通过附图标号和文档标号描述同一对象的关系,建立起附图标号和文档标号之间的对应关系;根据文档标号和附图标号之间的相似性关系,建立起标号诠释内容和附图标号之间的对应关系。进一步,文档标号的获得途径是,预设文档标号的规则;对专利文档的《说明书》中的具体实施方式部分进行数据分析;根据文档标号的规则进行筛选,获得文档标号。进一步,所述的文档标号还可以通过如下步骤进行验证采集经判断获得的文档标号;按照文档标号与标号诠释内容邻近设置的位置关系,判定文档标号的真实性;若判断通过,则是真实的文档标号,否则不是真实的文档标号。进一步,附图标号的获得途径是,预设附图标号的规则;对《说明书附图》进行数据扫描;根据附图标号的规则,判断并采集附图标号的信息内容。进一步,所述的附图规则,包括有附图引线与附图标号之间位置上的对应关系,在该对应关系中,附图标号通过附图引线从附图中引出。进一步,所述的文档标号的获得途径是,预设附图标号的规则;对《说明书附图》进行数据扫描;根据附图标号的规则,判断并采集附图标号的信息内容;根据附图标号和文档标号描述内容一致的规则,获得文档标号。进一步,判定文档标号真实性的方式,包括有如下步骤,采集经判定所获得的文档标号和附图标号信息;在字符识别后利用字符信息进行比对,或者直接利用图形进行比对,依据两者之间所表述对象的一一对应关系,来判断特定的文档标号和特定的附图标号之间是否存在 对应关系;没有一一对应关系的文档标号或附图标号,不是判断通过的文档标号或附图标号;具有一一对应关系的文档标号或附图标号,是判断通过的文档标号或附图标号。进一步,所述的标号诠释内容的获得途径是,采集文档标号的位置信息;从文档标号前面的位置,提取获得标号诠释内容。进一步,所述的标号诠释内容的获得途径是,采集文档标号的位置信息;判定标号i全释内容设置在文档标号之后;从文档标号的后面位置,提取获得标号诠释内容。进一步,所述的标号诠释内容的获得途径是,预设附图标号的规则;对《说明书附图》进行数据扫描;根据附图标号的规则,判断并采集附图标号的信息内容; 根据附图标号和文档标号描述内容一致的规则,获得文档标号;根据文档标号与标号诠释内容相邻的位置关系,判断获得标号诠释内容。进一步,采集经判断获得的标号诠释内容;将采集到的标号诠释内容与其它位置所采集到的标号诠释内容进行比对;采集其重复频率高的内容部分,作为优先输出的标号诠释内容。进一步,对于专利文档中,将前面对应文档标号出现的标号诠释内容详细描述,而将后面对应着文档标号出现的标号诠释内容做部分省略的情况,处理过程是,比对同一专利文档中针对于同一文档标号所获得的标号诠释内容;判断是否针对于同一文档标号存在着完整描述与省略描述;当判断出存在着省略描述的情况,将位于前面位置的完整描述,作为完整的标号诠释内容。进一步,当标号诠释内容的完整描述与省略描述同时存在的情况下,在触发附图标号输出标号i全释内容时,将标号i全释内容的完整描述与省略描述同时输出。进一步,对于非文本形式的专利文档来说,进行数据处理的方式为如下两种方式至少其一,(I)对文档中的数据进行识别,将能够转变成字符形式的信息部分,转变成字符形式后再进行分析处理;(2)对文档中的图像数据进行采集,依据文档标号、附图标号,以及标号诠释内容之间的图像关联性,对其进行分析与比对,识别出其中的文档标号、附图标号,以及标号诠释内容。进一步,所述的附图标号附属区域,除了包括附图标号外,还包括与附图标号相对应的附图区域。进一步,与附图标号相对应的附图区域,其数据呈现的方式包括有如下两种至少其一,a整幅附图呈现出来;b对附图进行剪切,剪切图中至少包括附图标号,以及与附图标号相对应着的附图引线,以及与附图引线相对应的图形区域。进一步,对于所述的b情况来说,当采集到用户触发附图标号或剪切图两者至少其一的信息时,输出与其相对应的整幅附图。进一步,在采集到用户触发一幅整幅附图时,输出与该整幅附图并列存在于同一专利文档下的其它附图。进一步,当标号诠释内容单独存在时,触发标注诠释内容,输出与其相对应的文档标号与附图标号附属区域两者至少其一。进一步,当标号诠释内容和文档标号共同存在时,触发两者至少其一时,输出与其相对应包括有附图标号以及对应附图信息的附图标号附属区域。进一步,当触发标号诠释内容或文档标号时,同一活动窗口所呈现出的附图标号附属区域包括有两个或两个以上的附图标号时,将与其相应的附图标号进行差异性标识。进一步,所述的差异性标识,是将附图标号所在的区域做高亮显示,或渲染上具有差异性的色彩,或设置差异性的标识图形。进一步,当针对于同一标号诠释内容或文档标号出现有对应附图标号的独立附图有两个或两个以上时,进行如下方式其一的输出,A,采集标号诠释内容所在的段落,或者位于前部或后部的邻近本文档来自技高网
...

【技术保护点】
一种专利文档的数据输出方法,其特征在于该方法包括有如下步骤:步骤1,在标号诠释内容、文档标号,以及附图中包括有附图标号的附图标号附属区域三者之间,建立起对应关系;步骤2,当触发文档标号、标号诠释内容,以及附图标号附属区域三者其一时,关联的另外两种信息内容中至少其一,根据输出条件选择性输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:马宇尘
申请(专利权)人:上海量明科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1