专利文献的准确快速自动标引方法技术

技术编号:3816104 阅读:327 留言:0更新日期:2012-04-11 18:40
一种专利文献的准确快速自动标引方法,首先建立一与预设技术主题相关联的的技术分类和关键词的分类词表、以及按照重要程度确定与所述技术主题相关联的申请人排序表,然后根据所述技术主题在各国的专利文献数据库中进行检索,以形成一与所述技术主题相关的专题数据库,再根据所述申请人排序表在所述专题数据库中再次进行筛选以筛选出预设数目个申请人的专利数据,然后根据确定的标引方式、标引比例、以及所述分类词表按照技术分类和关键词对所筛选出的专利数据予以相应标引。本发明专利技术在提高专利标引准确性的同时可以提高专利文献阅读和标引的速度,特别在专利文献数量较大时,其有益效果非常明显。

【技术实现步骤摘要】

本专利技术涉及一种资料标引方法,特别涉及一种。
技术介绍
专利文献的检索和标引是大多数科技企业的重要工作,利用各个国家的专利局 或各种知识产权组织提供的专利文献检索窗口和平台,可以方便的查询所需的专利文 献。同时,对这些专利文献进行阅读、处理和标引, 一方面方便技术人员的查找和使 用,另一方面也是进行专利分析等各项工作的重要基础。 但由于专利文献数量十分巨大,通常一个技术主题下,就可能存在上千甚至上 万篇相关技术专利。若对于一个行业或者一个
进行技术战略分析,那么可能找 到的专利文献将是数万或者数十万篇。 传统的方法一般是对数据进行手工标引,对所有文献进行阅读,手工标引进行 技术分类并填写关键词,以及其他相关专利信息。这种方法十分耗费人力物力,同时数 据处理的效率很低; 另一种方式是利用机器进行检索,将含有相关关键词的都自动标引。这种方法 虽然效率相对较高,但其准确性较低。很容易造成误检误标,并且其关键词的确定值得 商榷。 因此,如何提高标引的准确性,并在提高准确性的同时提高标引的效率,是本 专利技术要解决的技术问题。
技术实现思路
本专利技术的目的在于,提供一种能准确实现专利文献标引,并提高标引效率的方 法。为了达到上述目的,本专利技术采用如下技术方案 本专利技术的至少包括步骤1)建立一与预设技 术主题相关联的的技术分类和关键词的分类词表、以及按照重要程度确定与所述技术主 题相关联的申请人排序表;2)根据所述技术主题在各国的专利文献数据库中进行检索, 以形成一与所述技术主题相关的专题数据库;3)根据所述申请人排序表在所述专题数据 库中再次进行筛选以筛选出预设数目个申请人的专利数据;4)确定随机标引的方式和标 引的比例;5)根据所确定的标引方式、标引比例、以及所述分类词表按照技术分类和关 键词对所筛选出的专利数据予以相应标引。 采用本专利技术技术方案,由于关键词和技术分类是通过阅读重点申请人的专利得 到的,所以在做标引时可以很好的把握住专题的重点,从而提高检索标引的准确性;特 别是在申请人比较集中的技术主题中,其技术分类相对比较集中,采用本专利技术技术方 案,可以加快专利文献标引速度,减少此方面工作人力和物力的投入,另外是在需要阅 读和标引的专利文献巨大时,其有益效果非常明显,以下结合附图和实施例进一步说明本专利技术。 附图说明 图1本专利技术的的流程图。具体实施例方式以下将以汽车底盘这一技术主题为例来详细说明本专利技术的专利文献的准确快速自动标引方法。 请参见图1,本专利技术的至少包括以下步骤 第一步建立一与预设技术主题(即汽车底盘)相关联的的技术分类和关键词的 分类词表、以及按照重要程度确定与所述技术主题相关联的申请人排序表。其中,技术 分类是根据专利文献通常包括的内容进行划分,可以包括技术手段、技术功效、技术特 点、应用领域等;其中技术手段又可以分为转向系统、悬架系统、制动系统等,技术分 类所对应的关键词是根据技术分类的具体特点提取的词,例如制动系统技术分类所对应 的关键词有刹车、脚刹、手刹、真空助力器、脚踏板、制动总泵等,由此形成分类词 表。而在汽车底盘方面申请专利的申请人,可根据知名程度或申请的数量形成一申请人 排序表,例如丰田、本田、日产、马自达、三菱、福特、通用汽车、铃木、五十铃、 现代等,国内的排名靠前的申请人主要有奇瑞、上汽、 一汽、长安汽车、比亚迪、重 汽、清华大学、浙江大学等。 第二步根据所述技术主题在各国的专利文献数据库中进行检索,以形成一与 所述技术主题相关的专题数据库。通常在中国、美国、日本、英国、法国、德国、瑞 士、欧洲专利局、世界知识产权组织等提供的专利文献库中进行汽车底盘的检索,由此 可形成汽车底盘的专题数据库。由于各专利文献库的地址都为本领域技术人员所熟悉, 在此不再一一说明。当然,也可将各专利文献库的数据都下载至本地形成本地的专利 数据库后,再在本地专利数据库内进行汽车底盘的检索,由此形成汽车底盘的专题数据 库。 第三步根据所述申请人排序表在所述专题数据库中再次进行筛选以筛选出预 设数目个申请人的专利数据。由于对专利数据进行分析时,客户常常关注的只是少数知 名公司,例如筛选出排名前5位的申请人(即丰田、本田、日产、马自达、三菱)的专利 数据。 第四步确定随机标引的方式和标引的比例。例如,可采用按照时间顺序进行 的标引方式,相应标引比例可根据所有筛选出的专利数据而确定,如确定为15%等。也 可采用按照每一申请人进行的标引方式,相应标引比例是根据所筛选出每一申请人的专 利数据数量来确定,例如为每一申请人申请量的一半等。在本实施例中,由于汽车底盘 的技术较为复杂,发展历史较长,从1964年开始就已经有此方面的专利申请,历时40 多年;所以可根据专利申请时间抽取各个申请人起步靠前、中间和最近的各3%、 7%和 5%左右的专利进行人工标引,即选择1976年-1979、 1994-2000年和2005-2008年一定数 量的专利来标引。 第五步根据所确定的标引方式、标引比例、以及所述分类词表按照技术分类和关键词对所筛选出的专利数据予以相应标引。例如采用技术手段中的刹车、脚刹、手 刹、真空助力器、脚踏板、制动总泵等关键词来标引。 此外,考虑到标引的过程常需要修正,例如,关于汽车转向柱吸能的机构有一 个专门的IPC分类为B62D001/19,属于这个分类的专利比较容易标引,可以直接标到转 向系统中转向柱的吸能结构中;但对于技术分类比较精确,但专利文献的IPC分类划分 并不是很准确,如直接IPC分类是B62D001/00之类的专利就比较难标引,这时就需要 相关关键词定位比较准确了,先从部分重点申请人的专利文献开始着手;丰田有一篇公 开号为IJS7455320的专利,其专利技术名称为"shock absorbing steering apparatus"的专 利,同时发现其摘要中出现"steering column"关键词,就可断定其同样属于转向柱吸能 结构领域;这时修正技术分类转向柱吸能所对应的关键词,对其进行填充;通过阅读重 点申请人专利得到的主关键词准确性比较高。 再者,在修正或所筛选出的专利数据中已有部分被标引过时,在自动标引时就 需要对待标引的专利数据进行判断,以确定其是否已被标引,若否则对其进行相应标 引,否则就无需对其进行标引了。 综上所述,本专利技术的通过根据客户的需求及 综合客观需标引的专利数据的数量筛选出符合条件的专利数据对其进行标引,可提高标 引的速度,同时也能提高标引的准确性。 上述实施例仅列示性说明本专利技术的原理及功效,而非用于限制本专利技术。任何熟 悉此项技术的人员均可在不违背本专利技术的精神及范围下,对上述实施例进行修改。因 此,本专利技术的权利保护范围,应如权利要求书所列。权利要求一种,其特征在于包括以下步骤1)建立一与预设技术主题相关联的的技术分类和关键词的分类词表、以及按照重要程度确定与所述技术主题相关联的申请人排序表;2)根据所述技术主题在各国的专利文献数据库中进行检索,以形成一与所述技术主题相关的专题数据库;3)根据所述申请人排序表在所述专题数据库中再次进行筛选以筛选出预设数目个申请人的专利数据;4)确定随机标引的方式和标引的比例;5)根据所确定的标引方式、标引比例、以及所述分类词表按本文档来自技高网...

【技术保护点】
一种专利文献的准确快速自动标引方法,其特征在于包括以下步骤:  1)建立一与预设技术主题相关联的的技术分类和关键词的分类词表、以及按照重要程度确定与所述技术主题相关联的申请人排序表;  2)根据所述技术主题在各国的专利文献数据库中进行检索,以形成一与所述技术主题相关的专题数据库;  3)根据所述申请人排序表在所述专题数据库中再次进行筛选以筛选出预设数目个申请人的专利数据;  4)确定随机标引的方式和标引的比例;  5)根据所确定的标引方式、标引比例、以及所述分类词表按照技术分类和关键词对所筛选出的专利数据予以相应标引。

【技术特征摘要】

【专利技术属性】
技术研发人员:陆蕾魏国柱唐向东
申请(专利权)人:上海汉光知识产权数据科技有限公司
类型:发明
国别省市:31[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1