一种专利关键词自动提取方法技术

技术编号:17110203 阅读:135 留言:0更新日期:2018-01-24 22:34
本发明专利技术公开了一种专利关键词自动提取方法,属于文字检索技术领域。包括以下步骤,电子文档导入检索查询、题目分析、正文分析和关键词的导出,以及正文分析中文档生成、字词识别、字词检索、字词检索、字词对比、字词获取、字词显示、字词保存。本发明专利技术通过对专利正文中的关键字进行提取,进而更加容易的对专利完成检索查询。

A method of automatic extraction of patent keywords

The invention discloses an automatic extraction method of patent key words, which belongs to the field of text retrieval technology. It includes the following steps: electronic document import, retrieval, query, topic analysis, text analysis and keyword derivation, and document generation, word recognition, word retrieval, word retrieval, word comparison, word acquisition, word expression and word preservation in text analysis. By extracting the keywords in the text of the patent, the invention is more easy to retrieve and query the patent.

【技术实现步骤摘要】
一种专利关键词自动提取方法
本专利技术属于文字检索
,特别是涉及一种专利关键词自动提取方法。
技术介绍
目前,随着专利文献的迅速增长,专利文献专业和社会化查询日益普遍,实现专利文献数据的查全率和查准率为专利文献信息的检索的难点和重点,长期以来,用袁术专利数据来完成专利信息的检索,往往使得查全率和查准率相互冲突,在专利的撰写提交过程中往往引用大量的相关技术资料和引用技术,使得在检索的过程中查出大量的相关度不足的专利,需要一一进行查看排除,浪费了大量的时间。
技术实现思路
本专利技术的目的在于提供一种专利关键词自动提取方法,通过对专利文献进行关键字的提取,以关键字进行专利检索,提高专利检索的准确性的全面性,解决了现有的问题。为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术为一种专利关键词自动提取方法,包括如下步骤:SS01电子文档导入检索查询,电子文档导入检索查询时自动生成主文档、子文档和对比文档,并对主文档、子文档和对比文档进行保存;SS02题目分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS03正文分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS04关键词的导出,在查询对比之后进行锁定复制,进行最终的字词导出并保存。进一步地,SS03正文分析,进行对正文的分析对比包括以下子步骤:SS03a文档生成,用于在电子文档导入时自动生成主文档、子文档和对比文档;SS03b字词识别,用于对专利文献中各个板块进行识别划分;SS03c字词检索,所述字词检索包括限定字跟随判定模块和重复字筛选模块,用于对正文和题目进行分析;SS03d字词对比,所述字词对比包括对比文档和对比词库,对比词库和对比文库用于与所筛选词组进行对比筛选;SS03e字词获取;用于获取最终判定的关键词组;SS03f字词显示,用于将字词获取判定的词组进行显示;SS03g字词保存,用于对主文档、子文档和对比文档进行保存。进一步地,所述SS03c中限定字跟随判定模块用于对专业用词语句中名词的判定提取识别。进一步地,所述SS03d中重复字筛选模块用于对专利文献中多次重复使用的词句进行筛选。本专利技术具有以下有益效果:本专利技术包含有限定字跟随判定模块,根据撰写专利时所使用的专业定性词汇进行跟随指引查询,进而使得检索的范围更加的具体,可节省大量的关键字检索时间,并且还划分了字词识别对专利每一板块进行区分,防止大量引用技术中的关键字进行引诱判定,防止其增加系统检索的负荷进而延长关键字提取的时间。当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的关键字提取流程图;图2为本专利技术的步骤SS03中子流程图;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。请参阅图1-2所示,本专利技术为一种专利关键词自动提取方法,包括如下步骤;SS01电子文档导入检索查询,电子文档导入检索查询时自动生成主文档、子文档和对比文档,并对主文档、子文档和对比文档进行保存;SS02题目分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS03正文分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS04关键词的导出,在查询对比之后进行锁定复制,进行最终的字词导出并保存。其中,SS03正文分析,进行对正文的分析对比包括以下子步骤;SS03a文档生成,用于在电子文档导入时自动生成主文档、子文档和对比文档;SS03b字词识别,用于对专利文献中各个板块进行识别划分;SS03c字词检索,所述字词检索包括限定字跟随判定模块和重复字筛选模块,用于对正文和题目进行分析;SS03d字词对比,所述字词对比包括对比文档和对比词库,对比词库和对比文库用于与所筛选词组进行对比筛选;SS03e字词获取;用于获取最终判定的关键词组;SS03f字词显示,用于将字词获取判定的词组进行显示;SS03g字词保存,用于对主文档、子文档和对比文档进行保存。其中,SS03c中限定字跟随判定模块用于对专业用词语句中名词的判定提取识别。其中,SS03d中重复字筛选模块用于对专利文献中多次重复使用的词句进行筛选。在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。以上公开的本专利技术优选实施例只是用于帮助阐述本专利技术。优选实施例并没有详尽叙述所有的细节,也不限制该专利技术仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本专利技术的原理和实际应用,从而使所属
技术人员能很好地理解和利用本专利技术。本专利技术仅受权利要求书及其全部范围和等效物的限制。本文档来自技高网
...
一种专利关键词自动提取方法

【技术保护点】
一种专利关键词自动提取方法,其特征在于,包括如下步骤;SS01电子文档导入检索查询,电子文档导入检索查询时自动生成主文档、子文档和对比文档,并对主文档、子文档和对比文档进行保存;SS02题目分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS03正文分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS04关键词的导出,在查询对比之后进行锁定复制,进行最终的字词导出并保存。

【技术特征摘要】
1.一种专利关键词自动提取方法,其特征在于,包括如下步骤;SS01电子文档导入检索查询,电子文档导入检索查询时自动生成主文档、子文档和对比文档,并对主文档、子文档和对比文档进行保存;SS02题目分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS03正文分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS04关键词的导出,在查询对比之后进行锁定复制,进行最终的字词导出并保存。2.根据权利要求1所述的一种专利关键词自动提取方法,其特征在于:根据所述SS03正文分析,进行对正文的分析对比包括以下子步骤;SS03a文档生成,用于在电子文档导入时自动生成主文档、子文档和对比文档;SS03b字词识别,用于对专利文献中各个板块进行识别...

【专利技术属性】
技术研发人员:冯晓辉
申请(专利权)人:合肥博力生产力促进中心有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1