The invention discloses an automatic extraction method of patent key words, which belongs to the field of text retrieval technology. It includes the following steps: electronic document import, retrieval, query, topic analysis, text analysis and keyword derivation, and document generation, word recognition, word retrieval, word retrieval, word comparison, word acquisition, word expression and word preservation in text analysis. By extracting the keywords in the text of the patent, the invention is more easy to retrieve and query the patent.
【技术实现步骤摘要】
一种专利关键词自动提取方法
本专利技术属于文字检索
,特别是涉及一种专利关键词自动提取方法。
技术介绍
目前,随着专利文献的迅速增长,专利文献专业和社会化查询日益普遍,实现专利文献数据的查全率和查准率为专利文献信息的检索的难点和重点,长期以来,用袁术专利数据来完成专利信息的检索,往往使得查全率和查准率相互冲突,在专利的撰写提交过程中往往引用大量的相关技术资料和引用技术,使得在检索的过程中查出大量的相关度不足的专利,需要一一进行查看排除,浪费了大量的时间。
技术实现思路
本专利技术的目的在于提供一种专利关键词自动提取方法,通过对专利文献进行关键字的提取,以关键字进行专利检索,提高专利检索的准确性的全面性,解决了现有的问题。为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术为一种专利关键词自动提取方法,包括如下步骤:SS01电子文档导入检索查询,电子文档导入检索查询时自动生成主文档、子文档和对比文档,并对主文档、子文档和对比文档进行保存;SS02题目分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS03正文分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS04关键词的导出,在查询对比之后进行锁定复制,进行最终的字词导出并保存。进一步地,SS03正文分析,进行对正文的分析对比包括以下子步骤:SS03a文档生成,用于在电子文档导入时自动生成主文档、子文档和对比文档;SS03b字词识别,用于对专利文献中各个板块进行识别划分;SS03c字词检索,所述字词检索包括限定字跟随判定模块和重复字筛选模块,用于对正文和题目进行分析; ...
【技术保护点】
一种专利关键词自动提取方法,其特征在于,包括如下步骤;SS01电子文档导入检索查询,电子文档导入检索查询时自动生成主文档、子文档和对比文档,并对主文档、子文档和对比文档进行保存;SS02题目分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS03正文分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS04关键词的导出,在查询对比之后进行锁定复制,进行最终的字词导出并保存。
【技术特征摘要】
1.一种专利关键词自动提取方法,其特征在于,包括如下步骤;SS01电子文档导入检索查询,电子文档导入检索查询时自动生成主文档、子文档和对比文档,并对主文档、子文档和对比文档进行保存;SS02题目分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS03正文分析,题目分析时自动检索文库中相似文档,并保存在对比文档中;SS04关键词的导出,在查询对比之后进行锁定复制,进行最终的字词导出并保存。2.根据权利要求1所述的一种专利关键词自动提取方法,其特征在于:根据所述SS03正文分析,进行对正文的分析对比包括以下子步骤;SS03a文档生成,用于在电子文档导入时自动生成主文档、子文档和对比文档;SS03b字词识别,用于对专利文献中各个板块进行识别...
【专利技术属性】
技术研发人员:冯晓辉,
申请(专利权)人:合肥博力生产力促进中心有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。