中文工艺专利自动分类系统及利用该系统进行专利分类的方法技术方案

技术编号:12931181 阅读:86 留言:0更新日期:2016-02-29 02:57
本发明专利技术公开了一种中文工艺专利自动分类系统及利用该系统进行专利分类的方法,用于解决现有专利分类系统分类效率低的技术问题。技术方案是该系统包括客户端计算机、应用服务器和数据库。客户端计算机用于分类参数设置、类别标注设置以及查看分类结果。应用服务器包括专利获取模块、静态匹配模块和动态聚类模块。其中,专利获取模块用于获取一篇专利文献的标题和摘要。静态匹配模块用于分类词库匹配查找专利的标题或摘要来进行初步分类。动态聚类模块用于对静态匹配剩余的专利集进行分类处理。数据库用于存储专利信息和存储分类结果。由于采用静态匹配分类与动态聚类相结合处理中文工艺专利分类,提高了专利分类系统的效率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种,用于解决现有专利分类系统分类效率低的技术问题。技术方案是该系统包括客户端计算机、应用服务器和数据库。客户端计算机用于分类参数设置、类别标注设置以及查看分类结果。应用服务器包括专利获取模块、静态匹配模块和动态聚类模块。其中,专利获取模块用于获取一篇专利文献的标题和摘要。静态匹配模块用于分类词库匹配查找专利的标题或摘要来进行初步分类。动态聚类模块用于对静态匹配剩余的专利集进行分类处理。数据库用于存储专利信息和存储分类结果。由于采用静态匹配分类与动态聚类相结合处理中文工艺专利分类,提高了专利分类系统的效率。【专利说明】中文工艺专利自动分类系统及利用该系统进行专利分类的 方法
本专利技术涉及一种专利分类系统,特别涉及一种中文工艺专利自动分类系统。还涉 及一种利用该中文工艺专利自动分类系统进行专利分类的方法。
技术介绍
工艺研发是一种面向制造
、运用大量工艺知识进行创新性活动的复杂过 程,其结果是创造性的应用特定的工艺方法,实现特定制造对象及其制造特征的处理。因 此,如果工艺研发人员能够快速、大量借鉴具有相似工艺方法、制造对象或者制造特征的高 质量多学科工艺知识,将能够有效的提升工艺研发的效率。 工艺专利一般是为解决现有工艺问题中的技术冲突而提出一种新的工艺方法或 解决方案,蕴含了求解工艺问题的多学科原理性知识。同时,工艺专利的标题或摘要中一般 包含其涉及的工艺方法、制造对象或制造特征这三个区分工艺领域特点的特征。因此,工艺 专利因其创新性和实用性的特点而成为了工艺研发的重要知识来源。如果将工艺专利按照 工艺方法、制造对象和制造特征的方式进行分类,为工艺研发提供相似知识的借鉴,将能够 有效地促进工艺研发的效率。但是,目前还缺乏类似的工艺专利分类方法,工艺研发人员主 要采用手工分类的方式来使用专利知识,影响了工艺研发的效率。 目前中文专利自动分类的研究主要是基于国际专利分类法IPC(Inter_Process Communication)的分类,根据专利描述对象的所属工程领域来划分。文献"依据TRIZ专利技术 原理的中文专利自动分类,哈尔滨理工大学学报,2013, Vol. 18N0. 3Jun. 2013, pl-5"公开了 一种针对借助TRIZ理论进行专利技术创新的专利检索需要,提出利用文本挖掘技术实现对中 文专利进行面向TRIZ专利技术原理的自动分类。此方法首先对40个基本的TRIZ专利技术理论进 行分析和重新分组,然后对专利文本进行分词处理,特征选择算法进行特征降维,最后对中 文专利进行分类测试,结果表明借助于文本分类技术可以实现依据TRIZ专利技术原理对中文 专利自动分类。但是,该文献中的方法并不针对工艺专利,其分类方式没有根据工艺研发需 求的三个特点:工艺方法、制造对象、制造特征将工艺专利集进行目标归类,因而其分类方 式不适用于工艺研发需求,不能有效地支撑工艺研发活动。
技术实现思路
为了克服现有专利分类系统分类效率低的不足,本专利技术提供一种中文工艺专利自 动分类系统。该系统包括客户端计算机、应用服务器和数据库。计算机分别通过网络与应用 服务器连接,应用服务器通过数据线与数据库连接。客户端计算机用于分类参数设置、类别 标注设置以及查看分类结果。应用服务器包括专利获取模块、静态匹配模块和动态聚类模 块。其中,专利获取模块用于获取一篇专利文献的标题和摘要。静态匹配模块用于分类词 库匹配查找专利的标题或摘要来进行初步分类。动态聚类模块包括中文分词功能、词性标 注功能、去除停用词功能、词频统计功能、特征词提取功能、聚类处理功能和类别标注功能。 动态聚类模块用于对静态匹配剩余的专利集进行分类处理。数据库用于存储专利信息和存 储分类结果。由于采用静态匹配分类与动态聚类相结合处理中文工艺专利分类,可以提高 专利分类系统的效率。 本专利技术还提供利用该中文工艺专利自动分类系统进行专利分类的方法。 本专利技术解决其技术问题所采用的技术方案是:一种中文工艺专利自动分类系统, 其特点是:包括客户端计算机、应用服务器和数据库。客户端计算机有多台,多台客户端计 算机分别通过网络与应用服务器连接,应用服务器通过数据线与数据库连接。客户端计算 机用于分类参数设置、类别标注设置以及查看分类结果。应用服务器包括专利获取模块、静 态匹配模块和动态聚类模块。其中,专利获取模块用于获取一篇专利文献的标题和摘要。静 态匹配模块用于分类词库匹配查找专利的标题或摘要来进行初步分类。动态聚类模块包括 中文分词功能、词性标注功能、去除停用词功能、词频统计功能、特征词提取功能、聚类处理 功能和类别标注功能。动态聚类模块用于对静态匹配剩余的专利集进行分类处理。数据库 用于存储专利信息和存储分类结果。 -种利用上述中文工艺专利自动分类系统进行专利分类的方法,其特点是包括以 下步骤: 步骤一、以工艺方法为中心,结合制造对象和制造特征,将工艺专利按照两种方式 进行分类。一种是工艺方法和制造对象;另一种是工艺方法和制造特征; 步骤二、用工艺领域分类词汇库静态匹配查找工艺专利集, 1)领域专家集体归纳构建工艺领域分类词汇库; 2)将工艺专利集的标题或摘要与分类词汇库相匹配,直接匹配到分类词的专利集 即归属到此类别下; 步骤三、对未匹配到的工艺专利集进行动态聚类,最后进行类别标注并加入到分 类词汇库中, 1)获取静态匹配剩余专利的标题和摘要; 2)对工艺专利进行分词、词性标注和去停用词预处理; 3)对每个工艺专利的标题和摘要进行词频统计和特征词提取,包括三部分:制造 对象、工艺方法和制造特征,三个部分作为专利的特征,每个部分均从专利中提取出关键词 来代表专利的类别; 4)进行聚类处理,对专利集三类关键词组分别进行聚类,将专利分到的类别进行 标记、统计,同时匹配到组合特征的专利则为目的要求的类别; 5)对聚类的结果进行类别标注并加入到分类词汇库中。 本专利技术的有益效果是:该系统包括客户端计算机、应用服务器和数据库。计算机分 别通过网络与应用服务器连接,应用服务器通过数据线与数据库连接。客户端计算机用于 分类参数设置、类别标注设置以及查看分类结果。应用服务器包括专利获取模块、静态匹配 模块和动态聚类模块。其中,专利获取模块用于获取一篇专利文献的标题和摘要。静态匹 配模块用于分类词库匹配查找专利的标题或摘要来进行初步分类。动态聚类模块包括中文 分词功能、词性标注功能、去除停用词功能、词频统计功能、特征词提取功能、聚类处理功能 和类别标注功能。动态聚类模块用于对静态匹配剩余的专利集进行分类处理。数据库用于 存储专利信息和存储分类结果。由于采用静态匹配分类与动态聚类相结合处理中文工艺专 利分类,提高了专利分类系统的效率。 以下结合附图和【具体实施方式】详细说明本专利技术。 【专利附图】【附图说明】 图1是本专利技术中文工艺专利自动分类系统的架构图。 图2是本专利技术中文工艺专利自动分类系统框图。 图3是本专利技术利用中文工艺专利自动分类系统进行专利分类的方法流程图。 图4是利用上述中文工艺专利自动分类系统进行专利分类的方法之静态匹配分 类作业流程图。 本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201410441093.html" title="中文工艺专利自动分类系统及利用该系统进行专利分类的方法原文来自X技术">中文工艺专利自动分类系统及利用该系统进行专利分类的方法</a>

【技术保护点】
一种中文工艺专利自动分类系统,其特征在于包括客户端计算机、应用服务器和数据库;客户端计算机有多台,多台客户端计算机分别通过网络与应用服务器连接,应用服务器通过数据线与数据库连接;客户端计算机用于分类参数设置、类别标注设置以及查看分类结果;应用服务器包括专利获取模块、静态匹配模块和动态聚类模块;其中,专利获取模块用于获取一篇专利文献的标题和摘要;静态匹配模块用于分类词库匹配查找专利的标题或摘要来进行初步分类;动态聚类模块包括中文分词功能、词性标注功能、去除停用词功能、词频统计功能、特征词提取功能、聚类处理功能和类别标注功能;动态聚类模块用于对静态匹配剩余的专利集进行分类处理;数据库用于存储专利信息和存储分类结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:耿俊浩刘永刚王刚锋
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1