专利筛选的方法技术

技术编号:39590663 阅读:10 留言:0更新日期:2023-12-03 19:43
本发明专利技术公开了专利筛选的方法

【技术实现步骤摘要】
专利筛选的方法、系统及装置


[0001]本专利技术涉及专利筛选领域,尤其是涉及一种专利筛选的方法

系统及装置


技术介绍

[0002]专利申请文件中包含大量的信息,使得专利检索成为研发人员获取参考资料的重要途径,通过专利检索可以了解相关技术的发展状况,掌握技术发展的趋势,避免重复研发,同时,如果需要完成专利申请文件撰写,也可以检索之前的专利申请作为参考,现有的检索方式没有明确关键词具体检索申请文件哪些部分,造成检索结果不准确,没有对专利文献提前进行关键字检索来减少系统内存占有率


技术实现思路

[0003]本专利技术的目的在于提供一种专利筛选的方法

系统及装置,旨在解决专利筛选

[0004]本专利技术提供一种专利筛选的方法,包括:
[0005]S1、
建立专利筛选模型;
[0006]S2、
将专利语料输入到专利筛选模型中得到筛选结果;
[0007]S3、
输入要筛选的关键内容,将关键内容与筛选结果匹配,按关键字与筛选结果的相似度进行由高到低的排列展示

[0008]本专利技术还提供一种专利筛选的系统,包括:
[0009]建立模块:用于建立专利筛选模型;
[0010]筛选结果模块:用于将专利语料输入到专利筛选模型中得到筛选结果;
[0011]展示模块:用于输入要筛选的关键内容,将关键内容与筛选结果匹配,按关键字与筛选结果的相似度进行由高到低的排列展示

[0012]本专利技术实施例还提供一种专利筛选的装置,包括:存储器

处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述方法的步骤

[0013]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现上述方法的步骤

[0014]采用本专利技术实施例,可以实现专利筛选,减少内存运行量

[0015]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的

特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式

附图说明
[0016]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前
提下,还可以根据这些附图获得其他的附图

[0017]图1是本专利技术实施例的专利筛选的方法流程图;
[0018]图2是本专利技术实施例的专利筛选的系统示意图;
[0019]图3是本专利技术实施例的专利筛选的装置示意图

具体实施方式
[0020]下面将结合实施例对本专利技术的技术方案进行清楚

完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0021]方法实施例
[0022]根据本专利技术实施例,提供了一种专利筛选的方法,图1是本专利技术实施例的专利筛选的方法流程图,如图1所示,具体包括:
[0023]S1、
建立专利筛选模型;
[0024]S1
具体包括:建立专利筛选模型,所述专利筛选模型包括,用于提取权利要求关键字的权利要求关键字模块

用于提取说明书关键字的说明书关键字模块

用于提取
技术介绍
关键字的
技术介绍
关键字模块和用于检索公司名称的公司模块

[0025]每个专利的权利要求关键字不少于8个,说明书的关键字不少于
13
个,
技术介绍
的关键字不少于5个,关键字出现较多的为主要关键字

[0026]专利筛选模型还可以包括:价值度筛选

公司法人筛选和专利附图的
AI
识别等

[0027]根据市场价值计算专利价值度,按照价值度高低进行排列

[0028]专利附图的
AI
识别匹配方法采用哈希算法:
[0029]计算汉明距离采用平均哈希法
(aHash)
,此算法是基于比较灰度图每个像素与平均值来实现的;
[0030]步骤如下:
[0031]1.
缩放图片,一般大小为
8*8

64
个像素值

[0032]2.
转化为灰度图;
[0033]3.
计算平均值:计算进行灰度处理后图片的所有像素点的平均值,直接用
numpy
中的
mean()
计算即可

[0034]4.
比较像素灰度值:遍历灰度图片每一个像素,如果大于平均值记录为1,否则为
0。
[0035]5.
得到信息指纹:组合
64

bit
位,顺序随意保持一致性

[0036]6.
最后比对两张图片的指纹,获得汉明距离即可

[0037]汉明距离:假如一组二进制数据为
101
,另外一组为
111
,那么显然把第一组的第二位数据0改成1就可以变成第二组数据
111
,所以两组数据的汉明距离就为1;简单点说,汉明距离就是一组二进制数据变成另一组数据所需的步骤数,显然,这个数值可以衡量两张图片的差异,汉明距离越小,则代表相似度越高

汉明距离为0,即代表两张图片完全一样

[0038]S2、
将专利语料输入到专利筛选模型中得到筛选结果

[0039]S2
具体包括:将专利语料输入到专利筛选模型中转换成数字数据,筛选出专利的
权利要求关键字

说明书关键字


技术介绍
关键字和公司名称
,
其中,权利要求关键字

说明书关键字


技术介绍
关键字筛选包括同义筛选和近义筛选

[0040]对于权利要求关键字的提取可以采用以下方法:
[0041]将专利语料进行分句,每句话提取一个句关键词,每段中的多个句关键词进行提取得到段关键词,段关键词的选取可以有多个,从段关键词中选取几个频率高的作为筛选结果

提取的关键词名词优先于其他词,提取算法采本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种专利筛选的方法,其特征在于,包括,
S1、
建立专利筛选模型;
S2、
将专利语料输入到专利筛选模型中得到筛选结果;
S3、
输入要筛选的关键内容,将关键内容与筛选结果匹配,按关键字与筛选结果的相似度进行由高到低的排列展示
。2.
根据权利要求1所述的方法,其特征在于,所述
S1
具体包括:建立专利筛选模型,所述专利筛选模型包括,用于提取权利要求关键字的权利要求关键字模块

用于提取说明书关键字的说明书关键字模块

用于提取背景技术关键字的背景技术关键字模块和用于检索公司名称的公司模块
。3.
根据权利要求2所述的方法,其特征在于,所述
S2
具体包括:将专利语料输入到专利筛选模型中,筛选出专利的权利要求关键字

说明书关键字

背景技术关键字和公司名称
。4.
根据权利要求3所述的方法,其特征在于,所述
S3
具体包括:输入要筛选的权利要求关键字,选择是否输入说明书关键字

背景技术关键字和公司名称,将输入的筛选内容与已经筛选好的结果进行匹配,按关键字与筛选结果的相似度进行由高到低的排列展示
。5.
一种专利筛选的系统,其特征在于,包括,建立模块:用于建立专利筛选模型;筛选结果模块:用于将专利语料输入到专利筛选模型中得到筛选结果;展示模块:用于输入要筛...

【专利技术属性】
技术研发人员:夏欣欣孙鹏梁金杰王霄培
申请(专利权)人:北京八月瓜科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1