一种专利信息推送方法及系统技术方案

技术编号:35111701 阅读:11 留言:0更新日期:2022-10-01 17:26
本发明专利技术涉及信息推送技术领域,具体公开了一种专利信息推送方法及系统,所述方法包括接收用户发送的含有文件内容的专利查询请求,基于所述文件内容确定至少一个特征段;将所述特征段输入搜索引擎,得到反馈信息;将所述反馈信息转换为反馈图像,对所述反馈图像进行筛选,得到目标专利;统计所述目标专利,得到以所述特征段为索引的专利组。本发明专利技术接收用户上传的在研发过程产生的文件内容,对所述文件内容进行截取、分析和识别,确定一些特征段,借助现有的搜索引擎,获取反馈信息,将反馈信息转换为反馈图像后,借助图像识别技术,确定相关专利进行推送,可以极大地扩充用户的视野,使得概括出的关键特征更加全面。概括出的关键特征更加全面。概括出的关键特征更加全面。

【技术实现步骤摘要】
一种专利信息推送方法及系统


[0001]本专利技术涉及信息推送
,具体是一种专利信息推送方法及系统。

技术介绍

[0002]随着科技的发展和知识产权的发展,专利信息资源数据量迅速膨胀,研发人员在进行产品设计之前,往往需要查询相关的专利信息;这一查询检索过程,需要由研发人员确定一些关键特征,然后配合专利工作人员,进行专利信息的检索;在关键特征的确定过程中,研发人员有时候会对自己的技术在专利方面的特征不太了解,因此,如何能够在用户确定关键特征之前,进行相关的推送,扩充用户的知识面,可以有效地提高关键特征的全面性。

技术实现思路

[0003]本专利技术的目的在于提供一种专利信息推送方法及系统,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种专利信息推送方法,所述方法包括:接收用户发送的含有文件内容的专利查询请求,基于所述文件内容确定至少一个特征段;将所述特征段输入搜索引擎,得到反馈信息;将所述反馈信息转换为反馈图像,对所述反馈图像进行筛选,得到目标专利;统计所述目标专利,得到以所述特征段为索引的专利组。
[0005]作为本专利技术进一步的方案:所述接收用户发送的含有文件内容的专利查询请求,基于所述文件内容确定至少一个特征段的步骤包括:接收用户发送的含有文件内容的专利查询请求,获取所述文件内容的文件信息;所述文件信息用于表征文件内容的存储方式;将所述文件信息输入训练好的截取函数,确定截取参数;基于所述截取参数读取文件内容中的子文件,将所述子文件输入训练好的数据转换模型,得到文本数据;在所述文本数据中提取特征段。
[0006]作为本专利技术进一步的方案:所述在所述文本数据中提取特征段的步骤包括:连接不同子文件对应的文本数据,计算连接后的文本数据的数据量;根据所述数据量确定含有标号的读取节点;以所述读取节点为端点在连接后的文本数据中截取文本信息,得到待检文本;其中,所述待检文本的标号与相应读取节点的标号相同;读取待检文本中的关键词,生成以待检标号为索引的关键词组,作为特征段。
[0007]作为本专利技术进一步的方案:所述读取待检文本中的关键词,生成以待检标号为索
引的关键词组,作为特征段的步骤包括:遍历所述待检文本,定位空白符,基于所述空白符将所述待检文本转换为多段文本数组;依次获取所述多段文本数组的数组长度,并将所述数组长度与预设的长度阈值进行比对;当所述数组长度小于所述长度阈值时,提取相应的文本数组中的内容,作为关键词;当所述数组长度大于所述长度阈值时,对相应的文本数组进行内容识别,提取关键词。
[0008]作为本专利技术进一步的方案:所述当所述数组长度大于所述长度阈值时,对相应的文本数组进行内容识别,提取关键词的步骤包括:将所述文本数组输入训练好的词性分析模型,得到带有词性标记的预处理文本;剔除所述预处理文本中的虚词,得到初筛文本;遍历所述初筛文本的修饰词,基于预设的词性统计模型获取所述修饰词的使用频率,标记使用频率小于预设的频率阈值的修饰词;根据标记的修饰词读取相邻的主体词,作为关键词;其中,所述修饰词包括形容词和副词,所述主体词包括名词和动词。
[0009]作为本专利技术进一步的方案:所述将所述反馈信息转换为反馈图像,对所述反馈图像进行筛选,得到目标专利的步骤包括:读取搜索引擎的信息排列规则,根据所述信息排列规则将预设数量的反馈信息转换同一张反馈图像;其中,所述反馈信息与反馈图像中的位置信息之间存在映射关系;根据预设的词条特征定位所述反馈图像中的目标信息;根据所述目标信息查询相应的反馈信息,根据所述反馈信息获取目标专利。
[0010]本专利技术技术方案还提供了一种专利信息推送系统,所述系统包括:特征段确定模块,用于接收用户发送的含有文件内容的专利查询请求,基于所述文件内容确定至少一个特征段;反馈信息获取模块,用于将所述特征段输入搜索引擎,得到反馈信息;信息筛选模块,用于将所述反馈信息转换为反馈图像,对所述反馈图像进行筛选,得到目标专利;专利组统计模块,用于统计所述目标专利,得到以所述特征段为索引的专利组。
[0011]作为本专利技术进一步的方案:所述特征段确定模块包括:文件信息查询单元,用于接收用户发送的含有文件内容的专利查询请求,获取所述文件内容的文件信息;所述文件信息用于表征文件内容的存储方式;截取参数确定单元,用于将所述文件信息输入训练好的截取函数,确定截取参数;文本数据获取单元,用于基于所述截取参数读取文件内容中的子文件,将所述子文件输入训练好的数据转换模型,得到文本数据;数据提取单元,用于在所述文本数据中提取特征段。
[0012]作为本专利技术进一步的方案:所述数据提取单元包括:连接子单元,用于连接不同子文件对应的文本数据,计算连接后的文本数据的数
据量;节点确定子单元,用于根据所述数据量确定含有标号的读取节点;执行子单元,用于以所述读取节点为端点在连接后的文本数据中截取文本信息,得到待检文本;其中,所述待检文本的标号与相应读取节点的标号相同;关键词读取子单元,用于读取待检文本中的关键词,生成以待检标号为索引的关键词组,作为特征段。
[0013]作为本专利技术进一步的方案:所述信息筛选模块包括:转换单元,用于读取搜索引擎的信息排列规则,根据所述信息排列规则将预设数量的反馈信息转换同一张反馈图像;其中,所述反馈信息与反馈图像中的位置信息之间存在映射关系;定位单元,用于根据预设的词条特征定位所述反馈图像中的目标信息;数据获取单元,用于根据所述目标信息查询相应的反馈信息,根据所述反馈信息获取目标专利。
[0014]与现有技术相比,本专利技术的有益效果是:本专利技术接收用户上传的在研发过程产生的文件内容,对所述文件内容进行截取、分析和识别,确定一些特征段,借助现有的搜索引擎,获取反馈信息,将反馈信息转换为反馈图像后,借助图像识别技术,确定相关专利进行推送,可以极大地扩充用户的视野,使得概括出的关键特征更加全面。
附图说明
[0015]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例。
[0016]图1为专利信息推送方法的流程框图。
[0017]图2为专利信息推送方法的第一子流程框图。
[0018]图3为专利信息推送方法的第二子流程框图。
[0019]图4为专利信息推送系统的组成结构框图。
[0020]图5为专利信息推送系统中特征段确定模块的组成结构框图。
[0021]图6为专利信息推送系统中信息筛选模块的组成结构框图。
具体实施方式
[0022]研发人员在进行产品设计之前,往往需要查询相关的专利信息;这一查询检索过程,需要由研发人员确定一些关键特征,然后配合专利工作人员,进行专利信息的检索;在关键特征的确定过程中,研发人员有时候会对自己的技术在专利方面的特征不太了解,因此,如何能够在用户确定关键特征之前,进行相关的推送,扩充用户的知识面,可以有效地提高本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种专利信息推送方法,其特征在于,所述方法包括:接收用户发送的含有文件内容的专利查询请求,基于所述文件内容确定至少一个特征段;将所述特征段输入搜索引擎,得到反馈信息;将所述反馈信息转换为反馈图像,对所述反馈图像进行筛选,得到目标专利;统计所述目标专利,得到以所述特征段为索引的专利组。2.根据权利要求1所述的专利信息推送方法,其特征在于,所述接收用户发送的含有文件内容的专利查询请求,基于所述文件内容确定至少一个特征段的步骤包括:接收用户发送的含有文件内容的专利查询请求,获取所述文件内容的文件信息;所述文件信息用于表征文件内容的存储方式;将所述文件信息输入训练好的截取函数,确定截取参数;基于所述截取参数读取文件内容中的子文件,将所述子文件输入训练好的数据转换模型,得到文本数据;在所述文本数据中提取特征段。3.根据权利要求2所述的专利信息推送方法,其特征在于,所述在所述文本数据中提取特征段的步骤包括:连接不同子文件对应的文本数据,计算连接后的文本数据的数据量;根据所述数据量确定含有标号的读取节点;以所述读取节点为端点在连接后的文本数据中截取文本信息,得到待检文本;其中,所述待检文本的标号与相应读取节点的标号相同;读取待检文本中的关键词,生成以待检标号为索引的关键词组,作为特征段。4.根据权利要求3所述的专利信息推送方法,其特征在于,所述读取待检文本中的关键词,生成以待检标号为索引的关键词组,作为特征段的步骤包括:遍历所述待检文本,定位空白符,基于所述空白符将所述待检文本转换为多段文本数组;依次获取所述多段文本数组的数组长度,并将所述数组长度与预设的长度阈值进行比对;当所述数组长度小于所述长度阈值时,提取相应的文本数组中的内容,作为关键词;当所述数组长度大于所述长度阈值时,对相应的文本数组进行内容识别,提取关键词。5.根据权利要求4所述的专利信息推送方法,其特征在于,所述当所述数组长度大于所述长度阈值时,对相应的文本数组进行内容识别,提取关键词的步骤包括:将所述文本数组输入训练好的词性分析模型,得到带有词性标记的预处理文本;剔除所述预处理文本中的虚词,得到初筛文本;遍历所述初筛文本的修饰词,基于预设的词性统计模型获取所述修饰词的使用频率,标记使用频率小于预设的频率阈值的修饰词;根据标记的修饰词读取相邻的主体词,作为关键词;其中,所述修饰词包括形容词和副词,所述主体词包括名词和动词。6.根据权利要求1所...

【专利技术属性】
技术研发人员:朱峰彭丽
申请(专利权)人:广东知得失网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1