一种基于语意理解的专利汇总信息生成方法与系统技术方案

技术编号:39047347 阅读:14 留言:0更新日期:2023-10-10 12:00
一种基于语意理解的专利汇总信息生成方法,涉及专利检索的领域。该方法应用服务器,该方法包括:获取用户输入的专利检索词;将专利检索词与预设专利数据库进行匹配,得到多个对比文件;提取第一对比文件中的多个关键词,第一对比文件为多个对比文件中任意一个;将多个关键词进行专利汇总,生成专利汇总信息,专利汇总信息包括多个信息类别,多个信息类别包括技术问题、技术方案、技术核心以及技术效果;将专利汇总信息展示给用户。实施本申请提供的技术方案,为用户提供最容易理解的专利汇总信息,减少其阅读和理解专利的难度。减少其阅读和理解专利的难度。减少其阅读和理解专利的难度。

【技术实现步骤摘要】
一种基于语意理解的专利汇总信息生成方法与系统


[0001]本申请涉及专利检索的
,具体涉及一种基于语意理解的专利汇总信息生成方法与系统。

技术介绍

[0002]随着我国经济的快速发展,各个企业也逐渐加大在科技创新方面的投入。而为了避免研究成果的抄袭,专利成为了十分有效的防护手段。
[0003]当企业在申报专利的准备阶段时,需要对准备申报的专利方案进行专利检索,从而降低专利方案已被公开的风险。目前,企业在专利检索时,主要通过用户在专利查询网站输入检索词,然后专利查询网站根据输入的检索词匹配出多个相似的对比文件,以帮助用户快速找到最接近的对比文件。
[0004]在上述专利检索的过程中,用户在确定最接近的对比文件时,往往需要花费大量的时间阅读和理解专利文献,从而导致用户的检索效率较低。

技术实现思路

[0005]针对用户在确定最接近的对比文件时,往往需要花费大量的时间阅读和理解专利文献,从而导致用户的检索效率较低的问题,本申请提供一种基于语意理解的专利汇总信息生成方法与系统。
[0006]第一方面,本申请提供一种基于语意理解的专利汇总信息生成方法,应用于服务器,该方法包括:获取用户输入的专利检索词;将专利检索词与预设专利数据库进行匹配,得到多个对比文件;提取第一对比文件中的多个关键词,第一对比文件为多个对比文件中任意一个;将多个关键词进行专利汇总,生成专利汇总信息,专利汇总信息包括多个信息类别,多个信息类别包括技术问题、技术方案、技术核心以及技术效果;将专利汇总信息展示给用户。
[0007]通过采用上述技术方案,服务器将专利文献中的关键信息提取出来,再重新进行汇总,即提供技术问题、技术方案、技术核心以及技术效果的简要描述,使用户能够快速了解专利的
技术实现思路
和创新点。为用户提供最容易理解的专利汇总信息,减少其阅读和理解专利的难度;并且提高用户专利检索过程中的用户体验和检索效率,帮助用户更准确的筛选和评估专利。
[0008]第二方面,本申请提供一种基于语意理解的专利汇总信息的生成系统,述系统为服务器,服务器包括获取模块、处理模块以及发送模块,其中:获取模块,用于获取用户输入的专利检索词;处理模块,用于将专利检索词与预设专利数据库进行匹配,得到多个对比文件;提取第一对比文件中的多个关键词,第一对比文件为多个对比文件中任意一个;将多个关键词进行专利汇总,生成专利汇总信息,专利汇总信息包括多个信息类别,多个信息类别包括技术问题、技术方案、技术核心以及技术效果;
发送模块,用于将专利汇总信息展示给用户。
[0009]可选的,处理模块用于对第一对比文件进行数据清洗,得到多个特征词;计算多个特征词各自对应的权重值;将多个特征词对应的权重值按照从大到小的顺序进行排序,得到权重排序结果;若第一特征词的权重值大于或等于预设排名,则确定第一特征词为关键词,第一特征词为多个特征词中任意一个。
[0010]通过采用上述技术方案,在提取对比文件中的关键词时,首先通过数据清洗的方式初步筛掉第一对比文件中关联度较低的词,从而得到关联度较高的多个特征词;再对多个特征词进行权重值计算,根据权重值大小做进一步的精筛,得到权重值符合预设标准的特征词,从而提升了关键词提取的准确度。
[0011]可选的,处理模块用于将第二特征词与第一对比文件进行匹配,得到第二特征词的词频,第二特征词为多个特征词中任意一个;将第二特征词与多个对比文件进行匹配,得到包含第二特征词的文档的第一文档数量;根据第一文档数量与第二文档数量,计算第二特征词的逆文档频率,第二文档数量为多个对比文件的总数量;基于第一特征词的词频与逆文档频率,得到第一特征词的权重。
[0012]通过采用上述技术方案,对于关键词权重值的计算,通过计算第二特征词在第一对比文件中的词频,从而确定第二关键词在第一对比文件中的重要程度;再通过计算多个对比文件中出现第二特征词的文档数量,从而确定第二特征词在多个对比文件中的重要程度,最后综合第二特征词对两者的整体影响程度,从而提升关键词判断的准确度。
[0013]可选的,获取模块用于获取第一关键词的识别区域,识别区域包括摘要、权利要求书以及说明书,第一关键词为多个关键词中任意一个;处理模块用于基于第一关键词的识别区域,确定第一关键词对应的信息类别;根据预设的信息类别与信息处理规则之间的对应关系,确定第一关键词的信息处理规则;采用第一关键词的信息处理规则,将第一关键词生成专利汇总信息。
[0014]通过采用上述技术方案,由于专利文献中每个识别区域内所记载的内容有特定的信息记载格式;此时,根据每个识别区域的特点,预先设定信息处理规则,根据每个识别区域内的内容生成专利汇总信息中各个信息类别的信息,提高了各个信息类别记载信息的准确度。
[0015]可选的,将专利汇总信息展示给用户,具体还包括:获取模块用于响应于用户对第一信息类别的选取操作,第一信息类别为多个信息类别中任意一个;处理模块用于基于第一信息类别,计算多个对比文件与专利检索词的相似度值;若第一对比文件的相似度值大于或等于第二对比文件的相似度值,则优先展示第一对比文件的专利汇总信息,第二对比文件为多个对比文件中任意一个。
[0016]通过采用上述技术方案,由于专利汇总信息包含多个信息类别的内容,若用户的检索词大部分归类与某一个信息类别时,则此时根据该信息类别,将专利检索词与多个对比文件进行相似度计算,从而确定优先展示的对比文件,进而帮助用户快速找到需要的专利。
[0017]可选的,获取模块用于获取第一对比文件中第一信息类别对应的多个关键词;处理模块用于将第一对比文件中第一信息类别对应的多个关键词与专利检索词进行相似度计算,得到第一对比文件的相似度值。
[0018]通过采用上述技术方案,根据从对比文件筛选出的多个关键词计算检索词与对比文件的相似度,从而便于筛选出与检索词关联度较高的对比文件,并且由于多个关键词已经是对比文件中的关键信息,通过关键信息筛选关联度较高的对比文件更为准确。
[0019]可选的,优先展示第一对比文件的专利汇总信息,还包括:发送模块用于将第一信息类别对应的专利汇总信息进行展示,且将第二信息类别对应的专利汇总信息进行折叠展示,第二信息类别为多个信息类别中除第一信息类别的任意一个信息类别。
[0020]通过采用上述技术方案,由于专利汇总信息在展示时有多个信息类别需要展示,此时需要占用较多的阅读空间;此时,将用户需要的信息类别对应的专利汇总信息进行展示,而其他信息类别的专利汇总信息进行折叠展示,从而降低了阅读空间,为用户提供了较好的阅读体验。
[0021]第三方面,本申请提供一种电子设备,包括处理器、存储器、用户接口及网络接口,所述存储器用于存储指令,所述用户接口和网络接口用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如第一方面中任意一项所述的方法。
[0022]综上所述,本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语意理解的专利汇总信息生成方法,其特征在于,应用于服务器,所述方法包括:获取用户输入的专利检索词;将所述专利检索词与预设专利数据库进行匹配,得到多个对比文件;提取第一对比文件中的多个关键词,所述第一对比文件为多个所述对比文件中任意一个;将多个所述关键词进行专利汇总,生成专利汇总信息,所述专利汇总信息包括多个信息类别,多个所述信息类别包括技术问题、技术方案、技术核心以及技术效果;将所述专利汇总信息展示给所述用户。2.根据权利要求1所述的方法,其特征在于,所述提取第一对比文件中的多个关键词,具体为:对所述第一对比文件进行数据清洗,得到多个特征词;计算多个特征词各自对应的权重值;将多个特征词对应的权重值按照从大到小的顺序进行排序,得到权重排序结果;若第一特征词的权重值大于或等于预设排名,则确定所述第一特征词为关键词,所述第一特征词为多个所述特征词中任意一个。3.根据权利要求2所述的方法,其特征在于,所述计算多个特征词各自对应的权重值,具体为:将第二特征词与所述第一对比文件进行匹配,得到所述第二特征词的词频,所述第二特征词为多个所述特征词中任意一个;将所述第二特征词与多个所述对比文件进行匹配,得到包含所述第二特征词的文档的第一文档数量;根据所述第一文档数量与第二文档数量,计算所述第二特征词的逆文档频率,所述第二文档数量为多个所述对比文件的总数量;基于所述第一特征词的词频与所述逆文档频率,得到所述第一特征词的权重。4.根据权利要求1所述的方法,其特征在于,所述将多个所述关键词进行专利汇总,生成专利汇总信息,具体为:获取第一关键词的识别区域,所述识别区域包括摘要、权利要求书以及说明书,所述第一关键词为多个所述关键词中任意一个;基于所述第一关键词的识别区域,确定所述第一关键词对应的信息类别;根据预设的信息类别与信息处理规则之间的对应关系,确定所述第一关键词的信息处理规则;采用所述第一关键词的信息处理规则,将所述第一关键词生成专利汇总信息。5.根据权利要求1所述的方法,其特征在于,将所述专利汇总信息展示给所述用户,具体还包括:响应于所述用户对第一信息类别的选取操作,所述第一信息类别为多个所述...

【专利技术属性】
技术研发人员:李建雨张敏蔡青山左小雷
申请(专利权)人:企知道科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1