文本检索方法和装置、存储介质及电子装置制造方法及图纸

技术编号:23533759 阅读:32 留言:0更新日期:2020-03-20 08:00
本发明专利技术公开了一种文本检索方法和装置、存储介质及电子装置。其中,该方法包括:获取通过客户端所上传的第一专利文本;获取从第一专利文本中提取出的关键文本,及与第一专利文本相匹配的专利分类号;向服务器发送利用关键文本及专利分类号所生成的第一检索请求,其中,第一检索请求用于请求对第一专利文本进行检索;获取服务器所返回的与第一专利文本相匹配的第一专利文本列表,其中,第一专利文本列表中所包含的对象专利文本与第一专利文本的文本相似度大于第一阈值。本发明专利技术解决了相关技术中检索效率较低的技术问题。

Text retrieval methods and devices, storage media and electronic devices

【技术实现步骤摘要】
文本检索方法和装置、存储介质及电子装置
本专利技术涉及计算机领域,具体而言,涉及一种文本检索方法和装置、存储介质及电子装置。
技术介绍
为了对将要申请的专利文本的授权前景进行预估,很多申请人往往会利用已公开的专利申请文件,对专利文本进行查新检索。然而,目前在利用专利文本检索平台进行上述检索的过程中,往往需要用户对待检索的专利文本进行预处理,如预先手动提取专利文本中的关键词、预先编写与专利文本相对应的布尔检索式等等,再利用处理后的内容实现检索。也就是说,针对专利文本的检索,相关技术所提供的方法的操作复杂度较高,从而导致检索效率较低的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种文本检索方法和装置、存储介质及电子装置,以至少解决相关技术中检索效率较低的技术问题。根据本专利技术实施例的一个方面,提供了一种文本检索方法,包括:获取通过客户端所上传的第一专利文本;获取从上述第一专利文本中提取出的关键文本,及与上述第一专利文本相匹配的专利分类号,其中,上述关键文本为通过文本提取模型从上述第一专利文本中提取出的文本,上述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;上述专利分类号通过文本分类模型识别得到,上述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;向服务器发送利用上述关键文本及上述专利分类号所生成的第一检索请求,其中,上述第一检索请求用于请求对上述第一专利文本进行检索;获取上述服务器所返回的与上述第一专利文本相匹配的第一专利文本列表,其中,上述第一专利文本列表中所包含的对象专利文本与上述第一专利文本的文本相似度大于第一阈值。根据本专利技术实施例的另一方面,还提供了一种文本检索方法,包括:接收客户端发送的第一专利文本;获取从上述第一专利文本中提取出的关键文本,及与上述第一专利文本相匹配的专利分类号,其中,上述关键文本为通过文本提取模型从上述第一专利文本中提取出的文本,上述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;上述专利分类号通过文本分类模型识别得到,上述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;将上述关键文本及上述专利分类号发送上述客户端;接收上述客户端利用上述关键文本及上述专利分类号所生成的第一检索请求,其中,上述第一检索请求用于请求对上述第一专利文本进行检索;向上述客户端返回与上述第一专利文本相匹配的第一专利文本列表,其中,上述第一专利文本列表中所包含的对象专利文本与上述第一专利文本的文本相似度大于第一阈值。根据本专利技术实施例的又一方面,还提供了一种文本检索装置,包括:第一获取单元,用于获取通过客户端所上传的第一专利文本;第二获取单元,用于获取从上述第一专利文本中提取出的关键文本,及与上述第一专利文本相匹配的专利分类号,其中,上述关键文本为通过文本提取模型从上述第一专利文本中提取出的文本,上述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;上述专利分类号通过文本分类模型识别得到,上述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;第一发送单元,用于向服务器发送利用上述关键文本及上述专利分类号所生成的第一检索请求,其中,上述第一检索请求用于请求对上述第一专利文本进行检索;第三获取单元,用于获取上述服务器所返回的与上述第一专利文本相匹配的第一专利文本列表,其中,上述第一专利文本列表中所包含的对象专利文本与上述第一专利文本的文本相似度大于第一阈值。根据本专利技术实施例的又一方面,还提供了一种文本检索装置,包括:第一接收单元,用于接收客户端发送的第一专利文本;获取单元,用于获取从上述第一专利文本中提取出的关键文本,及与上述第一专利文本相匹配的专利分类号,其中,上述关键文本为通过文本提取模型从上述第一专利文本中提取出的文本,上述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;上述专利分类号通过文本分类模型识别得到,上述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;发送单元,用于将上述关键文本及上述专利分类号发送上述客户端;第二接收单元,用于接收上述客户端利用上述关键文本及上述专利分类号所生成的第一检索请求,其中,上述第一检索请求用于请求对上述第一专利文本进行检索;返回单元,用于向上述客户端返回与上述第一专利文本相匹配的第一专利文本列表,其中,上述第一专利文本列表中所包含的对象专利文本与上述第一专利文本的文本相似度大于第一阈值。根据本专利技术实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述文本检索方法。根据本专利技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的文本检索方法。在本专利技术实施例中,在获取到客户端上传的第一专利文本之后,使用文本提取模型从第一专利文本中提取出关键文本,并使用文本分类模型识别出第一专利文本中的专利分类号。根据上述关键文本与专利分类号生成第一检索请求并将第一检索请求发送给服务器,以使服务器根据专利检索请求检索第一专利文本列表,得到检索结果。在上述过程中,由于通过模型准确获取到关键文本与专利分类号,从而可以对第一专利文本进行准确高效的检索,进而解决了相关技术中检索效率较低的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选的文本检索方法的流程示意图;图2是根据本专利技术实施例的一种可选的文本检索方法的示意图;图3是根据本专利技术实施例的另一种可选的文本检索方法的示意图;图4是根据本专利技术实施例的又一种可选的文本检索方法的示意图;图5是根据本专利技术实施例的又一种可选的文本检索方法的示意图;图6是根据本专利技术实施例的又一种可选的文本检索方法的示意图;图7是根据本专利技术实施例的又一种可选的文本检索方法的示意图;图8是根据本专利技术实施例的又一种可选的文本检索方法的示意图;图9是根据本专利技术实施例的另一种可选的文本检索方法的流程示意图;图10是根据本专利技术实施例的一种可选的文本检索装置的结构示意图;图11是根据本专利技术实施例的另一种可选的文本检索装置的结构示意图;图12是根据本专利技术实施例的一种可选的电子装置的结构示意图。图13是根据本专利技术实施例的另一种可选的电子装置的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图本文档来自技高网
...

【技术保护点】
1.一种文本检索方法,其特征在于,包括:/n获取通过客户端所上传的第一专利文本;/n获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号,其中,所述关键文本为通过文本提取模型从所述第一专利文本中提取出的文本,所述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;所述专利分类号通过文本分类模型识别得到,所述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;/n向服务器发送利用所述关键文本及所述专利分类号所生成的第一检索请求,其中,所述第一检索请求用于请求对所述第一专利文本进行检索;/n获取所述服务器所返回的与所述第一专利文本相匹配的第一专利文本列表,其中,所述第一专利文本列表中所包含的对象专利文本与所述第一专利文本的文本相似度大于第一阈值。/n

【技术特征摘要】
1.一种文本检索方法,其特征在于,包括:
获取通过客户端所上传的第一专利文本;
获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号,其中,所述关键文本为通过文本提取模型从所述第一专利文本中提取出的文本,所述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;所述专利分类号通过文本分类模型识别得到,所述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;
向服务器发送利用所述关键文本及所述专利分类号所生成的第一检索请求,其中,所述第一检索请求用于请求对所述第一专利文本进行检索;
获取所述服务器所返回的与所述第一专利文本相匹配的第一专利文本列表,其中,所述第一专利文本列表中所包含的对象专利文本与所述第一专利文本的文本相似度大于第一阈值。


2.根据权利要求1所述的方法,其特征在于,在所述向服务器发送利用所述关键文本及所述专利分类号所生成的第一检索请求之前,还包括:
在所述客户端中显示获取到的所述关键文本及所述专利分类号,其中,所述关键文本中包括第一摘要文本及第一关键词集,其中,所述第一摘要文本用于表示所述第一专利文本,所述第一关键词集中所包含的对象关键词为从所述第一摘要文本中提取到的关键词;
利用所述关键文本及所述专利分类号生成所述第一检索请求。


3.根据权利要求2所述的方法,其特征在于,在所述利用所述关键文本及所述专利分类号生成所述第一检索请求之前,还包括:
获取在所述客户端中执行的编辑操作所生成的第一调整指令;
根据所述第一调整指令执行以下至少一种调整操作:将所述第一摘要文本调整为第二摘要文本,将所述第一关键词集调整为第二关键词集,将所述专利分类号调整为调整后的所述专利分类号。


4.根据权利要求2所述的方法,其特征在于,在所述获取所述服务器所返回的与所述第一专利文本相匹配的第一专利文本列表之后,还包括:
获取在所述客户端中执行的编辑操作所生成的第二调整指令;
根据所述第二调整指令执行以下至少一种调整操作:将所述第一摘要文本调整为第三摘要文本,将所述第一关键词集调整为第三关键词集,将所述专利分类号调整为调整后的所述专利分类号;
获取根据所述第二调整指令得到的调整结果;
向所述服务器发送利用所述调整结果所生成的第二检索请求,其中,所述第二检索请求用于请求对所述第一专利文本进行检索;
获取所述服务器所返回的与所述第一专利文本相匹配的第二专利文本列表,其中,所述第二专利文本列表中所包含的对象专利文本与所述第一专利文本的文本相似度大于第二阈值,所述第二阈值大于所述第一阈值。


5.根据权利要求2所述的方法,其特征在于,所述获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号包括:
将所述第一专利文本发送至所述服务器,以对所述第一专利文本进行文本预处理;
获取所述服务器所返回的所述关键文本及所述专利分类号。


6.根据权利要求5所述的方法,其特征在于,所述获取所述服务器所返回的所述关键文本及所述专利分类号包括:
所述服务器对所述第一专利文本进行分段处理,得到与所述第一专利文本对应的文本段集;
所述服务器通过所述文本提取模型提取所述文本段集的第一文本特征,并根据所述第一文本特征对所述第一专利文本进行词义分析和文本重组,以得到所述第一摘要文本;
所述服务器从所述第一摘要文本中提取出所述第一关键词集;
所述服务器通过所述文本分类模型提取所述文本段集的第二文本特征,并根据所述第二文本特征识别所述第一专利文本的所述专利分类号。


7.根据权利要求1至5中任一项所述的方法,其特征在于,所述获取通过客户端所上传的第一专利文本包括以下至少之一:
获取选择指令,其中,所述选择指令用于指示选择存储在目标路径下的所述第一专利文本;响应所述选择指令,上传所述第一专利文本;
获取拖动指令,其中,所述拖动指令用于指示将所述第一专利文本拖动至所述客户端所显示界面的目标区域中;响应所述拖动指令,上传所述第一专利文本。


8.一种文本检索方法,其特征在于,包括:
接收客户端发送的第一专利文本;
获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号,其中,所述关键文本为通过文本提取模型从所述第一专利文本中提取出的文本,所述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;所述专利分类号通过文本分类模型识别得到,所述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;
将所述关键文本及所述专利分类号发送所述客户端;
接收所述客户端利用所述关键文本及所述专利分类号所生成的第一检索请求,其中,所述第一检索请求用于请求对所述第一专利文本进行检索;
向所述客户端返回与所述第一专利文本相匹配的第一专利文本列表,其中,所述第一专利文本列表中所包含的对象专利文本与所述第一专利文本的文本相似度大于第一阈值。


9.根据权利要求8所述的方法,其特征在于,所述获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号包括:
对所述第一专利文本进行分段处理,得到与所述第一专利文本对应的文本段集;
通过所述文本提取模型提取所述文本段集的第一文本特征,并根据所述第一文本特征对所述第一专利文本进行词义分析和文本重组,以得到第一摘要文本;
从所述第一摘要文本中提取出第一关键词集;
通过所述文本分类模型提取所述文本段集的第二文本特征,并根据所述第二文本特征识别所述第一专利文本的所述专利分类号。


10.根据权利要求8所述的方法,其特征在于,在所述向所述客户端返回与所述第一专利文本相匹配的第一专利文本列表之前,还包括:
响应所述第一检索请求,通过文本检索模型从数据库中检索出与所述第一专利文本相匹配的所述第一专利文本列表,其中,所述文本检索模型为使用已公开的专利文本进行机器训练后所得到的用于根据文本相似度进行文本检索的模型。


11.一种文本检索装置,其特征在于,包括:
第一获取单元,用于获取通过客户端所上传的第一专利文本;
第二获取单元,用于获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号,其中,所述关键文本为通过文本提取模型从所述第一专利文本中提取出的文本,所述文本提取模型为使用已公开的专利文本进行机器训练后所...

【专利技术属性】
技术研发人员:詹焯扬张晓泉程昊蔡健袁子斌李文文邬龙江涛乔宝琛杨妤卿
申请(专利权)人:深圳市蓝灯鱼智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1