【技术实现步骤摘要】
文本检索方法和装置、存储介质及电子装置
本专利技术涉及计算机领域,具体而言,涉及一种文本检索方法和装置、存储介质及电子装置。
技术介绍
为了对将要申请的专利文本的授权前景进行预估,很多申请人往往会利用已公开的专利申请文件,对专利文本进行查新检索。然而,目前在利用专利文本检索平台进行上述检索的过程中,往往需要用户对待检索的专利文本进行预处理,如预先手动提取专利文本中的关键词、预先编写与专利文本相对应的布尔检索式等等,再利用处理后的内容实现检索。也就是说,针对专利文本的检索,相关技术所提供的方法的操作复杂度较高,从而导致检索效率较低的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种文本检索方法和装置、存储介质及电子装置,以至少解决相关技术中检索效率较低的技术问题。根据本专利技术实施例的一个方面,提供了一种文本检索方法,包括:获取通过客户端所上传的第一专利文本;获取从上述第一专利文本中提取出的关键文本,及与上述第一专利文本相匹配的专利分类号,其中,上述关键文本为通过文本提取模型从上述第一专利文本中提取出的文本,上述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;上述专利分类号通过文本分类模型识别得到,上述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;向服务器发送利用上述关键文本及上述专利分类号所生成的第一检索请求,其中,上述第一检索请求用于请求对上述 ...
【技术保护点】
1.一种文本检索方法,其特征在于,包括:/n获取通过客户端所上传的第一专利文本;/n获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号,其中,所述关键文本为通过文本提取模型从所述第一专利文本中提取出的文本,所述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;所述专利分类号通过文本分类模型识别得到,所述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;/n向服务器发送利用所述关键文本及所述专利分类号所生成的第一检索请求,其中,所述第一检索请求用于请求对所述第一专利文本进行检索;/n获取所述服务器所返回的与所述第一专利文本相匹配的第一专利文本列表,其中,所述第一专利文本列表中所包含的对象专利文本与所述第一专利文本的文本相似度大于第一阈值。/n
【技术特征摘要】
1.一种文本检索方法,其特征在于,包括:
获取通过客户端所上传的第一专利文本;
获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号,其中,所述关键文本为通过文本提取模型从所述第一专利文本中提取出的文本,所述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;所述专利分类号通过文本分类模型识别得到,所述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;
向服务器发送利用所述关键文本及所述专利分类号所生成的第一检索请求,其中,所述第一检索请求用于请求对所述第一专利文本进行检索;
获取所述服务器所返回的与所述第一专利文本相匹配的第一专利文本列表,其中,所述第一专利文本列表中所包含的对象专利文本与所述第一专利文本的文本相似度大于第一阈值。
2.根据权利要求1所述的方法,其特征在于,在所述向服务器发送利用所述关键文本及所述专利分类号所生成的第一检索请求之前,还包括:
在所述客户端中显示获取到的所述关键文本及所述专利分类号,其中,所述关键文本中包括第一摘要文本及第一关键词集,其中,所述第一摘要文本用于表示所述第一专利文本,所述第一关键词集中所包含的对象关键词为从所述第一摘要文本中提取到的关键词;
利用所述关键文本及所述专利分类号生成所述第一检索请求。
3.根据权利要求2所述的方法,其特征在于,在所述利用所述关键文本及所述专利分类号生成所述第一检索请求之前,还包括:
获取在所述客户端中执行的编辑操作所生成的第一调整指令;
根据所述第一调整指令执行以下至少一种调整操作:将所述第一摘要文本调整为第二摘要文本,将所述第一关键词集调整为第二关键词集,将所述专利分类号调整为调整后的所述专利分类号。
4.根据权利要求2所述的方法,其特征在于,在所述获取所述服务器所返回的与所述第一专利文本相匹配的第一专利文本列表之后,还包括:
获取在所述客户端中执行的编辑操作所生成的第二调整指令;
根据所述第二调整指令执行以下至少一种调整操作:将所述第一摘要文本调整为第三摘要文本,将所述第一关键词集调整为第三关键词集,将所述专利分类号调整为调整后的所述专利分类号;
获取根据所述第二调整指令得到的调整结果;
向所述服务器发送利用所述调整结果所生成的第二检索请求,其中,所述第二检索请求用于请求对所述第一专利文本进行检索;
获取所述服务器所返回的与所述第一专利文本相匹配的第二专利文本列表,其中,所述第二专利文本列表中所包含的对象专利文本与所述第一专利文本的文本相似度大于第二阈值,所述第二阈值大于所述第一阈值。
5.根据权利要求2所述的方法,其特征在于,所述获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号包括:
将所述第一专利文本发送至所述服务器,以对所述第一专利文本进行文本预处理;
获取所述服务器所返回的所述关键文本及所述专利分类号。
6.根据权利要求5所述的方法,其特征在于,所述获取所述服务器所返回的所述关键文本及所述专利分类号包括:
所述服务器对所述第一专利文本进行分段处理,得到与所述第一专利文本对应的文本段集;
所述服务器通过所述文本提取模型提取所述文本段集的第一文本特征,并根据所述第一文本特征对所述第一专利文本进行词义分析和文本重组,以得到所述第一摘要文本;
所述服务器从所述第一摘要文本中提取出所述第一关键词集;
所述服务器通过所述文本分类模型提取所述文本段集的第二文本特征,并根据所述第二文本特征识别所述第一专利文本的所述专利分类号。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述获取通过客户端所上传的第一专利文本包括以下至少之一:
获取选择指令,其中,所述选择指令用于指示选择存储在目标路径下的所述第一专利文本;响应所述选择指令,上传所述第一专利文本;
获取拖动指令,其中,所述拖动指令用于指示将所述第一专利文本拖动至所述客户端所显示界面的目标区域中;响应所述拖动指令,上传所述第一专利文本。
8.一种文本检索方法,其特征在于,包括:
接收客户端发送的第一专利文本;
获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号,其中,所述关键文本为通过文本提取模型从所述第一专利文本中提取出的文本,所述文本提取模型为使用已公开的专利文本进行机器训练后所得到的用于提取专利文本中的关键文本的模型;所述专利分类号通过文本分类模型识别得到,所述文本分类模型为使用已公开的专利文本进行机器训练后所得到的用于识别专利文本的所属分类的模型;
将所述关键文本及所述专利分类号发送所述客户端;
接收所述客户端利用所述关键文本及所述专利分类号所生成的第一检索请求,其中,所述第一检索请求用于请求对所述第一专利文本进行检索;
向所述客户端返回与所述第一专利文本相匹配的第一专利文本列表,其中,所述第一专利文本列表中所包含的对象专利文本与所述第一专利文本的文本相似度大于第一阈值。
9.根据权利要求8所述的方法,其特征在于,所述获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号包括:
对所述第一专利文本进行分段处理,得到与所述第一专利文本对应的文本段集;
通过所述文本提取模型提取所述文本段集的第一文本特征,并根据所述第一文本特征对所述第一专利文本进行词义分析和文本重组,以得到第一摘要文本;
从所述第一摘要文本中提取出第一关键词集;
通过所述文本分类模型提取所述文本段集的第二文本特征,并根据所述第二文本特征识别所述第一专利文本的所述专利分类号。
10.根据权利要求8所述的方法,其特征在于,在所述向所述客户端返回与所述第一专利文本相匹配的第一专利文本列表之前,还包括:
响应所述第一检索请求,通过文本检索模型从数据库中检索出与所述第一专利文本相匹配的所述第一专利文本列表,其中,所述文本检索模型为使用已公开的专利文本进行机器训练后所得到的用于根据文本相似度进行文本检索的模型。
11.一种文本检索装置,其特征在于,包括:
第一获取单元,用于获取通过客户端所上传的第一专利文本;
第二获取单元,用于获取从所述第一专利文本中提取出的关键文本,及与所述第一专利文本相匹配的专利分类号,其中,所述关键文本为通过文本提取模型从所述第一专利文本中提取出的文本,所述文本提取模型为使用已公开的专利文本进行机器训练后所...
【专利技术属性】
技术研发人员:詹焯扬,张晓泉,程昊,蔡健,袁子斌,李文文,邬龙,江涛,乔宝琛,杨妤卿,
申请(专利权)人:深圳市蓝灯鱼智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。