一种基于生成式的分类检索方法技术

技术编号:38375312 阅读:7 留言:0更新日期:2023-08-05 17:36
本发明专利技术涉及分类搜索技术领域,且公开了一种基于生成式的分类检索方法,包括以下步骤:步骤一、对检索内容进行预处理;步骤二、获取针对待检索数据的检索式;步骤三、对待检索数据进行分类;步骤四、对待检索数据进行测试处理;步骤五、构建检索模型;步骤六、发出检索要求;步骤七、完成检索,并对检索内容进出储存。该发明专利技术,通过对所要搜索的内容进行处理,把图片,文字,以及视频等待搜索内容依次扫描,并对扫描结果进行分类,按照不同类型对待搜索内容检测,然后再对于待检索内容进行搜索,然后对于搜索内容进行对比分类,从而使得在进行检索时,更直观,更省时的找到所需的检索内容。更省时的找到所需的检索内容。更省时的找到所需的检索内容。

【技术实现步骤摘要】
一种基于生成式的分类检索方法


[0001]本专利技术涉及分类搜索
,具体为一种基于生成式的分类检索方法。

技术介绍

[0002]搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。因特网上的信息浩瀚万千,而且毫无秩序,所有的信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
[0003]随着人们生活的不断变化,人们对于搜索引擎的使用也变得越来越常见,但是也由于搜索引擎的大量使用,使得各类搜索信息混杂,就使得在进行搜索时,不便于对搜索内容进行寻找,费时费力,所以现在提出一种分类搜索的方法,来解决这一问题,保证搜索信息的精准性。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术的不足,本专利技术提供了一种基于生成式的分类检索方法,具备保证搜索信息的精准性等优点,解决了上述
技术介绍
中提到的传统的搜索方式费时费力且不能保证精准性的问题。
[0006](二)技术方案
[0007]为实现上述
技术介绍
中提到的保证搜索信息精准性的目的,本专利技术提供如下技术方案:一种基于生成式的分类检索方法,包括以下步骤:
[0008]步骤一、对检索内容进行预处理;
[0009]步骤二、获取针对待检索数据的检索式;
[0010]步骤三、对待检索数据进行分类;
[0011]步骤四、对待检索数据进行测试处理;
[0012]步骤五、构建检索模型;
[0013]步骤六、发出检索要求;
[0014]步骤七、完成检索,并对检索内容进出储存。
[0015]优选的,所述对检索内容进行预处理:对所要检索的内容进行处理,所要检索的内容可以为文字内容,图片内容,或视频内容。
[0016]下载不同的文字、图片或视频通过扫描器输入到处理器中,一部分的文字、图片和视频用作训练文档,另一部分的文字、图片和视频作为测试文档,并对所要检索的内容进行扫描,然后再对于扫描的内容进行处理。
[0017]优选的,所述获取针对待检索数据的检索式:提取所述检索式中的多个检索字段,其中,所述检索式中包括第一个检索字段的关键词。
[0018]第一个检索字段的关键词在所述第一个检索字段对应的目标数据类中进行查找,得到第一个检索字段的第一集合,所述第一个检索字段的第一集合中包括与所述第一个检索字段的关键词对应的多个记录,依次类推,对第二个检索字段的关键词在所述第二个检索字段对应的目标数据类中进行查找,得到第二个检索字段的第二集合,所述第二个检索字段的第二集合中包括与所述第二个检索字段的关键词对应的多个记录,然后再将第二检索的目标数据作为第一检索字段完成检索,并将得到的多个检索内容进行记录,并使得检索内容对应检索结果。
[0019]优选的,所述对待检索数据进行分类:根据所要检索内容的不同,对待检索数据进行分类,得到多个目标数据类,并对每一个目标数据类进行标注登记。
[0020]提取所述检索式中的多个检索字段,检索式中包括第一个检索字段的关键词,根据多个所述检索字段对所述待检索数据进行分类,得到多个目标数据类,每一所述目标数据类中包括与自身所属的检索字段对应的多个记录,根据多个所述目标数据类、所述第一个检索字段的关键词以及所述检索式中各检索字段的顺序确定所述检索式对应的检索结果。
[0021]优选的,所述对待检索数据进行测试处理:输入待检索数据到处理中,从而判断其归属类别,测试无误后,继续下面操作。
[0022]在对于检索数据处理时,相似度匹配法是指将待分类的类别支持度矩阵和所有类别的决策模板进行对比,最相似的类别即当前样本的类别。
[0023]优选的,所述构建检索模型:建立分类表及检索词库,从各种待检索数据中识别并提取多个类型的关键词条,根据该关键词条生成多个标准分类表,根据所述关键词条中的关键词生成检索词库,然后根据各标准分类表和检索词库,构建多个检索模型。
[0024]在对于构建检索模型时,多个标准分类表包括产业标准分类表、行业标准分类表、国家标准分类表、地方标准分类表、国外标准分类表、现行标准分类表、废止标准分类表、部分废止标准分类表、未实施标准分类表、其他标准分类表、标准公告分类表;并为各标准分类表设置第二索引标引,检索词库中的各关键词设置第三索引标引,所有关键词均与其对应的标准文献数据相链接。
[0025]优选的,所述发出检索要求:以各检索模型为入口,录入检索条件,且多个检索模型相互配合形成多级条件检索。
[0026]按照上一步骤内所构建的检索模型,然后以各检索模型为入口,录入检索条件。
[0027]优选的,所述完成检索,并对检索内容进出储存:根据多个所述目标数据类、所述第一个检索字段的关键词以及所述检索式中各检索字段的顺序确定所述检索式对应的检索结果,然后打开所需搜索内容,且搜索结果可以自动储存。
[0028]与现有技术相比,本专利技术提供了一种基于生成式的分类检索方法,具备以下有益效果:
[0029]1、本专利技术,通过对所要搜索的内容进行处理,把图片,文字,以及视频等待搜索内容依次扫描,并对扫描结果进行分类,按照不同类型对待搜索内容检测,然后再对于待检索内容进行搜索,然后对于搜索内容进行对比分类,从而使得在进行检索时,更直观,更省时的找到所需的检索内容。
[0030]2、本专利技术,在进行检索时,当显示出显示内容后,在对于检索内容进行查看时,会
使得检索内容自动生产与储存,从而保证了所需内容不会丢失,不会再次搜索的问题。
[0031]3、本专利技术,在使用时通过对待搜索内容的扫描,从而保证了该搜索方式可以对不同类型内容进行搜索检索的效果。
附图说明
[0032]图1为本专利技术流程示意图。
具体实施方式
[0033]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]请参阅图1,一种基于生成式的分类检索方法,包括以下步骤:
[0035]步骤一、对检索内容进行预处理;
[0036]步骤二、获取针对待检索数据的检索式;
[0037]步骤三、对待检索数据进行分类;
[0038]步骤四、对待检索数据进行测试处理;
[0039]步骤五、构建检索模型;
[0040]步骤六、发出检索要求;
[0041]步骤七、完成检索,并对检索内容进出储存。
[0042]具体的,如图1所示,所述对检索内容进行预处理:对所要检索的内容进行处理,所要检索的内容可以为文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成式的分类检索方法,其特征在于:包括以下步骤:步骤一、对检索内容进行预处理;步骤二、获取针对待检索数据的检索式;步骤三、对待检索数据进行分类;步骤四、对待检索数据进行测试处理;步骤五、构建检索模型;步骤六、发出检索要求;步骤七、完成检索,并对检索内容进出储存。2.根据权利要求1所述的一种基于生成式的分类检索方法,其特征在于:所述对检索内容进行预处理:对所要检索的内容进行处理,所要检索的内容可以为文字内容,图片内容,或视频内容。3.根据权利要求1所述的一种基于生成式的分类检索方法,其特征在于:所述获取针对待检索数据的检索式:提取所述检索式中的多个检索字段,其中,所述检索式中包括第一个检索字段的关键词。4.根据权利要求1所述的一种基于生成式的分类检索方法,其特征在于:所述对待检索数据进行分类:根据所要检索内容的不同,对待检索数据进行分类,得到多个目标数据类,并对每一个目标数据类进行标注登记。5.根据权利要求1所述的一种基于...

【专利技术属性】
技术研发人员:王飞王学松许欢庆丁祺季仁通曾雪峰赵文孙敏
申请(专利权)人:中科基大数据科技南京有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1