一种数据搜索方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:21571444 阅读:16 留言:0更新日期:2019-07-10 15:23
本发明专利技术提供了一种数据搜索方法、装置、电子设备和计算机可读介质,涉及数据处理的技术领域,包括:获取根据预设规则生成的目标关键词表;其中,目标关键词表用于表征查询关键词和公司的公司名称之间的对应关系;在目标关键词表中确定待查询关键词,并在数据提供系统中查询包含待查询关键词的目标公司;在数据提供系统中查询待查询关键词所对应的目标公司的属性数据,得到数据搜索结果,本申请缓解了现有的数据搜索方式搜索代价成本高,效率低的技术问题。

A Data Search Method, Device, Electronic Equipment and Computer Readable Media

【技术实现步骤摘要】
一种数据搜索方法、装置、电子设备和计算机可读介质
本专利技术涉及数据处理的
,尤其是涉及一种数据搜索方法、装置、电子设备和计算机可读介质。
技术介绍
随着互联网技术的迅猛发展,数据量也日益庞大,许多公开数据都为用户使用,用户可以在公开的数据查询系统中获取待查询数据。比如,工商公示系统就是一个公开的官方数据源,其中包含大量公司的数据,用户可以在工商公示系统中获取所有待查询公司的数据。对于工商公示系统的数据,如果某个公司的数据发生了变更,比如说:名称变更、股东变更、注册资本变更、亦或者是从存续状态变更等,工商公示系统不会主动将该公司的变更数据发送给用户,只有当用户去搜索该公司时,才会发现该公司所发生的数据变化。那么,对于数据量庞大的工商公示系统,若要及时的发现哪些公司的数据发生了变化,就需要根据各个公司的名称不断的搜索工商公示系统所公示的最新数据,再与已有的数据进行对比,最终才能发现哪些公司发生了怎样的数据变动,但上述对所有公司的公司名称进行逐一搜索获取数据的方式非常耗时。综上,现有技术在进行全量数据获取时,效率低下。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种数据搜索方法、装置、电子设备和计算机可读介质,以缓解了现有的数据搜索方式搜索代价成本高,效率低的技术问题。第一方面,本专利技术实施例提供了一种数据搜索方法,包括:获取根据预设规则生成的目标关键词表;其中,所述目标关键词表用于表征查询关键词和公司名称之间的对应关系;在所述目标关键词表中确定待查询关键词,并在数据提供系统中查询包含所述待查询关键词的目标公司;在所述数据提供系统中查询所述待查询关键词所对应的目标公司的属性数据,得到数据搜索结果。进一步地,根据预设规则生成目标关键词表包括:获取多个公司名称,并对所述多个公司名称进行分词处理,得到分词结果;在所述分词结果中确定每个公司名称所对应的关键词,并根据所述关键词和公司名称之间的对应关系生成所述目标关键词表。进一步地,根据所述关键词和公司名称之间的对应关系生成所述目标关键词表包括:按照所述关键词和公司名称之间的对应关系,对所述关键词进行词频统计,统计得到每个关键词对应的公司名称的词频数量;基于所述词频数量在所述关键词中确定目标关键词,其中,所述目标关键词的词频数量大于预设阈值;对所述目标关键词进行向前和/或向后扩展,得到扩展关键词;根据所述扩展关键词和所述公司名称之间的对应关系,确定所述目标关键词表。进一步地,对所述目标关键词进行向前和/或向后扩展,得到扩展关键词包括:确定所述目标关键词所对应的目标公司名称;对所述目标公司名称进行分词处理,得到多个分词;在所述多个分词中确定目标分词,其中,所述目标分词为所述目标公司称中位于所述目标关键词之前的词汇,和/或,所述目标分词为所述目标公司名称中位于所述目标关键词之后的词汇;基于所述目标分词对所述目标关键词进行向前和/或向后扩展,得到所述扩展关键词。进一步地,所述分词结果中包括所属于多个字段类别的分词;在所述分词结果中确定每个公司名称所对应的关键词包括:确定所述分词结果中每个分词所属的字段类别;根据每个分词所属的字段类别确定每个公司名称所对应的关键词。进一步地,所述方法还包括:若所述数据搜索结果中不包含第一目标公司,则为重新生成查询关键词,其中,所述第一目标公司为所述目标关键词表中待查询关键词所对应的公司;和/或,若所述数据搜索结果中包含第二目标公司,则在所述目标关键词表中创建所述第二目标公司和所述待查询关键词之间的对应关系,其中,所述第二目标公司不是所述目标关键词表中待查询关键词所对应的公司。第二方面,本专利技术实施例提供了一种数据搜索装置,包括:第一获取单元,用于获取根据预设规则生成的目标关键词表;其中,所述目标关键词表用于表征查询关键词和公司的公司名称之间的对应关系;第一确定单元,用于在所述目标关键词表中确定待查询关键词,并在数据提供系统中查询包含所述待查询关键词的目标公司;查询单元,用于在所述数据提供系统中查询所述待查询关键词所对应的目标公司的属性数据,得到数据搜索结果。进一步地,所述装置还包括:第二获取单元,用于获取多个公司名称,并对所述多个公司名称进行分词处理,得到分词结果;第二确定单元,用于在所述分词结果中确定每个公司名称所对应的关键词;生成单元,用于根据所述关键词和公司名称之间的对应关系生成所述目标关键词表。第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项所述的方法的步骤。第四方面,本专利技术实施例还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述第一方面中任一所述方法。通过上述描述可知,本实施例提供了一种数据搜索方法,在该方法中,首先获取根据预设规则生成的目标关键词表;其中,目标关键词表用于表征查询关键词和公司名称之间的对应关系;然后,在目标关键词表中确定待查询关键词,并在数据提供系统中查询包含所述待查询关键词的目标公司;最后,在数据提供系统中查询待查询关键词所对应的目标公司的属性数据,得到数据搜索结果。通过
技术介绍
的描述可知,在现有技术中,主要通过全量搜索的方式查询企业信息,该方式搜索代价成本高,效率低,基于此,在本申请中,通过公司名称的关键词进行搜索的方式,一次搜索能够获取多个公司的属性数据,大大的提高了更新效率,缩短了全量公司数据的更新周期,且能够探索到未知的新公司便于进行收录。本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的一种电子设备的结构示意图;图2是根据本专利技术实施例的一种数据搜索方法的流程图;图3是根据本专利技术实施例的一种可选地数据搜索方法的流程;图4是根据本专利技术实施例的一种数据搜索装置的示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一:首先,参照图1来描述用于实现本专利技术实施例的数据搜索方法和装置的示例电子设备100。如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108以及数据采集器110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制本文档来自技高网
...

【技术保护点】
1.一种数据搜索方法,其特征在于,包括:获取根据预设规则生成的目标关键词表;其中,所述目标关键词表用于表征查询关键词和公司名称之间的对应关系;在所述目标关键词表中确定待查询关键词,并在数据提供系统中查询包含所述待查询关键词的目标公司;在所述数据提供系统中查询所述待查询关键词所对应的目标公司的属性数据,得到数据搜索结果。

【技术特征摘要】
1.一种数据搜索方法,其特征在于,包括:获取根据预设规则生成的目标关键词表;其中,所述目标关键词表用于表征查询关键词和公司名称之间的对应关系;在所述目标关键词表中确定待查询关键词,并在数据提供系统中查询包含所述待查询关键词的目标公司;在所述数据提供系统中查询所述待查询关键词所对应的目标公司的属性数据,得到数据搜索结果。2.根据权利要求1所述的方法,其特征在于,根据预设规则生成目标关键词表包括:获取多个公司名称,并对所述多个公司名称进行分词处理,得到分词结果;在所述分词结果中确定每个公司名称所对应的关键词,并根据所述关键词和公司名称之间的对应关系生成所述目标关键词表。3.根据权利要求2所述的方法,其特征在于,根据所述关键词和公司名称之间的对应关系生成所述目标关键词表包括:按照所述关键词和公司名称之间的对应关系,对所述关键词进行词频统计,统计得到每个关键词对应的公司名称的词频数量;基于所述词频数量在所述关键词中确定目标关键词,其中,所述目标关键词的词频数量大于预设阈值;对所述目标关键词进行向前和/或向后扩展,得到扩展关键词;根据所述扩展关键词和所述公司名称之间的对应关系,确定所述目标关键词表。4.根据权利要求3所述的方法,其特征在于,对所述目标关键词进行向前和/或向后扩展,得到扩展关键词包括:确定所述目标关键词所对应的目标公司名称;对所述目标公司名称进行分词处理,得到多个分词;在所述多个分词中确定目标分词,其中,所述目标分词为所述目标公司称中位于所述目标关键词之前的词汇,和/或,所述目标分词为所述目标公司名称中位于所述目标关键词之后的词汇;基于所述目标分词对所述目标关键词进行向前和/或向后扩展,得到所述扩展关键词。5.根据权利要求2至4中任一项所述的方法,其特征在于,所述分词结果中包括所属于多个字段类别的...

【专利技术属性】
技术研发人员:陈超柳超
申请(专利权)人:北京金堤科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1