一种信息查询的方法、装置、计算机存储介质及终端制造方法及图纸

技术编号:21115730 阅读:32 留言:0更新日期:2019-05-16 08:59
一种信息查询的方法、装置、计算机存储介质及终端,包括:确定与查询词所属实体类型相同的结构化数据;根据查询词,从与查询词所属实体类型相同的结构化数据中进行信息搜索。本发明专利技术实施例根据实体类型,缩小了查询词在结构化数据中的搜索范围;进一步的,根据字符串进行检索,提升了查询效率。

【技术实现步骤摘要】
一种信息查询的方法、装置、计算机存储介质及终端
本文涉及但不限于数据处理技术,尤指一种信息查询的方法、装置、计算机存储介质及终端。
技术介绍
在企业搜索中,待处理的数据包括结构化数据和非结构化数据。一般而言,用户的结构化数据以表的形式存在,表的种类可以包括本领域技术人员公知的Excel、Mysql、Oracle、Access、Hbase等。在索引构造时,1个表对应1个索引,表的字段名对应索引中的相应的字段名。在结构化数据的搜索中,典型的搜索使用场景是:用户在输入框中输入查询词,系统将所有数据类型相同的字段都作为匹配字段,并把匹配结果返回给用户。由于数据类型相同的字段数量往往多达成百上千个,导致查询匹配的效率很低,影响了搜索速度。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本专利技术实施例提供一种信息查询的方法、装置、计算机存储介质及终端,能够提升信息查询效率。本专利技术实施例提供了一种信息查询的方法,包括:确定与查询词所属实体类型相同的结构化数据;根据查询词,从与查询词所属实体类型相同的结构化数据中进行信息搜索。可选的,所述确定与查询词所属实本文档来自技高网...

【技术保护点】
1.一种信息查询的方法,其特征在于,包括:确定与查询词所属实体类型相同的结构化数据;根据查询词,从与查询词所属实体类型相同的结构化数据中进行信息搜索。

【技术特征摘要】
1.一种信息查询的方法,其特征在于,包括:确定与查询词所属实体类型相同的结构化数据;根据查询词,从与查询词所属实体类型相同的结构化数据中进行信息搜索。2.根据权利要求1所述的方法,其特征在于,所述确定与查询词所属实体类型相同的结构化数据包括:通过预设的分析模型,确定所述结构化数据中包含的每一个表的字段名和所述查询词的所属实体类型;其中,所述实体类型包括以下一种或一种以上类型:人名、地名、机构名、日期时间、身份证号、车牌号、即时通信客户端账号、银行卡号、护照号、邮箱号、手机号。3.根据权利要求2所述的方法,其特征在于,所述分析模型包括以下一种或一种以上模型:专家规则模型、统计模型。4.根据权利要求1~3任一项所述的方法,其特征在于,所述从与查询词所属实体类型相同的结构化数据中进行信息搜索之前,所述方法还包括:提取结构化数据中,每张表的每条记录的所有字段值,并在每个字段值的首尾分别添加预设的首尾标识;将添加首尾标识后的字段值转换为预设格式的字符串;根据转换获得的字符串建立索引;其中,所述索引的关键字为各字段值对应的字符串;所述索引的索引值包括以下部分或全部内容:字段名、表名。5.根据权利要求4所述的方法,其特征在于,所述从与查询词所属实体类型相同的结构化数据中进行信息搜索包括:将所述查询词转换为所述预设格式的字符串;根据查询词转换获得的字符串,对建立的索引进行搜索,以获得与所述查询词匹配的数据信息。6.根据权利要求4所述的方法,其特征在于,所述字符串包括N元字符串;其中,N为大于等于2的整数。7.一种信息查询的装置,其特征在于,包括:确定单元和搜索单元;其中,确定单元用于...

【专利技术属性】
技术研发人员:牟小峰
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1