【技术实现步骤摘要】
基于搜索分析引擎的文档模型的搭建方法及其应用
[0001]本专利技术涉及检索和查询领域,特别涉及一种基于搜索分析引擎的文档模型的搭建方法及其应用。
技术介绍
[0002]随着社会的高速发展和通信设备的普及,数据正在迅速膨胀变大,尤其是社交网络和移动通信把人类带入了一个海量数据信息的时代,庞大的数据量导致对数据的检索和查询变的非常复杂,在数据量巨大的数据库中精确查询一条数据所需要的时间成本极高,如何对海量信息进行高效处理成为了很多企业和机构的一个难题。
[0003]数据分为结构化数据和非结构化数据,结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理,与结构化数据相对的是不适于由数据库二维表来表现的非结构化数据,包括所有格式的办公文档、XML、HTML、各类报表、图片和音频、视频信息等。
[0004]目标人群的数据以结构化数据的形式被存在,目标人群库的数据量持续增长,同时用户的查询需求增多,这对目标人群库的数据存储能力,和对外提供检索服务 ...
【技术保护点】
【技术特征摘要】
1.一种基于搜索分析引擎的文档模型的搭建方法,其特征在于:获取至少一目标人群的人口基础信息和业务信息,其中所述人口基础信息包括对应不同类型目标人群的通用属性,所述业务信息包括对应目标人群的人群类型、业务项以及归属地信息;搭建对应每一目标人群的文档模型,所述文档模型的检索字段填入对应所述目标人群的人口基础信息,所述文档模型的业务字段填入对应所述目标人群的业务信息,得到对应所述目标目人群的文档。2.根据权利要求1所述的基于搜索分析引擎的文档模型的搭建方法,其特征在于,所述业务项为对应不同类型的目标人群的特殊属性,所述特殊属性用于区分不同类型的目标人群。3.根据权利要求1所述的基于搜索分析引擎的文档模型的搭建方法,其特征在于,所述归属地信息为所述目标人群所属的区划代码及所属网格。4.根据权利要求1所述的基于搜索分析引擎的文档模型的搭建方法,其特征在于,以文档统一前缀和网格编号命名每一文档,所述网格编号为对应的文档中记录的所述归属网格信息对应的编码。5.根据权利要求1所述的基于搜索分析引擎的文档模型的搭建方法,其特征在于,每一所述文档包含文档目录元数据和文档识别元数据,所述文档的文档识别元数据和目标人群唯一标识对应,所述文档识别元数据和所述文档目录元数据定位一个特定的文档。6.根据权利要求1所述的基于搜索分析引擎的文档模型的搭建方法,其特征在于,所述文档模型内的非时间字段采用关键词,所述时间字段采用时间戳。7.一种基于搜索分析引擎的文档模型,其特征在于,采用以上权利要求1到6任一所述的基于搜索分析引擎的文档模型的搭建方法搭建得到。8.一种目标人群查询方法,其特征在于,包括以下步骤:搭建对应每一目标人群的文档模型,所述文档模型的检索字段填入所述目标人群的人口基础信息,所述文档模型的业务字段填入所述目标人群的业务信息,其中所述人口基础信息包括对应不同类型目标人群的通用属性,所述业务信息包括对应目标人群的人群类型、业务项...
【专利技术属性】
技术研发人员:黄练纲,张翔宇,张帅,
申请(专利权)人:城云科技中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。