一种搜索关键字数字化解析方法和引擎技术

技术编号:15792092 阅读:89 留言:0更新日期:2017-07-09 23:18
本发明专利技术涉及一种搜索关键字数字化解析方法和引擎,包括预置库和产品数据库,所述解析方法包括以下步骤:1.判断预置库中是否包含用户输入的搜索关键字;2.将搜索关键字解析成数字序列并构成一个增益范围;3.将所述增益范围进行解析校验;4.在产品数据库中查找符合条件的产品数据;5.将所述产品数据作为搜索结果输出。本发明专利技术将对搜索关键字的解析转化为对数字序列及其逻辑关系的处理,提高了计算机系统的处理速度,加快了数据解析的速度;在进行数据库维护和更新时,只需要将新添加的关键字解析成数字序列,不需要对产品标签进行编辑,降低了系统维护的难度。

【技术实现步骤摘要】
一种搜索关键字数字化解析方法和引擎
本专利技术涉及搜索引擎
,尤其涉及一种搜索关键字数字化解析方法。
技术介绍
现有的产品搜索,都是依靠产品(tag)标签,或者产品页面的爬虫来实现的。都是抓取该产品已有的txt文本字段。结果就是该产品的标签越来越臃肿、人工维护成本高、搜索引擎抓取越来越慢。对于现有的搜索结果,即使产品页面有类似的txt关键词,但也可能跟用户的实际需求完全无关,比如用户搜索“九寨沟”,但结果中会把含有“这里比九寨沟好玩多了”的txt字段抓取为结果。除了“九寨沟”、“张家界”这样的专有名词以外,对于计算机而言,最好的搜索是按0~1的数字维度去解析用户的需求,这样才是又快又合理。而现在的产品搜索,包括大数据分析,都还是在依赖标签原理,导致运算缓慢、搜索结果偏差大或者根本没有结果,由于每次都要为产品添加新的标签字段,人工维护的成本非常高。
技术实现思路
本专利技术所要解决的技术问题是提供一种数据处理快速且搜索结构偏差小的搜索关键字数字化解析方法。为解决上述技术问题,本专利技术的技术方案是:一种搜索关键字数字化解析方法,包括一个存储有若干个关键字及其所对应的数字序列和增益范围的预置库,以及一个与所述预置库中的数字序列和增益范围相对应的产品数据库,所述解析方法包括以下步骤:1.判断预置库中是否包含用户输入的搜索关键字;2.将搜索关键字解析成数字序列并根据所述数字序列构成一个增益范围;3.将所述增益范围进行解析校验,得出最终的解析结果;4.根据解析结果在产品数据库中查找符合条件的产品数据;5.将所述产品数据作为搜索结果输出。作为优选的技术方案,步骤1包括以下步骤:在预置库中查找与所述搜索关键字相同的关键字,若在预置库查找到相同的关键字,执行步骤2;若预置库不存在与搜索关键字相同的关键字,则将所述搜索关键字存储在所述预置库中,并在所述预置库中设置与所述搜索关键字对应的数字序列。作为优选的技术方案,所述解析方法还包括搜集用户的历史数据,确认用户的个体属性和群体属性的步骤。作为优选的技术方案,步骤2包括以下步骤:2a.根据预置库的设置将所述搜索关键字解析成数字序列,2b.提取搜索关键字中的限定词,对步骤2a中的数据序列进行漏斗式筛选;2c.将步骤2b中的数字序列根据群体属性进行增益干涉构成一个体现所述群体属性的增益范围;2d.将步骤2c中的增益范围根据个体属性进行增益干涉构成一个体现个体属性的增益范围。作为优选的技术方案,还包括对预置库和产品数据库进行数据更新更新的步骤。作为优选的技术方案,预置库数据更新方法包括将步骤2c中构成的群体属性的数字增益范围以及步骤2d中构成的个体属性的增益范围存储在所述预置库中的步骤。作为优选的技术方案,步骤3中对增益范围进行解析校验的方法是:根据历史用户的执行情况,按照权重调整增益范围,重新构成体现群体属性的增益范围和体现个体属性的增益范围。一种搜索关键字数字化解析方法的引擎,其特征在于,包括:输入模块,用于接收搜索关键字或用户指令;预置库,用于储存关键字和与其所对应的数字序列;产品数据库,用于储存于所述预置库中的数字序列相对应的产品数据;解析模块,用于在预置库中查找搜索关键字,将所述搜索关键字解析成数字序列,并修正以及校验所述数字序列的增益范围,得出解析结果并在产品数据库中查找与解析结果符合的产品数据;输出模块,将查找到的产品数据作为搜索结果输出。由于采用了上述技术方案,本专利技术设置了预置库和产品数据库,将搜索关键字解析成数字序列,通过解析出的数字序列和增益范围,在产品数据库中查找并导出相对应的产品数据,与传统的现有技术中通过产品标签搜索的方式相比较,本专利技术中通过将关键字解析成数字序列,导出产品标签,由于数字序列和增益范围与产品数据存在对应关系,搜索结果的偏差较小,且由于关键字解析成数字序列,将对搜索关键字的解析转化为对数字序列及其逻辑关系的处理,提高了计算机系统的处理速度,加快了数据解析的速度;由于采用将搜索关键字解析成数字序列,在进行数据库维护和更新时,只需要将新添加的关键字解析成数字序列,不需要对产品标签进行编辑,降低了系统维护的难度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例的工作流程图。具体实施方式一种搜索关键字数字化解析方法,包括一个存储有若干个关键字及其所对应的数字序列和增益范围的预置库,以及一个与预置库中的数字序列和增益范围相对应的产品数据库。如图1所示,本方法包括以下步骤:1.接收搜索关键字,查找搜索关键字,判断预置库中是否包含用户输入的搜索关键字,步骤1包括以下步骤:在预置库中查找与搜索关键字相同的关键字,若在预置库查找到相同的关键字,执行步骤2;若预置库不存在与搜索关键字相同的关键字,则将搜索关键字存储在所述预置库中,并在预置库中设置与该搜索关键字对应的数字序列。2.将搜索关键字解析成数字序列并根据数字序列构成一个增益范围。本方法还包括搜集用户的历史数据,确认用户的个体属性和群体属性的步骤。步骤2可分解为以下几个步骤:2a.根据预置库的设置将搜索关键字解析成数字序列,2b.提取搜索关键字中的限定词,对步骤2a中的数据序列进行漏斗式筛选;2c.将步骤2b中的数字序列根据群体属性进行增益干涉构成一个体现群体属性的增益范围;2d.将步骤2c中的增益范围根据个体属性进行增益干涉构成一个体现个体属性的增益范围。3.将增益范围进行解析校验,得出最终的解析结果,对增益范围进行解析校验的方法是:根据历史用户的执行情况,按照权重调整增益范围,重新构成体现群体属性的增益范围和体现个体属性的增益范围,用户接收到解析结果所对应的产品数据,对该结果的执行与不执行的情况,所占的权重不同,根据权重调整增益范围,降低解析结果的偏差。4.根据解析结果在产品数据库中查找符合条件的产品数据;5.将产品数据作为搜索结果输出。步骤2中,将搜索关键字解析成数字序列并根据数字序列构成一个增益范围,是利用“数值位数+数值序列”的办法。比如将关键词“开心”,解析为对应的旅游需求为3个数值序列,主要是景点的数值偏移、餐饮的数值偏移、住宿的数值偏移,设定每个数值序列4位数,即“4566+(满足开心需求的景点数值偏移)、5742-(满足开心需求的餐饮数值偏移)、2981+(满足开心需求的住宿数值偏移)、”。比如将关键词“摩羯座”在预置中,解析为“3221-、4677-、9821+”,即代表优先抓取景点数值中比3221小的、餐饮数值中比4677小的、住宿数值比9821大的产品数据。例如,用户输入的搜索关键字是“开心”,经过本专利技术实施例记性数字化解析的步骤如下:经步骤1中判断,“开心”在预置库中,步骤2a中,解析的数字序列是:167.554.367.487,筛选的结果是:167.554+.367-.487,步骤2c中的修正的增益范围是:167-.554+.367-.487-,步骤2d中的修正的增益范围是190-.570+.345-.407-,步骤3解析校验的增益范围是1本文档来自技高网...
一种搜索关键字数字化解析方法和引擎

【技术保护点】
一种搜索关键字数字化解析方法,其特征在于:包括一个存储有若干个关键字及其所对应的数字序列和增益范围的预置库,以及一个与所述预置库中的数字序列和增益范围相对应的产品数据库,所述解析方法包括以下步骤:1.判断预置库中是否包含用户输入的搜索关键字;2.将搜索关键字解析成数字序列并根据所述数字序列构成一个增益范围;3.将所述增益范围进行解析校验,得出最终的解析结果;4.根据解析结果在产品数据库中查找符合条件的产品数据;5.将所述产品数据作为搜索结果输出。

【技术特征摘要】
1.一种搜索关键字数字化解析方法,其特征在于:包括一个存储有若干个关键字及其所对应的数字序列和增益范围的预置库,以及一个与所述预置库中的数字序列和增益范围相对应的产品数据库,所述解析方法包括以下步骤:1.判断预置库中是否包含用户输入的搜索关键字;2.将搜索关键字解析成数字序列并根据所述数字序列构成一个增益范围;3.将所述增益范围进行解析校验,得出最终的解析结果;4.根据解析结果在产品数据库中查找符合条件的产品数据;5.将所述产品数据作为搜索结果输出。2.如权利要求1所述的一种搜索关键字数字化解析方法,其特征在于:步骤1包括以下步骤:在预置库中查找与所述搜索关键字相同的关键字,若在预置库查找到相同的关键字,执行步骤2;若预置库不存在与搜索关键字相同的关键字,则将所述搜索关键字存储在所述预置库中,并在所述预置库中设置与所述搜索关键字对应的数字序列。3.如权利要求1所述的一种搜索关键字数字化解析方法,其特征在于:所述解析方法还包括搜集用户的历史数据,确认用户的个体属性和群体属性的步骤。4.如权利要求3所述的一种搜索关键字数字化解析方法,其特征在于:步骤2包括以下步骤:2a.根据预置库的设置将所述搜索关键字解析成数字序列,2b.提取搜索关键字中的限定词,对步骤2a中的数据序列进行漏斗式筛选;2c.将步骤2b...

【专利技术属性】
技术研发人员:程远东
申请(专利权)人:冠生园集团有限公司程远东
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1