一种信息匹配方法及装置制造方法及图纸

技术编号:13878418 阅读:63 留言:0更新日期:2016-10-22 18:27
本发明专利技术实施例提供了一种信息匹配方法及装置,其中方法包括:获取输入的待检索信息;在预设数据库中按照预设规则查找与所述待检索信息相匹配的数据;输出所查找到的与所述待检索信息相匹配的数据;其中,所述预设数据库中的数据按照Trie树方式存储,并且,所述Trie树中除了普通节点外还包括模糊节点,所述模糊节点用于在需要进行模糊查找时越过同一级中的各兄弟普通节点而直接达到所述同一级中的各兄弟普通节点的子节点。本发明专利技术对Trie树的结构进行了改进,在Trie树的普通节点的基础上添加了模糊节点,使之变为更适合模糊匹配的数据结构,使用时可大大减少查找和比较的次数,进而提高了模糊查找的速度。

【技术实现步骤摘要】

本专利技术涉及计算机技术,尤其涉及一种信息匹配方法及装置
技术介绍
当前很多网页或APP等都提供检索功能,用户在使用时可能会输入错误的查询词,或者是输入模糊的查询词,此时就需要使用模糊匹配技术,为用户提供尽可能正确的检索结果。在现有技术中,可以通过在Trie树的结构上使用深度优先搜索算法,来实现对检索词的模糊匹配。Trie树又可称前缀树或字典树,是一种匹配查找的常用方法,可以用来排序和保存大量的字符串等信息,所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。深度优先搜索则是一种常用的枚举搜索法,其规则简单说来就是从根节点出发,对每一个可能的分支路径深入到不能再深入为止,且每个节点只能访问一次。专利技术人在实现本专利技术的过程中发现,现有的这种检索方式在使用时查找和比较的次数太多,导致运行速度很慢,效率很低,用户体验不好。
技术实现思路
为克服现有技术中存在的问题,本专利技术实施例提供一种信息匹配方法及装置,提高模糊检索时的效率。根据本专利技术实施例的第一方面,提供一种信息匹配方法,所述方法包括:获取输入的待检索信息;在预设数据库中按照预设规则查找与所述待检索信息相匹配的数据;输出所查找到的与所述待检索信息相匹配的数据;其中,所述预设数据库中的数据按照Trie树方式存储,并且,所述Trie树中除了普通节点外还包括模糊节点,所述模糊节点用于在需要进行模糊查找时越过同一级中的各兄弟普通节点而直接达到所述同一级中的各兄弟普通节点的子节点;所述预设规则包括:按照深度优先算法在所述预设数据库查找与所述待检索信息相匹配的数据,当需要选取下一个节点时,如果此时为模糊查找,则只选取下一个节点中的模糊节点。可选的:所述模糊节点分为一级模糊节点和二级模糊节点,所述Trie树的每个普通节点下带有一个一级模糊节点,每个一级模糊节点下带有一个二级模糊节点,所述一级模糊节点的父节点的子子节点中的所有普通节点均链接到当前一级模糊节点下,所述二级模糊节点的祖父节点的子子子节点中所有普通节点均链接到当前二级模糊节点下,作为叶子节点的一级模糊节点储存有同父的所有兄弟普通节点中所储存的数据,作为叶子节点的二级模糊节点储存有同祖父的所有兄弟普通节点中所储存的数据。可选的,在获取输入的待检索信息之前,所述方法还包括:获取用于生成所述预设数据库的数据;将所述用于生成所述预设数据库的数据按照Trie树方式存储;在每个Trie树的普通节点下添加一个一级模糊节点,在每个一级模糊节点下添加一个二级模糊节点,将一级模糊节点的父节点的子子节点中的所有普通节点均链接到当前一级模糊节点下,将二级模糊节点的祖父节点的子子子节点中的所有普通节点均链接到当前二级模糊节点下,并令作为叶子节点的一级模糊节点储存有同父的所有兄弟普通节点所储存的数据,作为叶子节点的二级模糊节点储存有同祖父的所有兄弟普通节点所储存的数据,以生成所述预设数据库。可选的,通过如下方式判断是否为模糊查找:如果所述待检索信息中包括模糊通配符,则当所述查找进行到所述模糊通配符的位置处时,判断为此时进行模糊查找。可选的,所述输出所查找到的与所述待检索信息相匹配的数据,包括:输出所查找到的叶子节点中所存储的数据。根据本专利技术实施例的第二方面,提供一种信息匹配装置,所述装置包括:获取单元,用于获取输入的待检索信息;匹配单元,用于在预设数据库中按照预设规则查找与所述待检索信息相匹配的数据;输出单元,用于输出所查找到的与所述待检索信息相匹配的数据;其中,所述预设数据库中的数据按照Trie树方式存储,并且,所述Trie树中除了普通节点外还包括模糊节点,所述模糊节点用于在需要进行模糊查找时越过同一级中的各兄
弟普通节点而直接达到所述同一级中的各兄弟普通节点的子节点;所述预设规则包括:按照深度优先算法在所述预设数据库查找与所述待检索信息相匹配的数据,当需要选取下一个节点时,如果此时为模糊查找,则只选取下一个节点中的模糊节点。可选的:所述模糊节点分为一级模糊节点和二级模糊节点,所述Trie树的每个普通节点下带有一个一级模糊节点,每个一级模糊节点下带有一个二级模糊节点,所述一级模糊节点的父节点的子子节点中的所有普通节点均链接到当前一级模糊节点下,所述二级模糊节点的祖父节点的子子子节点中所有普通节点均链接到当前二级模糊节点下,作为叶子节点的一级模糊节点储存有同父的所有兄弟普通节点中所储存的数据,作为叶子节点的二级模糊节点储存有同祖父的所有兄弟普通节点中所储存的数据。可选的,所述装置还包括:预设数据库生成单元,用于:获取用于生成所述预设数据库的数据;将所述用于生成所述预设数据库的数据按照Trie树方式存储;在每个Trie树的普通节点下添加一个一级模糊节点,在每个一级模糊节点下添加一个二级模糊节点,将一级模糊节点的父节点的子子节点中的所有普通节点均链接到当前一级模糊节点下,将二级模糊节点的祖父节点的子子子节点中的所有普通节点均链接到当前二级模糊节点下,并令作为叶子节点的一级模糊节点储存有同父的所有兄弟普通节点所储存的数据,作为叶子节点的二级模糊节点储存有同祖父的所有兄弟普通节点所储存的数据,以生成所述预设数据库。可选的,所述匹配单元通过如下方式判断是否为模糊查找:如果所述待检索信息中包括模糊通配符,则当所述查找进行到所述模糊通配符的位置处时,判断为此时进行模糊查找。可选的,所述输出单元用于:输出所查找到的叶子节点中所存储的数据。本专利技术的实施例提供的技术方案可以包括以下有益效果:本专利技术对Trie树的结构进行了改进,在Trie树的普通节点的基础上添加了模糊节点,使之变为更适合模糊匹配的数据结构,使用时可大大减少查找和比较的次数,进而提高了模糊查找的速度。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限
制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是现有技术中Trie树的示意图;图2是现有技术中在Trie树进行查找时的查找顺序示意图;图3是根据本专利技术一示例性实施例示出的一种信息匹配方法的流程图;图4是根据本专利技术一示例性实施例示出的带模糊节点的Trie树示意图;图5是根据本专利技术一示例性实施例示出的模糊节点链接示意图;图6是现有技术中进行模糊查找的示意图;图7是根据本专利技术一示例性实施例示出的进行模糊查找的示意图;图8是根据本专利技术一示例性实施例示出的一种信息匹配方法的流程图;图9是根据本专利技术一示例性实施例示出的一种信息匹配装置的示意图;图10是根据本专利技术一示例性实施例示出的一种信息匹配装置的示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。首先对Trie树进行一下简单介绍。假设Trie树中存储的数据是“勇者大冒险”、“勇者大冲关”、“勇者传说”、“圣域传说”、“神话传说”本文档来自技高网
...

【技术保护点】
一种信息匹配方法,其特征在于,所述方法包括:获取输入的待检索信息;在预设数据库中按照预设规则查找与所述待检索信息相匹配的数据;输出所查找到的与所述待检索信息相匹配的数据;其中,所述预设数据库中的数据按照Trie树方式存储,并且,所述Trie树中除了普通节点外还包括模糊节点,所述模糊节点用于在需要进行模糊查找时越过同一级中的各兄弟普通节点而直接达到所述同一级中的各兄弟普通节点的子节点;所述预设规则包括:按照深度优先算法在所述预设数据库查找与所述待检索信息相匹配的数据,当需要选取下一个节点时,如果此时为模糊查找,则只选取下一个节点中的模糊节点。

【技术特征摘要】
1.一种信息匹配方法,其特征在于,所述方法包括:获取输入的待检索信息;在预设数据库中按照预设规则查找与所述待检索信息相匹配的数据;输出所查找到的与所述待检索信息相匹配的数据;其中,所述预设数据库中的数据按照Trie树方式存储,并且,所述Trie树中除了普通节点外还包括模糊节点,所述模糊节点用于在需要进行模糊查找时越过同一级中的各兄弟普通节点而直接达到所述同一级中的各兄弟普通节点的子节点;所述预设规则包括:按照深度优先算法在所述预设数据库查找与所述待检索信息相匹配的数据,当需要选取下一个节点时,如果此时为模糊查找,则只选取下一个节点中的模糊节点。2.根据权利要求1所述的方法,其特征在于:所述模糊节点分为一级模糊节点和二级模糊节点,所述Trie树的每个普通节点下带有一个一级模糊节点,每个一级模糊节点下带有一个二级模糊节点,所述一级模糊节点的父节点的子子节点中的所有普通节点均链接到当前一级模糊节点下,所述二级模糊节点的祖父节点的子子子节点中所有普通节点均链接到当前二级模糊节点下,作为叶子节点的一级模糊节点储存有同父的所有兄弟普通节点中所储存的数据,作为叶子节点的二级模糊节点储存有同祖父的所有兄弟普通节点中所储存的数据。3.根据权利要求2所述的方法,其特征在于,在获取输入的待检索信息之前,所述方法还包括:获取用于生成所述预设数据库的数据;将所述用于生成所述预设数据库的数据按照Trie树方式存储;在每个Trie树的普通节点下添加一个一级模糊节点,在每个一级模糊节点下添加一个二级模糊节点,将一级模糊节点的父节点的子子节点中的所有普通节点均链接到当前一级模糊节点下,将二级模糊节点的祖父节点的子子子节点中的所有普通节点均链接到当前二级模糊节点下,并令作为叶子节点的一级模糊节点储存有同父的所有兄弟普通节点所储存的数据,作为叶子节点的二级模糊节点储存有同祖父的所有兄弟普通节点所储存的数据,以生成所述预设数据库。4.根据权利要求1所述的方法,其特征在于,通过如下方式判断是否为模糊查找:如果所述待检索信息中包括模糊通配符,则当所述查找进行到所述模糊通配符的位置
\t处时,判断为此时进行模糊查找。5.根据权利要求1所述的方法,其特征在于,所述输出所查找到的与所述待检索信息相匹配的数据,包括:输出所查找到的叶子节点中所存储的数据。6.一种...

【专利技术属性】
技术研发人员:王乙丁
申请(专利权)人:乐视网信息技术北京股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1