一种检索方法及装置制造方法及图纸

技术编号:22166984 阅读:30 留言:0更新日期:2019-09-21 10:36
本发明专利技术提供的检索方法及装置,确定待处理对象的匹配词,并计算预设的候选对象的距离参数,最后将距离参数满足预设条件的候选对象,作为待处理对象的检索结果。其中,任意一个候选对象的距离参数依据匹配词对应的目标距离确定,目标距离为匹配词预设的对应词中的目标词与该匹配词的距离,目标词为包括在候选对象中的词。可见,本申请提供的检索方法,不再需要将待处理对象中的匹配词与候选对象中的词一一计算距离,而仅需依据目标距离确定距离参数即可。并且对应词与匹配词的距离(也即目标词与匹配词的距离)预先计算得到,检索过程中只需获取对应词中的目标词,以及该目标词与匹配词的距离即可计算候选对象的距离参数,从而提高了检索的速度。

A Retrieval Method and Device

【技术实现步骤摘要】
一种检索方法及装置
本专利技术涉及信息识别
,特别涉及一种检索方法及设备。
技术介绍
随着家长对早期教育的重视,早教类电子产品越来越普及,常见的一种早教类电子产品为绘本讲解机,其功能为扫描用户当前阅读的绘本页,并采用图像检索技术在样本图像库中检索与绘本页相匹配的样本图像,当检索到与绘本页相匹配的样本图像时,播放该样本图像的讲解音频或视频,从而实现对用绘本页进行讲解的目的。根据上述绘本讲解机的工作过程,可见,图像检索技术是绘本讲解机的功能实现流程中的关键技术点。而现有的图像检索技术,因为图像信息量大的特点,往往运算量大,所以时延较长。而对于交互类电子设备,处理时长是影响产品体验的重要指标,所以,如何减小图像检索的时延,成为目前亟待解决的问题。
技术实现思路
申请人在研究的过程中发现,现有的图像检索技术,在检索的过程中,需要计算待处理图像中的每个词与每张样本图像的每个词之间的距离。而实际上,每张图像包含的词的数量很大,同时,为保证检索结果的准确性,一般样本图像数量也很大。所以检索的过程中,计算待处理图像的每个词与每张样本图像的每个词之间距离是一个计算量很大的过程,导致了检索速度慢,从而时延较长。有鉴于此,本专利技术实施例提供了一种检索方法及装置,目的在于解决如何提高检索速度,以减少检索时长的问题。为实现上述目的,本专利技术实施例提供如下技术方案:一种检索方法,包括:确定待处理对象的匹配词;计算预设的候选对象的距离参数,任意一个候选对象的距离参数依据所述匹配词对应的目标距离确定,其中,任意一个匹配词对应的目标距离为:该匹配词预设的对应词中的目标词与该匹配词的距离,所述目标词为包括在该候选对象中的词;所述对应词与所述匹配词的距离预先计算得到;将所述距离参数满足预设条件的候选对象,作为所述待处理对象的检索结果。上述的方法,可选的,所述确定待处理对象的匹配词,包括:提取所述待处理对象的特征;获取预先构建的词典树,所述词典树中包括多层节点,任意一层节点中的任意一个节点为下一层节点的一个类别;在任意一个目标节点的下一层节点中查找与所述特征的距离满足预设条件的节点,直至将最后一层节点中与所述特征距离最近的节点,作为所述待处理对象的匹配词,其中,任意一个目标节点为在同一层节点中与所述特征距离最近的节点。上述的方法,可选的,构建所述词典树的过程包括:对样本对象的特征进行聚类,得到含有多个词的词典,任意一个词为聚类得到一个类别;将所述词典的词作为所述词典树的最后一层的节点;对于所述词典树其余任意一层,根据对该层的下一层的节点进行聚类,确定该层中的节点,该层中的任意一个节点为聚类得到的一个类别,所述其余任意一层为所述词典树中除了最后一层的任意一层。上述的方法,可选的,确定所述匹配词的对应词的过程,包括:依据所述匹配词的标识,在预先创建的副词典中查找出所述匹配词的对应词;所述副词典为记录词典中每个词以及每个词的对应词的词典,其中,任意一个词的对应词为在所述词典中与该词距离较近的前Q个词。上述的方法,可选的,创建所述副词典的过程,包括:计算所述词典中每两个词之间的距离;获取所述词典中每个词的对应词,任意一个词的对应词为与该词距离最近的前Q个词,所述Q为正整数;对应存储每个词、所述每个词的对应词以及所述每个词与对应词之间的距离,得到所述副词典。上述的方法,可选的,确定所述候选对象的距离参数,包括:对于任意一个候选对象,依据第一距离总值和/或第二距离总值确定所述候选对象的距离参数;其中,所述第一距离总值为:各个所述匹配词对应的第一目标词的距离之和,任意一个匹配词对应的第一目标词为:所述匹配词的对应词中,包括在所述候选对象中且与所述匹配词距离最近的词;所述第二距离总值为:各个所述匹配词对应的第二目标词的距离之和,任意一个所述匹配词对应的第二目标词为:所述匹配词的对应词中,包括在所述候选对象中且与所述匹配词距离第二近的词。上述的方法,可选的,确定所述待处理对象的候选对象,包括:计算每个所述匹配词在所述待处理对象中的逆权重;依据预先创建的词索引,获取每个所述匹配词在样本对象中的逆权重,其中,所述词索引存储预先计算的预设的词典中每个词对应的样本对象以及该词在其对应的样本对象中的逆权重;依据每个所述匹配词在所述待处理对象中的逆权重以及每个所述匹配词在对应的样本对象中的逆权重,确定所述待处理对象的候选对象。上述的方法,可选的,创建所述词索引的过程,包括:确定词典中每个词对应的样本对象,任意一个词对应的样本对象为包括该词的样本对象;计算所述词典中的每个词在对应的样本对象中的逆权重;对应存储所述词典中的词、所述词对应的样本对象的编号,以及所述词在对应的样本对象的逆权重,得到所述词索引。一种检索装置,包括:确定模块,用于确定待处理对象的匹配词;计算模块,用于计算预设的候选对象的距离参数,任意一个候选对象的距离参数依据所述匹配词对应的目标距离确定,其中,任意一个匹配词对应的目标距离为:该匹配词预设的对应词中的目标词与该匹配词的距离,所述目标词为包括在该候选对象中的词;所述对应词与所述匹配词的距离预先计算得到;检索模块,用于将所述距离参数满足预设条件的候选对象,作为所述待处理对象的检索结果。一种检索设备,包括:处理器和存储器,所述存储器用于存储应用程序,所述处理器用于执行所述应用程序,以实现上述的检索方法。一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的检索方法。本专利技术实施例提供的检索方法及装置,确定待处理对象的匹配词,并计算预设的候选对象的距离参数,最后将距离参数满足预设条件的候选对象,作为待处理对象的检索结果。其中,任意一个候选对象的距离参数依据匹配词对应的目标距离确定,该目标距离为该匹配词预设的对应词中的目标词与该匹配词的距离,目标词为包括在该候选对象中的词。可见,本申请实施例所述的检索方法,不再需要将待处理对象中的匹配词与候选对象中的词一一计算距离,而仅需依据目标距离确定距离参数即可。并且对应词与匹配词的距离(也即目标词与匹配词的距离)预先计算得到,即匹配词与其对应词之间的距离在进行检索之前已经计算完成,检索过程中只需获取对应词中的目标词,以及该目标词与匹配词的距离即可计算候选对象的距离参数。综上所述,本申请提供的方法及装置,在检索的过程中,无需计算待处理对象匹配词与词典中大量的词的距离,节约了大量的计算时间,从而提高了检索的速度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的一种检索方法的流程图;图2为本申请实施例提供的词典的示意图;图3为本申请实施例提供的确定待处理图像的匹配词的流程图;图4为本申请实施例提供的确定待处理图像的候选图像的流程图;图5为本申请实施例提供的词索引的示意图;图6为本申请实施例提供的创建词索引的流程图;图7为本申请实施例提供的副词典的示意图;图8为本申请实施例提供的创建副词典的流程图;图9为本申请实施例提供的计算预设的候选对象的本文档来自技高网...

【技术保护点】
1.一种检索方法,其特征在于,包括:确定待处理对象的匹配词;计算预设的候选对象的距离参数,任意一个候选对象的距离参数依据所述匹配词对应的目标距离确定,其中,任意一个匹配词对应的目标距离为:该匹配词预设的对应词中的目标词与该匹配词的距离,所述目标词为包括在该候选对象中的词;所述对应词与所述匹配词的距离预先计算得到;将所述距离参数满足预设条件的候选对象,作为所述待处理对象的检索结果。

【技术特征摘要】
1.一种检索方法,其特征在于,包括:确定待处理对象的匹配词;计算预设的候选对象的距离参数,任意一个候选对象的距离参数依据所述匹配词对应的目标距离确定,其中,任意一个匹配词对应的目标距离为:该匹配词预设的对应词中的目标词与该匹配词的距离,所述目标词为包括在该候选对象中的词;所述对应词与所述匹配词的距离预先计算得到;将所述距离参数满足预设条件的候选对象,作为所述待处理对象的检索结果。2.根据权利要求1所述的方法,其特征在于,所述确定待处理对象的匹配词,包括:提取所述待处理对象的特征;获取预先构建的词典树,所述词典树中包括多层节点,任意一层节点中的任意一个节点为下一层节点的一个类别;在任意一个目标节点的下一层节点中查找与所述特征的距离满足预设条件的节点,直至将最后一层节点中与所述特征距离最近的节点,作为所述待处理对象的匹配词,其中,任意一个目标节点为在同一层节点中与所述特征距离最近的节点。3.根据权利要求2所述的方法,其特征在于,构建所述词典树的过程包括:对样本对象的特征进行聚类,得到含有多个词的词典,任意一个词为聚类得到一个类别;将所述词典的词作为所述词典树的最后一层的节点;对于所述词典树其余任意一层,根据对该层的下一层的节点进行聚类,确定该层中的节点,该层中的任意一个节点为聚类得到的一个类别,所述其余任意一层为所述词典树中除了最后一层的任意一层。4.根据权利要求1所述的方法,其特征在于,确定所述匹配词的对应词的过程,包括:依据所述匹配词的标识,在预先创建的副词典中查找出所述匹配词的对应词;所述副词典为记录词典中每个词以及每个词的对应词的词典,其中,任意一个词的对应词为在所述词典中与该词距离较近的前Q个词。5.根据权利要求4所述的方法,其特征在于,创建所述副词典的过程,包括:计算所述词典中每两个词之间的距离;获取所述词典中每个词的对应词,任意一个词的对应词为与该词距离最近的前Q个词,所述Q为正整数;对应存储每个词、所述每个词的对应词以及所述每个词与对应词之间的距离,得到所述副词典。6.根据权利要求1所述的方法,其特征在于,确定所述候选对象的距离参数,包括:对于任意一个候选对象,依据第一距离总值和/...

【专利技术属性】
技术研发人员:王忍宝王晓斐
申请(专利权)人:安徽淘云科技有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1