信息识别装置、方法、计算机设备及存储介质制造方法及图纸

技术编号:26172800 阅读:20 留言:0更新日期:2020-10-31 13:52
本申请提供了一种信息识别装置、方法、计算机设备及存储介质,该信息识别装置包括:接收模块,用于在接收到待识别信息后,确定待识别信息中包含的第一特征信息集;提取模块,用于在预存信息库中,提取至少一条与第一特征信息匹配的候选信息,组成候选信息集;第一确定模块,用于根据第一特征信息集的特征信息个数、第二特征信息集的特征信息个数、特征信息个数少的特征信息集中的每个特征信息分别在第一特征信息集和第二特征信息集中的位置,确定待识别信息与候选信息集中每个候选信息的相似度;第二确定模块根据确定的相似度和候选信息在预存信息库中的属性标签,确定待识别信息对应的属性标签,本申请提高了对目标对象的属性标签的识别效率。

Information identification device, method, computer equipment and storage medium

【技术实现步骤摘要】
信息识别装置、方法、计算机设备及存储介质
本申请涉及计算机
,具体而言,涉及一种信息识别装置、方法、计算机设备及存储介质。
技术介绍
目前,各种场景都需要对目标对象的属性标签进行识别,比如网上商店可以根据用户输入的文本特征信息对该用户的属性标签进行识别,这样通过确定用户的类型,可以更好的为用户进行服务,再比如在安全监控领域,可以对用户的人脸图像进行识别,从而确定用户身份标签。在进行目标对象识别时,一般是先将目标对象关联的信息,比如文本或者图像和预先建立的信息库中的所有信息进行比对,从而确定其和文本库中的信息的相似度,进而确定目标对象的属性标签,当预先建立的信息库中信息量较大时,比对过程较为繁琐,存在信息识别效率低的问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种信息识别装置、方法、计算机设备及存储介质,以提高对目标对象的属性标签识别效率。第一方面,本申请实施例提供了一种信息识别装置,包括:接收模块,用于在接收到待识别信息后,确定所述待识别信息中包含的第一特征信息集,所述第一特征信息集包含至少一个第一特征信息,并将所述第一特征信息集传输至提取模块和第一确定模块;所述提取模块,用于在预存信息库中,提取至少一条与所述第一特征信息匹配的候选信息,组成候选信息集,其中,每条所述候选信息包括至少一个第二特征信息组成的第二特征信息集,并将所述候选信息集传输至所述第一确定模块;第一确定模块,用于根据所述第一特征信息集的第一特征信息个数、所述第二特征信息集的第二特征信息个数、在所述第一特征信息集和第二特征信息集中,特征信息个数少的特征信息集中的每个特征信息分别在所述第一特征信息集和所述第二特征信息集中的位置信息,确定所述待识别信息与所述候选信息集中每个候选信息的相似度,并将所述相似度传输至第二确定模块;第二确定模块,用于根据确定的相似度和所述候选信息在所述预存信息库中的属性标签,确定所述待识别信息对应的属性标签。在一些实施方式中,所述待识别信息包括待识别文本,所述第一特征信息包括特征词,所述接收模块,具体用于:接收到目标对象输入的待识别文本后,对所述待识别文本进行分词处理得到多个词单元;基于预设常用词对多个所述词单元进行过滤,得到所述特征词,按照所述待识别文本中各个特征词出现的位置关系,将各个特征词进行排列后构成所述待识别文本的第一特征信息集。在一些实施方式中,所述待识别信息包括待识别图像,所述第一特征信息包括灰度值;所述接收模块,具体用于:接收到所述待识别图像后,若所述待识别图像为彩色图像,将所述彩色图像转换为灰度图像;按照设定行和列对所述灰度图像进行分割,得到多个灰度子图像,并确定每个灰度子图像的灰度值;按照每个灰度子图像在所述灰度图像中的位置信息,对各个灰度子图像的灰度值进行排列后,构成所述第一特征信息集。在一些实施方式中,所述提取模块,具体用于:从所述第一特征信息集中的任一第一特征信息开始遍历,在所述预存信息库中查找是否存在包含与当前遍历到的该第一特征信息匹配的特征信息;若存在,提取存在的所述特征信息所在的候选信息,依据提取的各候选信息组成所述候选信息集;若遍历结束后,在所述预存信息库中未查找到与所述第一特征信息匹配的特征信息,输出用于指示未查找到候选信息的提示信息。在一些实施方式中,所述第一确定模块,具体用于:针对每个候选信息,基于所述第一特征信息个数和所述候选信息的第二特征信息个数,选择所述待识别信息和所述候选信息中对应的特征信息个数少的作为第一比较信息,选择所述待识别信息和所述候选信息中对应的特征信息个数多的作为第二比较信息;从所述第一比较信息对应的第三特征信息集中任一第三特征信息开始依次遍历,若从所述第二比较信息对应的第四特征信息集中,存在与连续遍历的第三特征信息组成的特征信息串匹配的特征信息,确定由至少一个所述所述特征信息串组成的特征信息串集;针对每一特征信息串,根据该特征信息串的首个第三特征信息在所述第三特征信息集中的位置、与所述首个第三特征信息相匹配的特征信息在所述第四特征信息集中的位置、最后一个第三特征信息在所述第三特征信息集中的位置、所述第三特征信息集的第三特征信息个数以及所述第四特征信息集的第四特征信息个数,确定该特征信息串与第四特征信息集的相似度;在所述特征信息串集中每一特征信息串与第四特征信息集的相似度中,选择最大相似度作为所述待识别信息与所述候选信息的相似度。在一些实施方式中,所述第一确定模块,具体用于:从所述第一比较信息对应的第三特征信息集中的任一第三特征信息开始依次遍历;判断在所述第四特征信息集中是否连续存在与遍历到的第三特征信息匹配的特征信息;若是,在所述第三特征信息集中,提取连续的第三特征信息作为所述特征信息串,该连续的第三特征信息所匹配的特征信息包含在所述第四特征信息集中。在一些实施方式中,所述第二确定模块,具体用于:在所述候选信息集中,判断是否存在与所述待识别信息的相似度大于预设阈值的第一候选信息;若存在,基于各第一候选信息与所述待识别信息的相似度的大小顺序对所述第一候选信息进行排序;按照预设属性标签配置策略、排序后的第一候选信息以及各第一候选信息的属性标签,确定所述待识别信息对应的属性标签;若不存在,输出用于指示未查找到所述第一候选信息的提示信息。第二方面,本申请实施例提供了一种信息识别方法,包括:在接收到待识别信息后,确定所述待识别信息中包含的第一特征信息集,所述第一特征信息集中包含至少一个第一特征信息;在预存信息库中,提取至少一条与所述第一特征信息匹配的候选信息,组成候选信息集;其中,每条所述候选信息包括至少一个第二特征信息组成的第二特征信息集;根据所述第一特征信息集的第一特征信息个数、所述第二特征信息集的第二特征信息个数、在所述第一特征信息集和第二特征信息集中,特征信息个数少的特征信息集中的每个特征信息分别在所述第一特征信息集和所述第二特征信息集中的位置信息,确定所述待识别信息与所述候选信息集中每个候选信息的相似度;根据确定的相似度和所述候选信息在所述预存信息库中的属性标签,确定所述待识别信息对应的属性标签。第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第二方面所述信息识别方法的步骤。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第二方面所述信息识别方法的步骤。本申请实施例中,首先根据第一特征信息先在预存信息库中挑选出候选信息集,然后待识别信息仅仅与候选信息集中的候选信息比较相似度即可,大大缩短了比较时间,其次,本申请实施例本文档来自技高网...

【技术保护点】
1.一种信息识别装置,其特征在于,包括:/n接收模块,用于在接收到待识别信息后,确定所述待识别信息中包含的第一特征信息集,所述第一特征信息集包含至少一个第一特征信息,并将所述第一特征信息集传输至提取模块和第一确定模块;/n所述提取模块,用于在预存信息库中,提取至少一条与所述第一特征信息匹配的候选信息,组成候选信息集,其中,每条所述候选信息包括至少一个第二特征信息组成的第二特征信息集,并将所述候选信息集传输至所述第一确定模块;/n第一确定模块,用于根据所述第一特征信息集的第一特征信息个数、所述第二特征信息集的第二特征信息个数、在所述第一特征信息集和第二特征信息集中,特征信息个数少的特征信息集中的每个特征信息分别在所述第一特征信息集和所述第二特征信息集中的位置信息,确定所述待识别信息与所述候选信息集中每个候选信息的相似度,并将所述相似度传输至第二确定模块;/n第二确定模块,用于根据确定的相似度和所述候选信息在所述预存信息库中的属性标签,确定所述待识别信息对应的属性标签。/n

【技术特征摘要】
1.一种信息识别装置,其特征在于,包括:
接收模块,用于在接收到待识别信息后,确定所述待识别信息中包含的第一特征信息集,所述第一特征信息集包含至少一个第一特征信息,并将所述第一特征信息集传输至提取模块和第一确定模块;
所述提取模块,用于在预存信息库中,提取至少一条与所述第一特征信息匹配的候选信息,组成候选信息集,其中,每条所述候选信息包括至少一个第二特征信息组成的第二特征信息集,并将所述候选信息集传输至所述第一确定模块;
第一确定模块,用于根据所述第一特征信息集的第一特征信息个数、所述第二特征信息集的第二特征信息个数、在所述第一特征信息集和第二特征信息集中,特征信息个数少的特征信息集中的每个特征信息分别在所述第一特征信息集和所述第二特征信息集中的位置信息,确定所述待识别信息与所述候选信息集中每个候选信息的相似度,并将所述相似度传输至第二确定模块;
第二确定模块,用于根据确定的相似度和所述候选信息在所述预存信息库中的属性标签,确定所述待识别信息对应的属性标签。


2.根据权利要求1所述的信息识别装置,其特征在于,所述待识别信息包括待识别文本,所述第一特征信息包括特征词,所述接收模块,具体用于:
接收到目标对象输入的待识别文本后,对所述待识别文本进行分词处理得到多个词单元;
基于预设常用词对多个所述词单元进行过滤,得到所述特征词,按照所述待识别文本中各个特征词出现的位置关系,将各个特征词进行排列后构成所述待识别文本的第一特征信息集。


3.根据权利要求1所述的信息识别装置,其特征在于,所述待识别信息包括待识别图像,所述第一特征信息包括灰度值;所述接收模块,具体用于:
接收到所述待识别图像后,若所述待识别图像为彩色图像,将所述彩色图像转换为灰度图像;
按照设定行和列对所述灰度图像进行分割,得到多个灰度子图像,并确定每个灰度子图像的灰度值;
按照每个灰度子图像在所述灰度图像中的位置信息,对各个灰度子图像的灰度值进行排列后,构成所述第一特征信息集。


4.根据权利要求1所述的信息识别装置,其特征在于,所述提取模块,具体用于:
从所述第一特征信息集中的任一第一特征信息开始遍历,在所述预存信息库中查找是否存在包含与当前遍历到的该第一特征信息匹配的特征信息;
若存在,提取存在的所述特征信息所在的候选信息,依据提取的各候选信息组成所述候选信息集;
若遍历结束后,在所述预存信息库中未查找到与所述第一特征信息匹配的特征信息,输出用于指示未查找到候选信息的提示信息。


5.根据权利要求1所述的信息识别装置,其特征在于,所述第一确定模块,具体用于:
针对每个候选信息,基于所述第一特征信息个数和所述候选信息的第二特征信息个数,选择所述待识别信息和所述候选信息中对应的特征信息个数少的作为第一比较信息,选择所述待识别信息和所述候选信息中对应的特征信息个数多的作为第二比较信息;
从所述第一比较信息对应的第三特征信息集中任一第三特征信息开始依次遍历,若从所述第二比较...

【专利技术属性】
技术研发人员:兰红云
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1