【技术实现步骤摘要】
信息识别装置、方法、计算机设备及存储介质
本申请涉及计算机
,具体而言,涉及一种信息识别装置、方法、计算机设备及存储介质。
技术介绍
目前,各种场景都需要对目标对象的属性标签进行识别,比如网上商店可以根据用户输入的文本特征信息对该用户的属性标签进行识别,这样通过确定用户的类型,可以更好的为用户进行服务,再比如在安全监控领域,可以对用户的人脸图像进行识别,从而确定用户身份标签。在进行目标对象识别时,一般是先将目标对象关联的信息,比如文本或者图像和预先建立的信息库中的所有信息进行比对,从而确定其和文本库中的信息的相似度,进而确定目标对象的属性标签,当预先建立的信息库中信息量较大时,比对过程较为繁琐,存在信息识别效率低的问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种信息识别装置、方法、计算机设备及存储介质,以提高对目标对象的属性标签识别效率。第一方面,本申请实施例提供了一种信息识别装置,包括:接收模块,用于在接收到待识别信息后,确定所述待识别信息中包含的第一特征信息集,所述第一特征信息集包含至少一个第一特征信息,并将所述第一特征信息集传输至提取模块和第一确定模块;所述提取模块,用于在预存信息库中,提取至少一条与所述第一特征信息匹配的候选信息,组成候选信息集,其中,每条所述候选信息包括至少一个第二特征信息组成的第二特征信息集,并将所述候选信息集传输至所述第一确定模块;第一确定模块,用于根据所述第一特征信息集的第一特征信息个数、所述第二特征信息集的第二 ...
【技术保护点】
1.一种信息识别装置,其特征在于,包括:/n接收模块,用于在接收到待识别信息后,确定所述待识别信息中包含的第一特征信息集,所述第一特征信息集包含至少一个第一特征信息,并将所述第一特征信息集传输至提取模块和第一确定模块;/n所述提取模块,用于在预存信息库中,提取至少一条与所述第一特征信息匹配的候选信息,组成候选信息集,其中,每条所述候选信息包括至少一个第二特征信息组成的第二特征信息集,并将所述候选信息集传输至所述第一确定模块;/n第一确定模块,用于根据所述第一特征信息集的第一特征信息个数、所述第二特征信息集的第二特征信息个数、在所述第一特征信息集和第二特征信息集中,特征信息个数少的特征信息集中的每个特征信息分别在所述第一特征信息集和所述第二特征信息集中的位置信息,确定所述待识别信息与所述候选信息集中每个候选信息的相似度,并将所述相似度传输至第二确定模块;/n第二确定模块,用于根据确定的相似度和所述候选信息在所述预存信息库中的属性标签,确定所述待识别信息对应的属性标签。/n
【技术特征摘要】
1.一种信息识别装置,其特征在于,包括:
接收模块,用于在接收到待识别信息后,确定所述待识别信息中包含的第一特征信息集,所述第一特征信息集包含至少一个第一特征信息,并将所述第一特征信息集传输至提取模块和第一确定模块;
所述提取模块,用于在预存信息库中,提取至少一条与所述第一特征信息匹配的候选信息,组成候选信息集,其中,每条所述候选信息包括至少一个第二特征信息组成的第二特征信息集,并将所述候选信息集传输至所述第一确定模块;
第一确定模块,用于根据所述第一特征信息集的第一特征信息个数、所述第二特征信息集的第二特征信息个数、在所述第一特征信息集和第二特征信息集中,特征信息个数少的特征信息集中的每个特征信息分别在所述第一特征信息集和所述第二特征信息集中的位置信息,确定所述待识别信息与所述候选信息集中每个候选信息的相似度,并将所述相似度传输至第二确定模块;
第二确定模块,用于根据确定的相似度和所述候选信息在所述预存信息库中的属性标签,确定所述待识别信息对应的属性标签。
2.根据权利要求1所述的信息识别装置,其特征在于,所述待识别信息包括待识别文本,所述第一特征信息包括特征词,所述接收模块,具体用于:
接收到目标对象输入的待识别文本后,对所述待识别文本进行分词处理得到多个词单元;
基于预设常用词对多个所述词单元进行过滤,得到所述特征词,按照所述待识别文本中各个特征词出现的位置关系,将各个特征词进行排列后构成所述待识别文本的第一特征信息集。
3.根据权利要求1所述的信息识别装置,其特征在于,所述待识别信息包括待识别图像,所述第一特征信息包括灰度值;所述接收模块,具体用于:
接收到所述待识别图像后,若所述待识别图像为彩色图像,将所述彩色图像转换为灰度图像;
按照设定行和列对所述灰度图像进行分割,得到多个灰度子图像,并确定每个灰度子图像的灰度值;
按照每个灰度子图像在所述灰度图像中的位置信息,对各个灰度子图像的灰度值进行排列后,构成所述第一特征信息集。
4.根据权利要求1所述的信息识别装置,其特征在于,所述提取模块,具体用于:
从所述第一特征信息集中的任一第一特征信息开始遍历,在所述预存信息库中查找是否存在包含与当前遍历到的该第一特征信息匹配的特征信息;
若存在,提取存在的所述特征信息所在的候选信息,依据提取的各候选信息组成所述候选信息集;
若遍历结束后,在所述预存信息库中未查找到与所述第一特征信息匹配的特征信息,输出用于指示未查找到候选信息的提示信息。
5.根据权利要求1所述的信息识别装置,其特征在于,所述第一确定模块,具体用于:
针对每个候选信息,基于所述第一特征信息个数和所述候选信息的第二特征信息个数,选择所述待识别信息和所述候选信息中对应的特征信息个数少的作为第一比较信息,选择所述待识别信息和所述候选信息中对应的特征信息个数多的作为第二比较信息;
从所述第一比较信息对应的第三特征信息集中任一第三特征信息开始依次遍历,若从所述第二比较...
【专利技术属性】
技术研发人员:兰红云,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。