【技术实现步骤摘要】
一种获取图像信息的方法及相关装置
本专利技术涉及数据处理领域,具体涉及一种获取图像信息的方法及相关装置。
技术介绍
当今信息时代,用户通过检索得到需要的文本信息已经成为日常工作和学习生活中常规的方式,文本信息诸如专利、学术论文,技术期刊等等。如技术人员需要了解一个实体的具体结构,该实体可以是一个设备,或者,该实体也可以是某一个设备中的某一个部件。当前技术中,用户可以通过关键词(如aa实体)进行检索,通过检索得到的检索结果为包括该实体的所有文本(例如专利文本)。在检索到的大量的文本中,用户需要逐篇文本进行分析,人工查找每篇专利文本中的附图,进而查找到该实体的附图,极大的浪费了人力成本。
技术实现思路
有鉴于此,本专利技术实施例提供了一种获取图像信息的方法及相关装置,本申请实施例中获取图像信息的方法不需要像现有技术中需要人工的逐篇查阅文本中的附图,而是将目标实体与图像数据集中各候选图像所关联的候选实体进行匹配;若目标实体与图像数据集中的第一候选图像所关联的候选实体相匹配,则确定第一候选图像为与目标实体相匹配的候选图像;直接输出第一候选图像,极大的节省了人工成本。第一方面,本申请实施例提供了一种获取图像信息的方法,包括:接收待匹配的目标文本信息;其中,所述目标文本信息包括目标实体;将所述目标实体与图像数据集中各候选图像所关联的候选实体进行匹配;若所述目标实体与所述图像数据集中的第一候选图像所关联的候选实体相匹配,则确定所述第一候选图像为与所述目标实体相匹配的候选图像;输出所述第一候选图像。在一种可能的实现方式中,所述图像数据集包括第一图像数据集,所述第一图像数据集包 ...
【技术保护点】
1.一种获取图像信息的方法,其特征在于,包括:接收待匹配的目标文本信息;其中,所述目标文本信息包括目标实体;将所述目标实体与图像数据集中各候选图像所关联的候选实体进行匹配;若所述目标实体与所述图像数据集中的第一候选图像所关联的候选实体相匹配,则确定所述第一候选图像为与所述目标实体相匹配的候选图像;输出所述第一候选图像。
【技术特征摘要】
1.一种获取图像信息的方法,其特征在于,包括:接收待匹配的目标文本信息;其中,所述目标文本信息包括目标实体;将所述目标实体与图像数据集中各候选图像所关联的候选实体进行匹配;若所述目标实体与所述图像数据集中的第一候选图像所关联的候选实体相匹配,则确定所述第一候选图像为与所述目标实体相匹配的候选图像;输出所述第一候选图像。2.根据权利要求1所述的方法,其特征在于,所述图像数据集包括第一图像数据集,所述第一图像数据集包含高频实体的候选图像,所述高频实体为使用频次高于门限的候选实体;所述将所述目标实体与图像数据集中各候选图像所关联的候选实体进行匹配,包括:将所述目标实体与所述第一图像数据集中各候选图像所关联的候选实体进行匹配;若所述目标实体在所述第一图像数据集中未匹配到候选实体,则将所述目标实体与除了所述第一图像数据集之外的其他图像数据集中各候选图像所关联的候选实体进行匹配。3.根据权利要求1所述的方法,其特征在于,所述目标实体至少包括第一目标实体和第二目标实体,所述目标文本信息还包括所述第一目标实体与所述第二目标实体之间的第一关系;所述方法还包括:若所述第一目标实体与所述图像数据集中的第一候选图像所关联的第一候选实体相匹配,所述第二目标实体与所述图像数据集中的第二候选图像所关联的第二候选实体相匹配;则将所述第一目标实体与所述第二目标实体之间的第一关系,与,所述第一候选实体与所述第二候选实体之间的第二关系进行匹配;若所述第一关系与所述第二关系相匹配,所述方法还包括:输出所述第二候选图像。4.根据权利要求1所述的方法,其特征在于,所述图像数据集包括第一图像数据集,所述将所述目标实体与图像数据集中各候选图像所关联的文字信息进行匹配之前,所述方法还包括:建立所述图像数据集。5.根据权利要求4所述的方法,其特征在于,所述建立所述图像数据集包括:获取候选文本集合;其中,所述候选文本集合包括多篇候选文本,每篇候选文本均包含候选实体;统计所述候选文本集合中每个候选实体出现的频次;根据所述频次确定高频实体;其中,所述高频实体包括在所述候选文本集合中出现的频次高于门限的实体,或者,所述高频实体包括按照所述频次进行排序后,在预置位置之前的实体;将每个所述高频实体关联至少一个对应的候选图像,得到所述第一图像数据集。6.根据权利要求4所述的方法,其特征在于,所述建立所述图像数据集,包括:获取候选文本集合;其中,所述候选文本集合中的每篇候选文本包括附图说明与附图,所述附图说明包含候选实体及所述候选实体的标识,所述附图包含候选图像及所述标识;根据所述标识建立所述候选实体与所述候选图像的关联关系,得到所述第二图像数据集。7.根据权利要求4所述的方法,其特征...
【专利技术属性】
技术研发人员:王志强,姜庭欣,李静毅,王希桢,刘乾楠,李丽,
申请(专利权)人:北京合享智慧科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。