文本标签的确定方法及相关装置制造方法及图纸

技术编号:33132300 阅读:16 留言:0更新日期:2022-04-17 00:51
本申请实施例公开了一种文本标签的确定方法及相关装置,该方法包括:获取目标图片中的目标文本与目标文本对应的目标文本框特征向量,将目标文本与目标文本框特征向量输入预先训练好的标签确定模型,确定目标文本对应的第一标签,标签确定模型由多个训练文本、训练文本对应的训练文本框特征向量拼接后的数据,以及训练文本对应的第二标签训练得到,第二标签为预先设定的标签。本申请将训练文本框特征向量以及训练文本拼接,通过拼接后的训练文本框特征向量以及训练文本来训练标签确定模型,使得训练好的标签确定模型输出结果为训练文本的对应的第二标签,提高确定文本标签的准确性。性。性。

【技术实现步骤摘要】
文本标签的确定方法及相关装置


[0001]本申请涉及数据处理
,具体涉及一种文本标签的确定方法及相关装置。

技术介绍

[0002]随着科技的发展,包括文本图片在内的多媒体资源规模越来越大。文本检索逐渐成为自然语言处理领域中的一个研究热点,产生了许多基于光学字符识别(OCR)技术的文本检索方法,该方法从图片中识别文本内容,然后利用文本检索技术实现文本图片检索系统。通过现有的图片提取技术,从图片中提取完文本后,再提取文本的信息,从而根据识别与提取的结果为该文本打上标签,图片文本的提取与识别文本是两个独立的过程,导致为图片中文本打上对应标签的效率低,且准确度低。

技术实现思路

[0003]本申请实施例提供了一种文本标签的确定方法及相关装置,能够将目标图片中的目标文本与目标文本框特征向量拼接后,来确定目标图片中目标文本的标签,从而提高确定文本标签时的准确性。
[0004]第一方面,本申请实施例提供一种文本标签的确定方法,所述方法包括:
[0005]获取目标图片;
[0006]提取所述目标图片中的目标文本与所述目标文本对应的目标文本框特征向量;
[0007]将所述目标文本与所述目标文本框特征向量输入预先训练好的标签确定模型,确定所述目标文本对应的第一标签,所述标签确定模型由多个训练文本、所述训练文本对应的训练文本框特征向量拼接后的数据,以及所述训练文本对应的第二标签训练得到,所述训练文本框特征向量包括所述训练文本所在的区域在训练图片中的顶点坐标,以及所述区域的斜边长与所述训练图片的斜边长的比值,所述第二标签为预先设定的标签。
[0008]第二方面,本申请实施例提供的一种文本标签的确定装置,所述装置包括:
[0009]第一获取单元,用于获取目标图片;
[0010]提取单元,用于提取所述目标图片中的目标文本与所述目标文本对应的目标文本框特征向量;
[0011]第一输入单元,用于将所述目标文本与所述目标文本框特征向量输入预先训练好的标签确定模型,确定所述目标文本对应的第一标签,所述标签确定模型由多个训练文本、所述训练文本对应的训练文本框特征向量拼接后的数据,以及所述训练文本对应的第二标签训练得到,所述训练文本框特征向量包括所述训练文本所在的区域在训练图片中的顶点坐标,以及所述区域的斜边长与所述训练图片的斜边长的比值,所述第二标签为预先设定的标签。
[0012]第三方面,本申请实施例提供一种终端设备,所述终端设备包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行上述第一方面所述的方法中所描述的部分或全
部步骤的指令。
[0013]第四方面,本申请实施例提供了一种计算机可读存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本实施例第一方面中的部分或全部步骤。
[0014]可以看出,本实施例中,本申请提供的技术方案,获取目标图片后,提取该目标图片中的目标文本与目标文本对应的目标文本框特征向量;将目标文本与目标文本框特征向量输入预先训练好的标签确定模型,确定目标文本对应的第一标签。其中,标签确定模型由多个训练文本、训练文本对应的训练文本框特征向量拼接后的数据,以及训练文本对应的第二标签训练得到,训练文本框特征向量包括训练文本所在的区域在训练图片中的顶点坐标,以及区域的斜边长与训练图片的斜边长的比值,第二标签为预先设定的标签,通过训练文本,以及训练文本所在区域的顶点坐标,以及训练文本所在区域的斜边长与训练图片的斜边长的比值,保证训练文本为第二标签对应的文本,提高标签确定模型识别的准确度。
附图说明
[0015]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是本申请实施例提供的一种应用架构示意图;
[0017]图2是本申请实施例提供的一种文本标签的确定方法的流程示意图;
[0018]图3是本申请实施例提供的一种文本标签的确定方法的示意图;
[0019]图4是本申请实施例提供的一种标签确定模型训练流程示意图;
[0020]图5是本申请实施例提供的标签确定模型训练过程示意图;
[0021]图6是本申请实施例提供的一种文本标签的确定装置的功能单元组成框图;
[0022]图7是本申请实施例提供的一种终端设备的结构示意图。
具体实施方式
[0023]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0024]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
[0025]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和
隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0026]为了便于理解本申请提供的技术方案,首先,对本申请中涉及到的相关概念进行解释说明。
[0027]第一标签:第一标签用于标识目标文本的目标文本信息,例如第一标签内容为:房屋面积,识别到的目标文本为:80平方米,在识别目标文本后,确定该目标文本对应的标签应该为房屋面积,则为该目标文本打上第一标签,表示房屋的面积为80。
[0028]第二标签:第二标签用于标识训练文本的训练文本信息,例如第二标签为:户型名称,识别到的训练文本为:XX户,在识别目标文本后,确定训练文本对应的标签应该为户型名称,则为该训练文本打上第一标签,表示户型名称为XX户。
[0029]可以理解的是,第一标签与第二标签为预先设定的标签,可以根据实际需求进行设定,例如,也可以为项目名称,户型大小等等,具体此处不作限定。
[0030]训练文本框特征向量,训练文本框特征向量包括训练文本的区域在训练图片中的顶点坐标,以及训练文本所在区域的斜边长与所述训练图片的斜边长的比值,训练文本框特征向量还包括提取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本标签的确定方法,其特征在于,所述方法包括:获取目标图片;提取所述目标图片中的目标文本与所述目标文本对应的目标文本框特征向量;将所述目标文本与所述目标文本框特征向量输入预先训练好的标签确定模型,确定所述目标文本对应的第一标签,所述标签确定模型由多个训练文本、所述训练文本对应的训练文本框特征向量拼接后的数据,以及所述训练文本对应的第二标签训练得到,所述训练文本框特征向量包括所述训练文本所在的区域在训练图片中的顶点坐标,以及所述区域的斜边长与所述训练图片的斜边长的比值,所述第二标签为预先设定的标签。2.根据权利要求1所述的方法,其特征在于,所述标签确定模型通过如下步骤训练得到:获取多个所述训练文本、所述训练文本对应的所述训练文本框特征向量以及与所述训练文本对应的所述第二标签;将所述训练文本与所述训练文本框特征向量拼接,获得第一矩阵;将所述第一矩阵输入所述标签确定模型,获得第三标签,按照所述第三标签与所述第二标签的差异,调整所述标签确定模型,直至达到训练结束条件,得到所述标签确定模型。3.根据权利要求2所述的方法,其特征在于,所述将所述训练文本与所述训练文本框特征向量拼接之前,所述方法还包括:对所述训练文本、所述训练文本框特征向量以及所述第二标签进行预处理,去除重复的所述训练文本、所述训练文本框特征向量以及所述第二标签。4.根据权利要求2所述的方法,其特征在于,所述将所述训练文本与所述训练文本框特征向量拼接,获得第一矩阵包括:将所述训练文本通过文本字典转换为文本数字;通过语义表示模型将所述文本数字转化为文本向量,获得第二矩阵,所述第二矩阵包括所述文本向量;将所述训练文本框特征向量通过全连接神经网络转化为维度为1的第三矩阵和维度为k的第四矩阵,其中,所述k为超参数;根据所述第三矩阵和所述第二矩阵确定第五矩阵,根据所述第四矩阵和所述第二矩阵确定第六矩阵;根据所述第五矩阵和第六矩阵确定所述第一矩阵。5.根据权利要求4所述的方法,其特征在于,所述根据所述第三矩阵和所述...

【专利技术属性】
技术研发人员:刘镇熙
申请(专利权)人:深圳思为科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1