一种数据处理方法及相关装置制造方法及图纸

技术编号：32965688 阅读：16 留言：0更新日期：2022-04-09 11:21

本申请实施例公开了一种人工智能领域的数据处理方法及相关装置，其中该方法包括：获取目标图像和目标描述数据；针对目标图像，确定该目标图像中的目标区域，并获取目标区域对应的图像特征，目标区域是目标图像中包括参考识别对象的区域；针对目标描述数据，获取该目标描述数据对应的数据特征；根据目标图像中所述目标区域对应的图像特征、以及目标描述数据对应的数据特征，确定目标图像与目标描述数据之间的匹配性检测结果，该匹配性检测结果用于表征目标图像与目标描述数据之间的匹配程度。该方法在检测图像与相关描述数据之间的匹配性时，能够有效地提高匹配性检测结果的准确度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及相关装置

[0001]本申请涉及人工智能
，尤其涉及一种数据处理方法及相关装置。

技术介绍

[0002]如今，很多应用场景均存在检测图像与相关描述数据是否匹配的需求。例如，在基于网络爬虫从网页数据中爬取到的视频和视频标题构建视频索引数据的场景中，由于部分网页数据(如小程序html网页)的结构不够规范，容易在解析网页数据的过程中提取错视频或者视频标题，为了避免基于提取错的视频或者视频标题构建视频索引数据，通常需要在构建视频索引数据前，检测所提取出的视频与视频标题之间是否匹配。
[0003]相关技术中，针对所要检测的图像和相关描述数据，通常利用图像特征提取模型提取图像的整体特征，利用与相关描述数据的数据类型对应的特征提取模型提取相关描述数据的特征，进而，根据该图像的整体特征和该相关描述数据的特征，检测该图像与该相关描述数据是否匹配。
[0004]然而，上述匹配性检测方法在实际应用中的效果欠佳，通过上述匹配性检测方法得到的检测结果往往并不准确，在很多情况下，容易将实际不具有匹配关系的图像和描...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：获取目标图像和目标描述数据；针对所述目标图像，确定所述目标图像中的目标区域，并获取所述目标区域对应的图像特征；所述目标区域是所述目标图像中包括参考识别对象的区域；针对所述目标描述数据，获取所述目标描述数据对应的数据特征；根据所述目标图像中所述目标区域对应的图像特征、以及所述目标描述数据对应的数据特征，确定所述目标图像与所述目标描述数据之间的匹配性检测结果；所述匹配性检测结果用于表征所述目标图像与所述目标描述数据之间的匹配程度。2.根据权利要求1所述的方法，其特征在于，所述针对所述目标图像，确定所述目标图像中的目标区域，并获取所述目标区域对应的图像特征，包括：在所述目标图像中确定多个候选区域，确定所述多个候选区域各自对应的图像特征；并根据所述多个候选区域各自对应的图像特征，确定所述多个候选区域各自对应的分类概率；所述分类概率用于表征其对应的候选区域中的内容属于参考类别的概率，所述参考类别是所述参考识别对象所属的类别；根据所述多个候选区域各自对应的分类概率，从所述多个候选区域中选出所述目标区域，并获取所述目标区域对应的图像特征。3.根据权利要求2所述的方法，其特征在于，所述在所述目标图像中确定多个候选区域，确定所述多个候选区域各自对应的图像特征；并根据所述多个候选区域各自对应的图像特征，确定所述多个候选区域各自对应的分类概率，包括：通过第一目标检测模型中的卷积网络，对所述目标图像进行特征提取处理，得到所述目标图像对应的目标特征图；通过所述第一目标检测模型中的区域生成网络，在所述目标图像中生成所述多个候选区域；将所述多个候选区域分别映射至所述目标特征图上；通过所述第一目标检测模型中的区域池化层，根据所述多个候选区域在所述目标特征图上的映射特征，确定所述多个候选区域各自对应的图像特征；通过所述第一目标检测模型中的分类网络，根据所述多个候选区域各自对应的图像特征，确定所述多个候选区域各自对应的分类概率；并通过所述第一目标检测模型中的边框回归网络，调整所述多个候选区域各自的位置。4.根据权利要求2所述的方法，其特征在于，所述在所述目标图像中确定多个候选区域，确定所述多个候选区域各自对应的图像特征；并根据所述多个候选区域各自对应的图像特征，确定所述多个候选区域各自对应的分类概率，包括：通过选择性搜索算法，在所述目标图像中提取所述多个候选区域；通过第二目标检测模型中的卷积网络，对所述多个候选区域分别进行特征提取处理，得到所述多个候选区域各自对应的图像特征；通过所述第二目标检测模型中的支持向量机，根据所述多个候选区域各自对应的图像特征，确定所述多个候选区域各自对应的分类概率；通过所述第二目标检测模型中的边框回归网络，调整所述多个候选区域各自的位置。5.根据权利要求2所述的方法，其特征在于，所述在所述目标图像中确定多个候选区域，确定所述多个候选区域各自对应的图像特征；并根据所述多个候选区域各自对应的图
像特征，确定所述多个候选区域各自对应的分类概率，包括：通过选择性搜索算法，在所述目标图像中提取所述多个候选区域；通过第三目标检测模型中的卷积网络，对所述目标图像进行特征提取处理，得到所述目标图像对应的目标特征图；将所述多个候选区域分别映射至所述目标特征图上；通过所述第三目标检测模型中的区域池化层，根据所述多个候选区域在所述目标特征图上的映射特征，确定所述多个候选区域各自对应的图像特征；通过所述第三目标检测模型中的分类网络，根据所述多个候选区域各自对应的图像特征，确定所述多个候选区域各自对应的分类概率；并通过所述第三目标检测模型中的边框回归网络，调整所述多个候选区域各自的位置。6.根据权利要求1所述的方法，其特征在于，所述针对所述目标描述数据，获取所述目标描述数据对应的数据特征，包括以下至少一种：当所述目标描述数据为目标文本时，通过文本语义识别模型，根据所述目标文本，确定所述目标文本对应的文本特征；当所述目标描述数据为参考图像时，通过图像特征提取模型，根据所述参考图像，确定所述参考图像对应的图像特征；当所述目标描述数据为目标语音时，通过语音特征提取算法，根据所述目标语音，确定所述目标语音对应的语音特征。7.根据权利要求1所述的方法，其...

【专利技术属性】
技术研发人员：黄剑辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人