基于预训练的品牌识别方法技术

技术编号:39573652 阅读:6 留言:0更新日期:2023-12-03 19:25
本发明专利技术实施例中提供了一种基于预训练的品牌识别方法

【技术实现步骤摘要】
基于预训练的品牌识别方法、装置及电子设备


[0001]本专利技术涉及数据处理
,尤其涉及一种基于预训练的品牌识别方法

装置及电子设备


技术介绍

[0002]AI
品牌识别是
AI
识别技术中的一个领域,通过计算机算法,对品牌标识进行识别和分类
。AI
品牌识别技术可以应用于品牌
logo、
商标

宣传语等品牌标识的识别和分类,帮助企业快速获取品牌信息,提高品牌知名度

信誉度和竞争力

[0003]AI
品牌识别技术可以通过图像识别

自然语言处理等技术实现

其中,图像识别技术可以通过对图片中的品牌
logo
进行识别,提取品牌
logo
的特征,并将其与已有的品牌
logo
库进行比对,从而实现对品牌
logo
的识别和分类

自然语言处理技术则可以通过对文本中的品牌宣传语进行分析和处理,提取其中的关键词和语义特征,并将其与已有的品牌库进行比对,从而实现对品牌宣传语的识别和分类

[0004]AI
品牌识别技术的应用场景非常广泛,包括广告监测

市场调研

品牌策划

电商运营

数据分析等领域

例如,在广告监测领域中,通过<br/>AI
品牌识别技术对广告中的品牌标识进行识别和分类,可以快速准确地了解竞争对手的广告投放情况,为企业制定合理的广告投放策略提供数据支持

在市场调研领域中,通过
AI
品牌识别技术对市场中的品牌标识进行识别和分类,可以快速准确地了解市场上的品牌分布和竞争情况,为企业制定市场进入和竞争策略提供数据支持

[0005]然而目前
AI
品牌识别存在如下问题:
[0006]1.
准确性不高: 当文本数据具有复杂的多义性或模糊性时,品牌识别准确性就会下降

例如,某些品牌名称可能是常见的词汇,拥有多重含义

[0007]2.
多模态识别困难:品牌的识别需要同时考虑图像和文本信息,但多模态识别仍然是一个挑战,不同类型的数据如何有效融合仍然难点

[0008]3.
优质数据稀缺:品牌的标注数据相对较少,这会限制深度学习模型的性能

获得高质量的品牌标注数据是一项挑战

[0009]4.
实时性不达标:现有品牌识别方案在大规模数据的处理上,实时性欠缺

[0010]5.
泛化能力差:大多品牌识别模型都是针对特定行业或品牌,很难适应到其他领域,模型的泛化能力差

[0011]上述问题成为需要解决的技术问题


技术实现思路

[0012]有鉴于此,本专利技术实施例提供一种基于预训练的品牌识别方法

装置及电子设备,至少部分解决现有技术中存在的问题

[0013]第一方面,本专利技术实施例提供了一种基于预训练的品牌识别方法,包括:
[0014]从多个数据源中采集品牌相关的图像数据和文本数据,所述图像数据包括品牌
logo、
社交媒体帖子图像和产品图像,所述文本数据包括产品描述

广告文案

社交媒体帖子文本;
[0015]针对所述图像数据和文本数据进行预处理,将所述图像数据和文本数据转化成具有统一数据结构的预处理数据;
[0016]使用深度学习预训练模型
GPT
,对所述图像数据和文本数据进行预训练,将所述图像数据和文本数据整合到同一个模型中,通过计算文本数据的关联值矩阵
M
以及聚合主题集合,计算图像数据和文本数据之间的条件概率值
P
,建立图像数据和文本数据之间的关联关系,得到预训练后的深度学习模型;
[0017]使用有标签的品牌数据对预训练后的深度学习模型进行微调,以便使预训练后的深度学习模型能够准确识别特定品牌的图像和文本,进而得到微调后的深度学习模型,所述微调后的深度学习模型用于进行实时品牌的识别任务

[0018]根据本公开实施例的一种具体实现方式,所述针对所述图像数据和文本数据进行预处理,包括:
[0019]缺失值处理:检测缺失值,选择删除包含缺失值的行或列,或者使用插值方法填充缺失值;
[0020]异常值处理:检测异常值,对这些异常值进行删除

转换或替换处理

[0021]根据本公开实施例的一种具体实现方式,所述针对所述图像数据和文本数据进行预处理,还包括:
[0022]数据类型转换:确保数据的类型正确,将日期字段转换为日期类型,将文本字段转换为数值型;
[0023]数据标准化和归一化:如果数据的不同特征具有不同的尺度,对数据进行标准化,使其具有零均值和单位方差,或对数据归一化,将数据缩放到特定范围;
[0024]数据编码:对分类数据进行编码,使用独热编码将类别变量转换为二进制形式,以便后续机器学习算法能够处理

[0025]根据本公开实施例的一种具体实现方式,所述针对所述图像数据和文本数据进行预处理,还包括:
[0026]特征选择:根据问题的需求选择有用的特征,以降低维度和噪音,提高模型性能;
[0027]数据分割:将数据集划分为训练集

验证集和测试集,以便模型训练和评估;
[0028]数据保存:将经过预处理和清洗的数据保存为新的数据集,以备后续分析和建模使用

[0029]根据本公开实施例的一种具体实现方式,所述使用深度学习预训练模型
GPT
,对所述图像数据和文本数据进行预训练,将所述图像数据和文本数据整合到同一个模型中,包括:
[0030]设置文本处理器和图像处理器,所述文本处理器对所述文本数据进行处理,所述图像处理器对所述图像数据进行处理,所述文本处理器和图像处理器这两个处理器在预设层次上共享参数;
[0031]引入跨模态注意力机制,所述跨模态注意力机制在深度学习预训练模型
GPT
处理文本时关注图像信息,在深度学习预训练模型
GPT
处理图像时关注文本信息,将不同模态的信息融合在一起,以便深度学习预训练模型
GPT
理解图像和文本之间的关系

[0032]根据本公开实施例的一种具体实现方式,所述文本处理器对所述文本数据进行处理,包括:
[0033]对文本数据中包含的文本信息进行分词处理,得到包含
n
个分词元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于预训练的品牌识别方法,其特征在于,包括:从多个数据源中采集品牌相关的图像数据和文本数据,所述图像数据包括品牌
logo、
社交媒体帖子图像和产品图像,所述文本数据包括产品描述

广告文案

社交媒体帖子文本;针对所述图像数据和文本数据进行预处理,将所述图像数据和文本数据转化成具有统一数据结构的预处理数据;使用深度学习预训练模型
GPT
,对所述图像数据和文本数据进行预训练,将所述图像数据和文本数据整合到同一个模型中,通过计算文本数据的关联值矩阵
M
以及聚合主题集合,计算图像数据和文本数据之间的条件概率值
P
,建立图像数据和文本数据之间的关联关系,得到预训练后的深度学习模型;使用有标签的品牌数据对预训练后的深度学习模型进行微调,以便使预训练后的深度学习模型能够准确识别特定品牌的图像和文本,进而得到微调后的深度学习模型,所述微调后的深度学习模型用于进行实时品牌的识别任务
。2.
根据权利要求1所述的方法,其特征在于,所述针对所述图像数据和文本数据进行预处理,包括:缺失值处理:检测缺失值,选择删除包含缺失值的行或列,或者使用插值方法填充缺失值;异常值处理:检测异常值,对这些异常值进行删除

转换或替换处理
。3.
根据权利要求2所述的方法,其特征在于,所述针对所述图像数据和文本数据进行预处理,还包括:数据类型转换:确保数据的类型正确,将日期字段转换为日期类型,将文本字段转换为数值型;数据标准化和归一化:如果数据的不同特征具有不同的尺度,对数据进行标准化,使其具有零均值和单位方差,或对数据归一化,将数据缩放到特定范围;数据编码:对分类数据进行编码,使用独热编码将类别变量转换为二进制形式,以便后续机器学习算法能够处理
。4.
根据权利要求3所述的方法,其特征在于,所述针对所述图像数据和文本数据进行预处理,还包括:特征选择:根据问题的需求选择有用的特征,以降低维度和噪音,提高模型性能;数据分割:将数据集划分为训练集

验证集和测试集,以便模型训练和评估;数据保存:将经过预处理和清洗的数据保存为新的数据集,以备后续分析和建模使用
。5.
根据权利要求4所述的方法,其特征在于,所述使用深度学习预训练模型
GPT
,对所述图像数据和文本数据进行预训练,将所述图像数据和文本数据整合到同一个模型中,包括:设置文本处理器和图像处理器,所述文本处理器对所述文本数据进行处理,所述图像处理器对所述图像数据进行处理,所述文本处理器和图像处理器这两个处理器在预设层次上共享参数;引入跨模态注意力机制,所述跨模态注意力机制在深度学习预训练模型
GPT
处理文本时关注图像信息,在深度学习预训练模型
GPT
处理图像时关注文本信息,将不同模态的信息融合在一起,以便深度学习预训练模型
GPT
理解图像和文本之间的关系

6.
根据权利要求5所述的方法,其特征在于,所述文本处理器对所述文本数据进行处理,包括:对...

【专利技术属性】
技术研发人员:彭浩寇振芳李蕾苗宇纪啸峥
申请(专利权)人:一网互通北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1