【技术实现步骤摘要】
基于预训练的品牌识别方法、装置及电子设备
[0001]本专利技术涉及数据处理
,尤其涉及一种基于预训练的品牌识别方法
、
装置及电子设备
。
技术介绍
[0002]AI
品牌识别是
AI
识别技术中的一个领域,通过计算机算法,对品牌标识进行识别和分类
。AI
品牌识别技术可以应用于品牌
logo、
商标
、
宣传语等品牌标识的识别和分类,帮助企业快速获取品牌信息,提高品牌知名度
、
信誉度和竞争力
。
[0003]AI
品牌识别技术可以通过图像识别
、
自然语言处理等技术实现
。
其中,图像识别技术可以通过对图片中的品牌
logo
进行识别,提取品牌
logo
的特征,并将其与已有的品牌
logo
库进行比对,从而实现对品牌
logo
的识别和分类
。
自然语言处理技术则可以通过对文本中的品牌宣传语进行分析和处理,提取其中的关键词和语义特征,并将其与已有的品牌库进行比对,从而实现对品牌宣传语的识别和分类
。
[0004]AI
品牌识别技术的应用场景非常广泛,包括广告监测
、
市场调研
、
品牌策划
、
电商运营
、
数据分析等领域
。
例如,在广告监测领域中,通过< ...
【技术保护点】
【技术特征摘要】
1.
一种基于预训练的品牌识别方法,其特征在于,包括:从多个数据源中采集品牌相关的图像数据和文本数据,所述图像数据包括品牌
logo、
社交媒体帖子图像和产品图像,所述文本数据包括产品描述
、
广告文案
、
社交媒体帖子文本;针对所述图像数据和文本数据进行预处理,将所述图像数据和文本数据转化成具有统一数据结构的预处理数据;使用深度学习预训练模型
GPT
,对所述图像数据和文本数据进行预训练,将所述图像数据和文本数据整合到同一个模型中,通过计算文本数据的关联值矩阵
M
以及聚合主题集合,计算图像数据和文本数据之间的条件概率值
P
,建立图像数据和文本数据之间的关联关系,得到预训练后的深度学习模型;使用有标签的品牌数据对预训练后的深度学习模型进行微调,以便使预训练后的深度学习模型能够准确识别特定品牌的图像和文本,进而得到微调后的深度学习模型,所述微调后的深度学习模型用于进行实时品牌的识别任务
。2.
根据权利要求1所述的方法,其特征在于,所述针对所述图像数据和文本数据进行预处理,包括:缺失值处理:检测缺失值,选择删除包含缺失值的行或列,或者使用插值方法填充缺失值;异常值处理:检测异常值,对这些异常值进行删除
、
转换或替换处理
。3.
根据权利要求2所述的方法,其特征在于,所述针对所述图像数据和文本数据进行预处理,还包括:数据类型转换:确保数据的类型正确,将日期字段转换为日期类型,将文本字段转换为数值型;数据标准化和归一化:如果数据的不同特征具有不同的尺度,对数据进行标准化,使其具有零均值和单位方差,或对数据归一化,将数据缩放到特定范围;数据编码:对分类数据进行编码,使用独热编码将类别变量转换为二进制形式,以便后续机器学习算法能够处理
。4.
根据权利要求3所述的方法,其特征在于,所述针对所述图像数据和文本数据进行预处理,还包括:特征选择:根据问题的需求选择有用的特征,以降低维度和噪音,提高模型性能;数据分割:将数据集划分为训练集
、
验证集和测试集,以便模型训练和评估;数据保存:将经过预处理和清洗的数据保存为新的数据集,以备后续分析和建模使用
。5.
根据权利要求4所述的方法,其特征在于,所述使用深度学习预训练模型
GPT
,对所述图像数据和文本数据进行预训练,将所述图像数据和文本数据整合到同一个模型中,包括:设置文本处理器和图像处理器,所述文本处理器对所述文本数据进行处理,所述图像处理器对所述图像数据进行处理,所述文本处理器和图像处理器这两个处理器在预设层次上共享参数;引入跨模态注意力机制,所述跨模态注意力机制在深度学习预训练模型
GPT
处理文本时关注图像信息,在深度学习预训练模型
GPT
处理图像时关注文本信息,将不同模态的信息融合在一起,以便深度学习预训练模型
GPT
理解图像和文本之间的关系
。
6.
根据权利要求5所述的方法,其特征在于,所述文本处理器对所述文本数据进行处理,包括:对...
【专利技术属性】
技术研发人员:彭浩,寇振芳,李蕾,苗宇,纪啸峥,
申请(专利权)人:一网互通北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。