【技术实现步骤摘要】
素材的品牌识别方法及装置
[0001]本专利技术涉及互联网
,尤其涉及一种素材的品牌识别方法及装置。
技术介绍
[0002]随着互联网技术的快速发展,电商的发展也越发迅猛。基于传播效率快、传播面广等特点,互联网广告(如在电视、网站等媒体进行广告投放)已经成为宣传产品的重要传播手段,通过互联网广告,可以将需要传递的信息传送至消费者端,以引起消费者的关注。
[0003]实际中,当需要整理大量的广告素材文本时,需要人工对广告素材的文本信息中的品牌进行标注识别,得到广告素材文本的品牌之后,再进行品牌之间不同维度的对比;或者通过通用型的命名实体识别(Named Entity Recognition,简称NER)识别广告素材文本的品牌。然而,实践发现,人工标注存在准确率低且效率低的问题,通用型NER仅适用于常规广告素材的文本信息,依旧无法识别到准确的品牌,并且为了吸引受众的关注,广告素材文本样式往往跟随热点调整,复杂多变。因此,提出一种如何提高广告素材的品牌的识别准确率的方案尤为重要。
技术实现思路
[00 ...
【技术保护点】
【技术特征摘要】
1.一种素材的品牌识别方法,其特征在于,所述方法包括:对待识别素材的文本信息执行品牌识别操作,得到所述文本信息的品牌集合,所述品牌集合包括至少一个品牌;判断所述品牌集合的所有所述品牌中是否存在关系为预设品牌关系的品牌,得到判断结果;根据所述判断结果,分析所述品牌集合的所有所述品牌,得到所述待识别素材对应的品牌结果。2.根据权利要求1所述的素材的品牌识别方法,其特征在于,所述根据所述判断结果,分析所述品牌集合的所有所述品牌,得到所述待识别素材对应的品牌结果,包括:当所述判断结果用于表示所述品牌集合的所有所述品牌中存在关系为所述预设品牌关系的品牌时,从所述品牌集合的所有所述品牌中确定级别为后一级别的品牌,为所述待识别素材对应的品牌结果。3.根据权利要求1所述的素材的品牌识别方法,其特征在于,所述根据所述判断结果,分析所述品牌集合的所有所述品牌,得到所述待识别素材对应的品牌结果,包括:当所述判断结果用于表示所述品牌集合的所有所述品牌中不存在关系为所述预设品牌关系的品牌时,确定所述品牌集合的所有所述品牌中每个所述品牌的字符串长度;根据所述字符串长度从所述品牌集合的所有所述品牌中筛选最长字符串长度的品牌,作为所述待识别素材对应的品牌结果。4.根据权利要求3所述的素材的品牌识别方法,其特征在于,所述确定所述品牌集合的所有所述品牌中每个所述品牌的字符串长度之前,所述方法还包括:基于确定出的行业品牌集合判断所述品牌集合的所有所述品牌中是否存在非歧义性的品牌,所述行业品牌集合的所有所述品牌包括歧义性品牌和非歧义性品牌;当判断出所述品牌集合的所有所述品牌中存在非歧义性的所述品牌时,从所述品牌集合的所有所述品牌中筛选非歧义性的所有所述品牌;其中,所述确定所述品牌集合的所有所述品牌中每个所述品牌的字符串长度,包括:确定非歧义性的所有所述品牌中每个所述品牌的字符串长度。5.根据权利要求4所述的素材的品牌识别方法,其特征在于,所述方法还包括:当判断出所述品牌集合的所有所述品牌中不存在非歧义性的品牌时,将所述文本信息输入确定出的行业分析模型中进行分析,并获取所述行业分析模型输出的分析结果,作为所述待识别素材所属的行业;判断所述品牌集合的所有所述品牌中是否存在与所述待识别素材所属的行业不匹配的品牌;当判断出不存在与所述待识别素材所属的行业不匹配的品牌时,执行所述的确定所述品牌集合的所有所述品牌中每个所述品牌的字符串长度的操作。6.根据权利要求5所述的素材的品牌识别方法,其特征在于,所述方法还包括:当判断出存在与所述待识别素材所属的行业不匹配的品牌时,从所述品牌集合的所有所述品牌中剔除与所述待识别素材所属的行业不匹配的品牌,得到第一品牌集合;其中,所述确定所述品牌集合的所有所述品牌中每个所述品牌的字符串长度,包括:确定所述第一品牌集合的所有所述品牌中每个所述品牌的字符串长度。
7.根据权利要求6所述的素材的品牌识别方法,其特征在于,所述文本信息的来源类型包括标语来源类型和/或描述来源类型;以及,所述从所述品牌集合的所有所述品牌中剔除与所述文本信息所属的行业不匹配的品牌,得到第一品牌集合之后,所述方法还包括:判断所述第一品牌集合中品牌的数量是否大于等于1,当判断出所述第一品牌集合中品牌的数量大于等于1时,执行所述的确定所述第一品牌集合的所有所述品牌中每个所述品牌的字符串长度的操作。8.根据权利要求7所述的素材的品牌识别方法,其特征在于,所述...
【专利技术属性】
技术研发人员:王秋文,李百川,蔡锐涛,
申请(专利权)人:有米科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。