【技术实现步骤摘要】
本专利技术涉及数据处理领域,尤其涉及一种标签关联方法及装置。
技术介绍
随着网络技术的发展,可以通过网络获取越来越多的数据,并依托这些数据进行进一步的分析,这也是大数据时代的特点之一。为了对海量数据进行进一步的处理和分析,将数据关联至不同的标签往往是必不可少的步骤。但是,现有的标签关联方法的效率有待提高。
技术实现思路
本专利技术解决的技术问题是提高标签关联方法的效率。为解决上述技术问题,本专利技术实施例提供一种标签关联方法,包括:对待进行标签关联的目标数据进行匹配处理,以得到目标关键词,所述匹配处理参照关键词词典进行,所述关键词词典中包含映射至一个或多个标签的关键词;计算候选标签的权重,所述候选标签是在所述关键词词典中与所述目标关键词存在映射关系的标签;基于所述候选标签的权重选取目标标签,建立所述目标标签与所述目标数据之间的关联关系。可选的,所述参照关键词词典对所述目标数据进行匹配处理,得到目标关键词,包括:对所述 ...
【技术保护点】
一种标签关联方法,其特征在于,包括:对待进行标签关联的目标数据进行匹配处理,以得到目标关键词,所述匹配处理参照关键词词典进行,所述关键词词典中包含映射至一个或多个标签的关键词;计算候选标签的权重,所述候选标签是在所述关键词词典中与所述目标关键词存在映射关系的标签;基于所述候选标签的权重选取目标标签,建立所述目标标签与所述目标数据之间的关联关系。
【技术特征摘要】
1.一种标签关联方法,其特征在于,包括:
对待进行标签关联的目标数据进行匹配处理,以得到目标关键词,所述匹
配处理参照关键词词典进行,所述关键词词典中包含映射至一个或多个标
签的关键词;
计算候选标签的权重,所述候选标签是在所述关键词词典中与所述目标关
键词存在映射关系的标签;
基于所述候选标签的权重选取目标标签,建立所述目标标签与所述目标数
据之间的关联关系。
2.根据权利要求1所述的标签关联方法,其特征在于,所述参照关键词词典
对所述目标数据进行匹配处理,得到目标关键词,包括:
对所述目标数据进行分词处理,以得到多个词语;
去除所述关键词词典中未包含的词语,剩余的词语为目标关键词。
3.根据权利要求1所述的标签关联方法,其特征在于,参照与所述目标关键
词存在映射关系的标签的数量计算所述候选标签的权重。
4.根据权利要求3所述的标签关联方法,其特征在于,若所述候选标签对应
多个目标关键词,则所述计算所述候选标签的权重包括:分别计算所述候
选标签对应每个关键词的得分,基于候选标签对应每个关键词的得分得到
所述候选标签的权重。
5.根据权利要求1所述的标签关联方法,其特征在于,还包括:建立关键词
词典,所述建立所述关键词词典包括:
获取分类体系数据;
参照所述分类体系数据得到标签和所述标签对应的数据;
对所述标签对应的数据和所述标签进行分词处理,将分词处理得到的关键
词映射至所述标签,以得到所述关键词词典。
6.根据权利要求5所述的标签关联方法,其特征在于,所述建立关键词词典
的方法包括:对所述关键词词典进行去重。
7.根据权利要求5所述的标签关联方法,其特征在于,所述建立关键词词典
的方法包括:
检测所述关键词词典中每个关键词映射的标签的数量;
去除映射的标签的数量大于阈值的关键词。
8.一种标签关联装置,其特征在于,包括:
匹配处理单元,对待进行标签关联的目标数据...
【专利技术属性】
技术研发人员:汤奇峰,叶峰,
申请(专利权)人:上海晶赞科技发展有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。