【技术实现步骤摘要】
一种标签关联程度的确定方法及装置
本申请涉及互联网
,尤其涉及一种标签关联程度的确定方法及装置。
技术介绍
目前,针对微博等社交工具,可以把用户的关注对象所在分组的分组名称确定为用户标签,后续可以根据用户标签实现对用户的查找。比如,基于通过上述方式确定的用户标签“NBA”,当需要查找一批对“NBA”感兴趣的用户时,可以直接以该用户标签作为查询关键词,查找以该用户标签作为分组名称的分组,进而将查找到分组中的关注对象和/或设置该分组名称的用户确定为对“NBA”感兴趣的用户。可以理解,与该用户标签相关联的其他用户标签(如“NBA球星”等)作为分组名中的关注对象,其实也是对“NBA”感兴趣的用户,若能够获知与该用户标签相关联的所有用户标签,则可查找到非常多的对“NBA”感兴趣的用户。可见,确定用户标签之间的关联关系对于提高查找对象的全面性是非常重要的。现有技术中,为了确定与某用户标签相关联的标签,首先会建立一个基于常识、文化、学术等公知内容的多种类目的存在关联关系的标签库。当需要确定出与该用户标签存在关联关系的用户标签时,计算标签库中用户标签与选定的用户标签的共现频率,并选取共现频率大于设定的共现频率阈值的用户标签,作为该用户标签的关联标签。一般地,与任一用户标签的关联标签可以分为强关联标签和弱关联标签两种。“强关联”表示用户标签之间存在较强的关联关系;“弱关联”表示用户标签之间存在较弱的关联关系。如:“NBA球星”与“NBA”这两个用户标签就具有较强的关联关系,而相对“NBA球星”与“NBA”之间的关联关系,“球星”与“NBA”这两个用户标签的关联关系就较 ...
【技术保护点】
一种标签关联程度的确定方法,其特征在于,包括:确定同已有标签存在共现关系的用户标签与已有标签的编辑距离;其中,所述已有标签是根据用户特征信息生成的;根据所述编辑距离,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度。
【技术特征摘要】
1.一种标签关联程度的确定方法,其特征在于,包括:确定同已有标签存在共现关系的用户标签与已有标签的编辑距离;其中,所述已有标签是根据用户特征信息生成的,所述同已有标签存在共现关系的用户标签是指被分配到以已有标签作为分组名称的分组下的用户关注对象所属的其他分组的分组名称;根据所述编辑距离,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度。2.如权利要求1所述的方法,其特征在于,所述根据编辑距离,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度,具体包括:判断所述编辑距离是否大于设定的第一编辑距离阈值;在判断结果为否时,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度为强关联程度;在判断结果为是时,根据所述编辑距离、以及所述同已有标签存在共现关系的用户标签与所述已有标签的共现频率,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度;其中,所述共现频率是根据同一对象分别被分配到以所述已有标签作为分组名称的分组中的次数、和以所述同已有标签存在共现关系的用户标签作为分组名称的分组中的次数确定的。3.如权利要求2所述的方法,其特征在于,所述在判断结果为是时,根据所述编辑距离、以及所述同已有标签存在共现关系的用户标签与所述已有标签的共现频率,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度,具体包括:当所述编辑距离不大于设定的第二编辑距离阈值,且所述共现频率大于设定的第一共现频率阈值时,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度为强关联程度;其中,所述第二编辑距离阈值大于第一编辑距离阈值;当所述编辑距离大于设定的第二编辑距离阈值,且所述共现频率大于设定的第二共现频率阈值时,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度为强关联程度;其中,所述第二共现频率阈值大于第一共现频率阈值。4.如权利要求1至3任一权项所述的方法,其特征在于,采用下述方式,生成所述已有标签:获取用户特征信息;根据设定的标签生成方式以及用户特征信息,生成所述已有标签;其中,所述设定的标签生成方式包括下述方式中的一种或多种:根据与用户特征信息相关的行业术语,生成所述已有标签;根据与用户特征信息相关的行业认证信息,生成所述已有标签;根据与用户特征信息相关的拼音及拼音缩写,生成所述已有标签;根据与用户特征信息相关的英文表达方式及英文表达方式的缩写,生成所述已有标签;根据与用户特征信息相关的类目体系词汇,生成所述已有标签。5.如权利要求4所述的方法,其特征在于,根据设定的标签生成方式以及用户特征信息,生成所述已有标签,具体包括:按照设定的预处理方式,对所述用户特征信息进行处理,得到处理后的用户特征信息;根据设定的标签生成方式以及处理后的用户特征信息,生成所述已有标签...
【专利技术属性】
技术研发人员:李金奎,陈挺,郭艳波,
申请(专利权)人:微梦创科网络科技中国有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。