获取目标用户的方法及装置制造方法及图纸

技术编号:17196045 阅读:20 留言:0更新日期:2018-02-03 22:46
本发明专利技术适用于信息处理技术领域,提供了一种获取目标用户的方法及装置。该获取目标用户的方法包括:获取用户的社交账号发布的公开信息,所述公开信息包括信息内容和发布时间,并根据目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。该获取目标用户的方法充分考虑时间因素对目标用户获取的影响,从而能够更加准确地确定目标用户。

【技术实现步骤摘要】
获取目标用户的方法及装置
本专利技术属于信息处理
,尤其涉及一种获取目标用户的方法及装置。
技术介绍
通常在确定目标用户时,会基于用户行为数据中一些关键词或标识符对目标用户进行分类,进而选定目标用户。例如,用户浏览新生儿所使用的产品,则可以给该用户打上关注婴幼产品的标签。但是专利技术人在实现本专利技术的过程中发现现有技术至少存在以下不足:如果用户在若干前关注过某方面内容,例如新生儿相关内容,那么该用户可能现在已不太关注婴幼产品,因此上述方法并不能准确地确定目标用户。
技术实现思路
有鉴于此,本专利技术实施例提供了一种获取目标用户的方法及装置,以解决现有技术中未考虑时间因素对用户分类的影响而导致不能准确地确定目标用户的问题。本专利技术实施例的第一方面,提供了一种获取目标用户的方法,包括:获取用户的社交账号发布的公开信息,所述公开信息包括信息内容和发布时间,并根据目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;根据所确定的与所述目标特征信息相关的公开信息,确定所述用户是否为目标用户。本专利技术实施例的第二方面,提供了一种获取目标用户的装置,包括:信息获取模块,用于获取用户的社交账号发布的公开信息,所述公开信息包括信息内容和发布时间;确定模块,用于根据目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;处理模块,用于根据所述确定模块所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。本专利技术实施例相对于现有技术所具有的有益效果:本专利技术实施例,获取用户的社交账号发布的包括信息内容和发布时间的公开信息,并根据目标特征信息和各条公开信息确定与目标特征信息相关的公开信息,再根据所确定的与目标特征信息相关的各条公开信息,确定用户是否为目标用户,由于公开信息包括信息的发布时间,因此能够充分考虑时间因素对目标用户获取的影响,从而能够更加准确地确定目标用户。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的获取目标用户的方法的流程图;图2是图1中步骤S101的实现流程图;图3是本专利技术实施例提供的获取目标用户的方法的具体流程图;图4是图3中步骤S302的实现流程图;图5是图3中步骤S303的实现流程图;图6是本专利技术实施例提供的获取目标用户的装置的结构框图;图7是本专利技术实施例提供的获取目标用户的装置的结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。图1示出了本专利技术实施例提供的获取目标用户的方法的实现流程,详述如下:步骤S101,获取用户的社交账号发布的公开信息,所述公开信息包括信息内容和发布时间,并根据目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息。其中,社交账号包括但不限于微博账号和即时通信平台账号。用户的社交账号发布的公开信息可以为用户发布的与爱好、生活、工作等方面相关的公开信息,能够表征用户所关心的各个方面。而且由于公开信息包括信息内容和发布时间,因此公开信息还能够表征用户在各个时间段所关注或关心的各个方面。目标特征信息为预设的特征信息,用于确定用户中的目标用户,例如目标特征信息包括但不限于金融、体育和娱乐等。具体的,若目标特征信息为金融,而用户的社交账号发布的公开信息中包括金融信息,则该用户可能为目标账户。以下以社交账号为微博账号为例进行进一步说明,但并不以此为限。用户u的每一条微博信息的发布,都是具有时间信息的。基于微博信息的文本内容,使用不同方法为每一条微博信息wi设置不同类型的标签L。以某一标签l∈L为例,利用基于文本的标签分类算法(通常分类的结果为0/1取值,即该条微博信息是否与标签l相关),得到该用户u所有与标签l相关的微博信息集wu(l)={w1,w2,…,wn},其中n为该用户发布的微博信息中与标签l相关的微博信息条数,且n小于等于该用户u发布的所有微博信息数。其中,标签l表征该用户发布的微博信息对应一种特征信息,例如金融、体育或娱乐等。参见图2,一些实施例中,步骤S101中的所述根据目标特征信息和各条所述公开信息确定与所述分类标签相关的公开信息具体可以通过以下过程实现:步骤S201,提取各条所述公开信息的第一分类特征信息,所述第一分类特征信息包括关键词和/标识符。可以理解的,用户通过社交账号发布的公开信息中会包含用户的爱好、生活、工作等方面的分类特征信息,因此可以从用户发布的公开信息中提取包括关键词和/标识符的第一分类特征信息,以对各条公开信息进行分类。其中,关键词包括但不限于与用户的爱好、生活、工作等方面相关的词语,标识符包括但不限于与用户的爱好、生活、工作等方面相关的图片、表情等标示符。步骤S202,根据各条所述公开信息的第一分类特征信息和所述目标特征信息,确定各条所述公开信息与所述目标特征信息是否相关。其中,目标特征信息可以包括至少一个关键词和至少一个标识符。具体的,在步骤S201中提取出第一分类特征信息以后,可以将第一分类特征信息与目标特征信息进行匹配,若第一分类特征信息与目标特征信息匹配度大于第一阈值时,则判定该公开信息与目标特征信息相关,否则,判定该公开信息与目标特征信息不相关。例如,第一分类特征信息为关键词时,可以将第一分类特征信息与目标特征信息中的各个关键词进行匹配,若匹配成功,则判定该公开信息与目标特征信息相关,否则,判定该公开信息与目标特征信息不相关。又例如,第一分类特征信息为标识符时,可以将第一分类特征信息与目标特征信息中的标识符进行匹配,若匹配度大于第一阈值,则判定该公开信息与目标特征信息相关,否则,判定该公开信息与目标特征信息不相关。又例如,第一分类特征信息同时包括关键词和标识符时,可以对关键词或标识符设置优先级,按照优先级将第一分类特征信息与目标特征信息进行匹配。步骤S102,根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。其中,可以对所确定的与所述目标特征信息相关的各条公开信息与目标特征信息的相关度大小,确定所述用户是否为目标用户。具体的,可以对与所述目标特征信息相关的各条公开信息与目标特征信息的相关度大小取平均值,然后根据平均值与第二阈值的大小关系,确定所述用户是否为目标用户。例如,用户每发布一条新公开信息,都是有发布时间的。根据时间上,离当前最近的时效性最强的想法,可以使用sigmoid函数对标签l相关的公开信息wu(l)进行转化,得到新的权重值:其中,s和x0均为预设系数,x表征与分类特征信息l相关的公开信息的发布时间距离爬虫获取时间的时间差。所有与标签l相关的公开信息的权重值集合为根据各条公开信息对应的权重值的大小确定该用户是本文档来自技高网...
获取目标用户的方法及装置

【技术保护点】
一种获取目标用户的方法,其特征在于,包括:获取用户的社交账号发布的公开信息,所述公开信息包括信息内容和发布时间,并根据目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。

【技术特征摘要】
1.一种获取目标用户的方法,其特征在于,包括:获取用户的社交账号发布的公开信息,所述公开信息包括信息内容和发布时间,并根据目标特征信息和各条所述公开信息确定与所述目标特征信息相关的公开信息;根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户。2.根据权利要求1所述的获取目标用户的方法,其特征在于,还包括:获取用户的社交账号关注的目标账号信息,所述目标账号信息包括目标账号的分类信息和目标账号的排位信息,并根据所述目标特征信息和各个所述目标账号信息确定与所述目标特征信息相关的各条目标账号信息;所述根据所确定的与所述目标特征信息相关的各条公开信息,确定所述用户是否为目标用户具体为:根据所确定的与所述目标特征信息相关的各条公开信息和各条目标账号信息,确定所述用户是否为目标用户。3.根据权利要求2所述的获取目标用户的方法,其特征在于,所述根据目标特征信息和各条所述公开信息确定与所述分类标签相关的公开信息包括:提取各条所述公开信息的第一分类特征信息,所述第一分类特征信息包括关键词和/标识符;根据各条所述公开信息的第一分类特征信息和所述目标特征信息,确定各条所述公开信息与所述目标特征信息是否相关;所述根据所述目标特征信息和各个所述目标账号信息确定与所述目标特征信息相关的目标账号信息包括:提取各个所述目标账号信息的第二分类特征信息,所述第二分类特征信息包括关键词和/标识符;根据各个所述目标账号信息的第二分类特征信息和所述目标特征信息,确定各条所述目标账号信息与所述目标特征信息是否相关。4.根据权利要求2所述的获取目标用户的方法,其特征在于,所述根据所确定的与所述目标特征信息相关的公开信息和目标账号信息,确定所述用户是否为目标用户包括:根据所确定的与所述目标特征信息相关的公开信息和目标账号信息,建立所述用户的权重模型;根据所述用户的权重模型判定所述用户是否为目标用户。5.根据权利要求4所述的获取目标用户的方法,其特征在于,所述用户的权重模型具体为:其中,l表示一个分类特征信息,Su(l)为所述用户与分类特征信息l相关的权重,为所述用户在公开信息上与分类特征信息l相关的权重,为所述用户在目标账号信息上与分类特征信息l相关的权重,α∈[0,1],n为所述用户发布的与分类特征信息l相关的公开信息的条数,k为所述用户关注的与分类特征信息l相关的目标账号的个数;且其中,s和x0均为预设系数,x表征与分类特征信息l相关的公开信息的发布时间距离爬虫获取时间的时间差;其中,t和y0均为预设系数,y表征与分类...

【专利技术属性】
技术研发人员:王健宗黄章成吴天博肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1