一种获取目标用户的方法技术

技术编号:20916660 阅读:18 留言:0更新日期:2019-04-20 09:43
本发明专利技术提供一种获取目标用户的方法,所述方法包括:获取待分析数据集,所述待分析数据集中每个元素对应一个主题,每个元素中包括一类数据和二类数据,所述一类数据为直接发布的与所述主题相关的数据,所述二类数据为针对一类数据的评论数据;为所述待分析数据集中的每个元素构建有向图,得到有向图集;对所述有向图集中的各个有向图进行分析,选取对应所述有向图的热度用户;对于任意两个有向图,若存在相同的热度用户,则将所述热度用户认定为目标用户。本发明专利技术提供的智能目标用户获取方法具备智能化程度高,定位精准,适用范围广等多个显著优点。

A Method of Obtaining Target Users

The invention provides a method for acquiring the target user, which includes: acquiring the data set to be analyzed, each element of the data set to be analyzed corresponds to a subject, each element includes one kind of data and two kinds of data, the first kind of data is directly published data related to the subject, the second kind of data is commentary data for one kind of data; and the second kind of data is said to be waiting for. Each element in the data set is analyzed to construct a digraph and get a digraph set; each digraph in the digraph set is analyzed and the heat users corresponding to the digraph are selected; for any two digraphs, if there are the same heat users, the heat users are identified as the target users. The intelligent target user acquisition method provided by the invention has the advantages of high intelligence, accurate positioning, wide application range, etc.

【技术实现步骤摘要】
一种获取目标用户的方法
本专利技术涉及通信领域,尤其涉及一种获取目标用户的方法。
技术介绍
在互联网领域,信息推送已经成为一个十分重要的研究课题,而目标用户的定位精准度在很大程度上能够决定信息推送的成功率。比如,推送广告,如果目标用户不具有活跃性人格,甚至对于任何事物都不甚关心,则显然推送广告的效果将不甚理想。为此,对于目标用户的获取是具备较高的市场价值和应用价值的技术课题,然而,现有技术中缺乏对于目标用户进行精准定位的相关技术。
技术实现思路
为了解决上述技术问题,本专利技术提供一种获取目标用户的方法。本专利技术是以如下技术方案实现的:一种获取目标用户的方法,包括:获取待分析数据集,所述待分析数据集中每个元素对应一个主题,每个元素中包括一类数据和二类数据,所述一类数据为直接发布的与所述主题相关的数据,所述二类数据为针对一类数据的评论数据;为所述待分析数据集中的每个元素构建有向图,得到有向图集;对所述有向图集中的各个有向图进行分析,选取对应所述有向图的热度用户;对于任意两个有向图,若存在相同的热度用户,则将所述热度用户认定为目标用户。进一步地,所述为所述待分析数据集中的每个元素构建有向图包括:获取每个元素中的一类数据和二类数据,并构建有向图G,所述有向图可以被表示为G={V,E},其中V为用户标识,E代表一个用户标识发布的二类数据对另一个用户标识发布的一类数据的评论关系;计算有向图G中每条边的诚恳度权重和支持度权重;根据所述诚恳度权重和所述支持度权重计算所述边的综合权重。进一步地,还包括量化诚恳度权重的方法,包括:构建诚恳度量化表,所述诚恳度量化表包括字数区间和所述字数区间对应的诚恳度权重;得到每条边中起点用户对终点用户的回复的字数;根据所述诚恳度量化表查询所述字数所在的字数区间,并得到其对应的诚恳度权重。进一步地,还包括量化支持度权重的方法,包括:根据预设的感情词语表提取每条边中起点用户对终点用户的回复中的目标感情词语;获取目标感情词语对应的权重;取全部目标感情词语对应的权重的总和值作为支持度权重。进一步地,还包括热度用户的选取方法,包括:初始化有向图中各个顶点的热度值;任意选择一个顶点,根据所述顶点和指向所述顶点的各个相关顶点的当前热度计算所述顶点的迭代后热度,并将所述迭代后热度作为所述顶点的当前热度;按照上述步骤继续计算其它顶点的当前热度,直至所述有向图中各个顶点的当前热度趋于稳定;选取当前热度最大的N个用户作为所述有向图的热度用户。进一步地,迭代后热度热度值根据公式其中h(v)是所述顶点的当前热度,h(u)是指向所述顶点的相关顶点的当前热度,h′(v)是所述顶点的迭代后热度,χ是调节系数,其标识对于各种当前热度的考虑程度,U为所述顶点的各个相关顶点构成的集合,Z(u->v)为热度传递函数,其与指向所述顶点的相关顶点的拓扑结构有关。在本专利技术创造的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术创造和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术创造的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术创造的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本专利技术创造的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本专利技术创造中的具体含义。本专利技术的有益效果是:本专利技术实施例提供了一种获取目标用户的方法,其能够在待分析数据集中精准定位出对于各个主题参与度较高的用户,进而通过取交集的形式筛选出具有活跃性人格的用户,这部分用户通常对于新鲜事物接受度较高,可以作为推送相关信息的目标用户,本专利技术实施例提供的智能目标用户获取方法具备智能化程度高,定位精准,适用范围广等多个显著优点。附图说明图1是本实施例提供的一种获取目标用户的方法流程图;图2是本实施例提供的为所述待分析数据集中的每个元素构建有向图的流程图;图3是本实施例提供的量化诚恳度权重的方法的流程图;图4是本实施例提供的量化支持度权重的方法的流程图;图5是本实施例提供的热度用户的选取方法流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术作进一步地详细描述。本专利技术实施例提供一种获取目标用户的方法,如图1所示,所述方法包括:S101.获取待分析数据集,所述待分析数据集中每个元素对应一个主题,每个元素中包括一类数据和二类数据,所述一类数据为直接发布的与所述主题相关的数据,所述二类数据为针对一类数据的评论数据。S102.为所述待分析数据集中的每个元素构建有向图,得到有向图集。S103.对所述有向图集中的各个有向图进行分析,选取对应所述有向图的热度用户。所述热度用户可以认为是与所述有向图所在主题相关的热度比较高、影响力比较大的用户。S104.对于任意两个有向图,若存在相同的热度用户,则将所述热度用户认定为目标用户。对于单一主题进行分析,只能得到单一主题的大概的热度情况,选取部分热度用户,但是热度用户并不一定是高质量用户,原因在于,热度用户可能仅仅对于某个非常特殊的主题感兴趣,其它一概不关心,也很少参与,对于这种热度用户,若将其作为目标用户向其推送其它信息,比如广告、书籍、文献、视频、音乐等都可能无法得到较好的推送效果,因此,本专利技术实施例中创新性地从多个主题进行考虑,将能够对于至少两个主题进行积极参与的用户认定为目标用户,本专利技术实施例认为,参与多个主题能够在某种程度上说明用户为活跃性人格,对其推送相关信息将取得更好的推送效果。进一步地,所述为所述待分析数据集中的每个元素构建有向图如图2所示,包括:S1021.获取每个元素中的一类数据和二类数据,并构建有向图G,所述有向图可以被表示为G={V,E},其中V为用户标识,E代表一个用户标识发布的二类数据对另一个用户标识发布的一类数据的评论关系。举例而言,若用户spark发布了一个一类数据,用户tony,samby和dazzi对其进行了评论,则得到了包括四个顶点,三条有向边的数据网络元素,有向边为从tony指向spark,samby指向spark和dazzi指向spark的三条边。有向边的方向由发布二类数据的用户指向所述二类数据对应的一类数据的用户。具体地,有向图中可以包括多个发布一类数据的用户和多个发布二类数据的用户,而发布一类数据的用户也可以同时作为发布二类数据的用户,本专利技术实施例并不限定有向图的具体生成方法。S1022.计算有向图G中每条边的诚恳度权重和支持度权重。具体地,本专利技术实施例中从诚恳度和支持度两个方面评价每条边的权重。诚恳本文档来自技高网...

【技术保护点】
1.一种获取目标用户的方法,其特征在于,包括:获取待分析数据集,所述待分析数据集中每个元素对应一个主题,每个元素中包括一类数据和二类数据,所述一类数据为直接发布的与所述主题相关的数据,所述二类数据为针对一类数据的评论数据;为所述待分析数据集中的每个元素构建有向图,得到有向图集;对所述有向图集中的各个有向图进行分析,选取对应所述有向图的热度用户;对于任意两个有向图,若存在相同的热度用户,则将所述热度用户认定为目标用户。

【技术特征摘要】
1.一种获取目标用户的方法,其特征在于,包括:获取待分析数据集,所述待分析数据集中每个元素对应一个主题,每个元素中包括一类数据和二类数据,所述一类数据为直接发布的与所述主题相关的数据,所述二类数据为针对一类数据的评论数据;为所述待分析数据集中的每个元素构建有向图,得到有向图集;对所述有向图集中的各个有向图进行分析,选取对应所述有向图的热度用户;对于任意两个有向图,若存在相同的热度用户,则将所述热度用户认定为目标用户。2.根据权利要求1所述的方法,其特征在于,所述为所述待分析数据集中的每个元素构建有向图包括:获取每个元素中的一类数据和二类数据,并构建有向图G,所述有向图可以被表示为G={V,E},其中V为用户标识,E代表一个用户标识发布的二类数据对另一个用户标识发布的一类数据的评论关系;计算有向图G中每条边的诚恳度权重和支持度权重;根据所述诚恳度权重和所述支持度权重计算所述边的综合权重。3.根据权利要求2所述的方法,其特征在于:还包括量化诚恳度权重的方法,包括:构建诚恳度量化表,所述诚恳度量化表包括字数区间和所述字数区间对应的诚恳度权重;得到每条边中起点用户对终点用户的回复的字数;根据所述诚恳...

【专利技术属性】
技术研发人员:金涛江浩
申请(专利权)人:杭州铭智云教育科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1