目标人群计算方法、装置、电子设备及介质制造方法及图纸

技术编号:37519649 阅读:15 留言:0更新日期:2023-05-12 15:41
本申请涉及大数据应用技术领域,特别涉及一种目标人群计算方法、装置、电子设备及介质,其中,方法包括:获取用户标识和非结构化的用户特征值;根据用户标识匹配非结构化的用户内容,计算非结构化的用户特征值和非结构化的用户内容之间的匹配关系;根据匹配关系建立非结构化的用户特征值与用户标识之间的关联关系,基于关联关系确定非结构化的用户特征值对应的人群包。由此,解决了相关技术中人群计算方法匹配用户人群不全面,导致适用性较差,无法满足业务需求等问题。满足业务需求等问题。满足业务需求等问题。

【技术实现步骤摘要】
目标人群计算方法、装置、电子设备及介质


[0001]本申请涉及大数据应用
,特别涉及一种目标人群计算方法、装置、电子设备及介质。

技术介绍

[0002]在业务过程中,用户会在业务系统中产生海量用户内容,当中会包含很多业务人员关心的问题信息,业务人员需要根据问题关键词找到相关用户人群进行访谈调研和洞察分析,然后利用数据标签与用户人群进行规则化匹配后进行用户人群计算。
[0003]目前人群计算是根据用户属性、订单行为、浏览搜索行为等数据标签,组合进行交并差计算,并利用代码将可视化的筛选条件转变为SQL(Structured Query Language,结构化查询语言)语句,从而在广泛的数据底表中捞取到一个符合营销定位的精准用户群体。而人群计算主要运用于站内外广告投放、营销消息推送、活动营销人群验证、会员购买等以市场营销为主的场景中。
[0004]相关技术中,人群计算方法思路多以结构化的用户特征标签的方式来计算人群包,用户特征标签是和用户唯一识别ID有关联的结构化的数据结构,这种做法虽然保证了匹配结果的精准度,但是在基于用户内容计算用户人群时,会丢失掉一部分和关键词不完全匹配但高度相关的用户内容及相关人群,造成匹配的用户人群较小,在特定情况下难以满足业务需求,适用性较差。

技术实现思路

[0005]本申请提供一种目标人群计算方法、装置、电子设备及介质,以解决相关技术中人群计算方法匹配用户人群不全面,导致适用性较差,无法满足业务需求等问题。
[0006]本申请第一方面实施例提供一种目标人群计算方法,包括以下步骤:获取用户标识和非结构化的用户特征值;根据所述用户标识匹配非结构化的用户内容,计算所述非结构化的用户特征值和所述非结构化的用户内容之间的匹配关系;根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,基于所述关联关系确定所述非结构化的用户特征值对应的人群包。
[0007]可选地,所述计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系,包括:识别所述非结构化的用户特征值中的预设关键词;对所述预设关键词和用户内容进行向量化处理,得到向量化的预设关键词和用户内容,基于所述向量化的预设关键词和用户内容计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系。
[0008]可选地,在对所述预设关键词和用户内容进行向量化处理之前,还包括:对所述用户内容进行分词处理,得到分词后的单词集合;去除所述分词后的单词集合中的停用词,得到去除停用词后的单词集合;遍历所述去除停用词后的单词集合去除重复词,得到去重后的单词集合。
[0009]可选地,所述向量化的用户内容包括向量化的单词,所述基于所述向量化的预设
关键词和用户内容计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系,包括:计算所述向量化的预设关键词和所述向量化的单词之间的相似度;若所述相似度大于匹配阈值,则判定所述非结构化的用户特征值和所述非结构化用户内容存在匹配关系,否则判定不存在匹配关系。
[0010]可选地,所述根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,包括:若目标人群为系统内人群,则基于所述匹配关系确定目标用户标识集合,并建立所述用户标识集合与所述用户特征值之间的映射关系;若目标人群为系统外部上传人群,将上传的外部用户标识集合和系统内用户唯一标识进行遍历匹配,得到目标用户标识集合,并建立所述目标用户标识集合与所述用户特征值之间的映射关系。
[0011]可选地,在基于所述关联关系确定所述非结构化的用户特征值对应的人群包之后,还包括:利用所述人群包分析用户内容的热词分布,并基于所述热词分布进行业务操作。
[0012]可选地,利用所述人群包分析用户内容的热词分布,包括:通过人群包内的用户标识计算与每个用户标识关联的用户内容;对所述用户内容进行分词处理、停用词处理和遍历去重处理,得到去重后的单词集合;利用所述去重后的单词集合确定所述热词分布。
[0013]本申请第二方面实施例提供一种目标人群计算装置,包括:获取模块,用于获取用户标识和非结构化的用户特征值;计算模块,用于根据所述用户标识匹配非结构化的用户内容,计算所述非结构化的用户特征值和所述非结构化的用户内容之间的匹配关系;建立模块,用于根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,基于所述关联关系确定所述非结构化的用户特征值对应的人群包。
[0014]本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的目标人群计算方法。
[0015]本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的目标人群计算方法。
[0016]由此,本申请至少具有如下有益效果:
[0017]本申请实施例改进非结构化用户特征值和用户内容之间的匹配方式,主要是通过输入非结构化的用户特征值,将其与用户唯一识别ID有关联的非结构化用户内容进行匹配计算,计算出匹配关系后,建立输入的非结构化特征值与用户唯一识别ID的关联关系,最终计算出输入的非结构化特征值关联的目标用户人群,从而保证匹配到的目标人群的准确度和适用性增高,满足业务人员的业务需求,提高工作效率。
[0018]本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
[0019]本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0020]图1为根据本申请实施例提供的一种目标人群计算方法的流程图;
[0021]图2为根据本申请实施例提供的基于内容计算目标人群的方法的流程图;
[0022]图3为根据本申请实施例的目标人群计算装置的方框示意图;
[0023]图4为根据本申请实施例的电子设备的结构示意图。
具体实施方式
[0024]下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
[0025]在业务过程中,用户会在业务系统中产生大量用户内容,当中会包含很多业务人员关心的问题信息,业务人员需要根据问题的关键词找到相关用户人群进行访谈调研和洞察分析,但目前可使用的用户人群计算方法偏向通过结构化的特征值,与用户人群进行规则化匹配,在基于非结构化的用户内容进行用户人群计算的适用度不足。
[0026]针对上述业务背景,本申请实施例的方法可以有效解决以下场景中的技术问题:
[0027](1)基于已有关键词内容找到相关用户人群;通过输入关键词内容,生成和该关键词相同或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标人群计算方法,其特征在于,包括以下步骤:获取用户标识和非结构化的用户特征值;根据所述用户标识匹配非结构化的用户内容,计算所述非结构化的用户特征值和所述非结构化的用户内容之间的匹配关系;根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,基于所述关联关系确定所述非结构化的用户特征值对应的人群包。2.根据权利要求1所述的方法,其特征在于,所述计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系,包括:识别所述非结构化的用户特征值中的预设关键词;对所述预设关键词和用户内容进行向量化处理,得到向量化的预设关键词和用户内容,基于所述向量化的预设关键词和用户内容计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系。3.根据权利要求2所述的方法,其特征在于,在对所述预设关键词和用户内容进行向量化处理之前,还包括:对所述用户内容进行分词处理,得到分词后的单词集合;去除所述分词后的单词集合中的停用词,得到去除停用词后的单词集合;遍历所述去除停用词后的单词集合去除重复词,得到去重后的单词集合。4.根据权利要求3所述的方法,其特征在于,所述向量化的用户内容包括向量化的单词,所述基于所述向量化的预设关键词和用户内容计算所述非结构化的用户特征值和所述非结构化用户内容之间的匹配关系,包括:计算所述向量化的预设关键词和所述向量化的单词之间的相似度;若所述相似度大于匹配阈值,则判定所述非结构化的用户特征值和所述非结构化用户内容存在匹配关系,否则判定不存在匹配关系。5.根据权利要求1所述的方法,其特征在于,所述根据所述匹配关系建立所述非结构化的用户特征值与所述用户标识之间的关联关系,包括:若目标人群为系统内人群,则基于...

【专利技术属性】
技术研发人员:杨春斌武丽鸿丁雪毅
申请(专利权)人:雄狮汽车科技南京有限公司奇瑞汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1