一种基于大数据的传播主张和消费者故事分析方法及系统技术方案

技术编号:32454292 阅读:21 留言:0更新日期:2022-02-26 08:28
本发明专利技术公开了一种基于大数据的传播主张和消费故事分析方法及系统,方法包括:S1:获取消费者互联网数据;S2:利用要素挖掘算法对获取的数据进行挖掘输出和目标消费者关注品类相关的概念要素;S3:对概念要素进行分类,然后对每一类元素进行数据分析,根据数据分析结果进行故事模型打分;S4:根据消费者的不同需求将要素整合成不同要素组合,将每个组合中的要素进行两两关联,计算每个要素组合的关联声量,将关联声量最大的要素组合作为最优组合;S5:将两两关联的要素组合表示成桑基图,利用桑基图在关注的要素点范围内,挖掘和扩展出要素内容。本发明专利技术提高了数据处理分析效率,减少了人工投入,通过要素的拆解组合,提供了便捷的新故事生成路径。的新故事生成路径。的新故事生成路径。

【技术实现步骤摘要】
一种基于大数据的传播主张和消费者故事分析方法及系统


[0001]本专利技术涉及大数据分析
,更具体地,涉及一种基于大数据的传播主张和消费者故事分析方法及系统。

技术介绍

[0002]传播主张研究对企业洞察市场而言至关重要。无论是市场研究部进行消费者营销洞察,还是市场部对产品/品牌定位、声明品牌/活动营销传播主张、广告创意生产以及公关内容生产,都离不开对传播主张研究,并从中分析总结出消费者故事。
[0003]然而,互联网中用户生产内容(UGC)声音大多杂乱无序,表现为发声平台的多元分散、数据杂乱难以收集进行统计分析以及声音质量参差不齐。传统的分析研究方法难以深入剖析蕴含在大数据信息背后的传播主张,并构建出消费者故事。这导致在传统研究方法和技术下,传播主张的洞察十分低效,企业对于诸如“他们是谁,基于什么场景购买?市场的解决方案有什么痛点?还有什么潜在需求?”等与消费者认知密切相关的问题,无法有系统全面的认知和把握。
[0004]现有技术中,公开号为:CN106779827A中国专利技术专利,于2017年5月31日公开了一种互联网用户行为采集及分析检测的大数据方法,包括:(1)数据的搜集和预处理;(2)数据分析及挖掘;(3)对数据分析的结果加以利用。搜集互联网用户数据,主要是微博、qq、微信数据,包括用户的个人基本信息和网络发言数据;以及主要的互联网商业数据,包括电商,行业论坛,门户网站的相关频道,主要是商品,商品销量,以及用户评价等;通过自建计算集群来进行上述搜集,根据公开的信息去预测、补全未公开的信息,如年龄预测等。该方案虽然获取互联网用户行为数据进行分析,但并没有对传播主张进行分析,没有对消费者故事实现精细化分析与研究。

技术实现思路

[0005]本专利技术为克服上述现有技术缺少基于大数据的传播主张和消费者故事分析的缺陷,提供一种基于大数据的传播主张和消费者故事分析方法及系统。
[0006]本专利技术的首要目的是为解决上述技术问题,本专利技术的技术方案如下:
[0007]一种基于大数据的传播主张和消费故事分析方法,包括以下步骤:
[0008]S1:获取消费者互联网数据;
[0009]S2:利用要素挖掘算法对获取的数据进行挖掘输出和目标消费者关注品类相关的概念要素;
[0010]S3:对概念要素进行分类,然后对每一类元素进行数据分析,根据数据分析结果进行故事模型打分;
[0011]S4:根据消费者的不同需求将要素整合成不同要素组合,将每个组合中的要素进行两两关联,计算每个要素组合的关联声量,将关联声量最大的要素组合作为最优组合;
[0012]S5:将两两关联的要素组合表示成桑基图,利用桑基图在关注的要素点范围内,挖
掘和扩展出要素内容。
[0013]进一步地,所述消费者互联网数据获取的渠道包括:通用型社交媒体、论坛网站、行业垂直论坛。
[0014]进一步地,步骤S2所述利用要素挖掘算法对获取的数据进行挖掘输出和目标消费者关注品类相关的概念要素具体步骤为:
[0015]确定标注的要素;
[0016]对训练数据进行标注;
[0017]利用微调预训练模型的方法对现有的命名实体识别模型进行预训练,使命名实体识别模型学习标注数据中的信息;
[0018]将要分析的文本输入至训练好的命名实体识别模型,输出概念要素。
[0019]进一步地,步骤S3中对概念要素进行分类,然后对每一类元素进行数据分析,根据数据分析结果对进行故事模型打分具体步骤为:
[0020]将概念要素分为五种类型,对每种要素类型进行数据分析,所述数据分析包括:基于声量的热度排行和上升速度排行分析;
[0021]将数据分析结果输入至故事模型进行打分,得到消费者故事分数。
[0022]进一步地,所述基于声量的热度排行通过目标要素在筛选的时间范围内在互联网出现的文章提及声量值来计算得到;所述上升速度排行则通过目标要素在过去一段时间内,每个月的声量的增长情况来计算得到。
[0023]进一步地,故事模型通过三个方面指标进行打分即:故事类型、文章中人物的情绪、故事的整体丰富度。
[0024]进一步地,步骤S4所述的根据消费者的不同需求将要素进行整合成不同要素组合,其中,以消费者的情感诉求为需求的组合包括要素类型有:情感需求,自我描述,需求场景;以消费者的产品体验为需求的组合包括要素类型有:产品痛点,自我描述,使用场景。
[0025]进一步地,步骤S4的具体过程为:
[0026]根据消费者的不同需求将要素整合成不同要素组合,将每个组合中的要素进行两两关联,计算每个要素组合的关联声量,将关联声量最大的要素组合作为对应类型组合的最优解,用户的需求和具体诉求计算出推荐指数,输出最优组合。
[0027]进一步地,在桑基图中两个要素之间的连线的粗细代表两个要素关联度的高低,连线越粗代表两个要素的关联越高,连线越细,代表两个要素关联度越低。
[0028]本专利技术第二方面提供了一种基于大数据的传播主张和消费者故事分析系统,包括存储器和处理器,所述存储器中包括基于大数据的传播主张和消费者故事分析方法程序,所述基于大数据的传播主张和消费者故事分析方法程序被所述处理器执行时实现如下步骤:
[0029]S1:获取消费者互联网数据;
[0030]S2:利用要素挖掘算法对获取的数据进行挖掘输出和目标消费者关注品类相关的概念要素;
[0031]S3:对概念要素进行分类,然后对每一类元素进行数据分析,根据数据分析结果进行故事模型打分;
[0032]S4:根据消费者的不同需求将要素整合成不同要素组合,将每个组合中的要素进
行两两关联,计算每个要素组合的关联声量,将关联声量最大的要素组合作为最优组合;
[0033]S5:将两两关联的要素组合表示成桑基图,利用桑基图在关注的要素点范围内,挖掘和扩展出要素内容。
[0034]与现有技术相比,本专利技术技术方案的有益效果是:
[0035]本专利技术基于获取的消费者互联网数据,通过要素提取、分类、故事打分,进一步通过要素关联得到最优组合,同时基于两两关联的要素能够挖掘和扩展出要素内容,本专利技术提高了数据处理分析效率,自动化的分析过程减少人工投入,通过要素的拆解组合,提供了便捷的新故事生成路径。
附图说明
[0036]图1为本专利技术一种基于大数据的传播主张和消费故事分析方法流程图。
[0037]图2为本专利技术实施例桑基图结合知识图谱工具扩展出的要素内容示意图。
[0038]图3为本专利技术一种基于大数据的传播主张和消费故事分析系统框图。
具体实施方式
[0039]为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0040]在下面的描述中阐述了很多具体细节以便于充分理解本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的传播主张和消费故事分析方法,其特征在于,包括以下步骤:S1:获取消费者互联网数据;S2:利用要素挖掘算法对获取的数据进行挖掘输出和目标消费者关注品类相关的概念要素;S3:对概念要素进行分类,然后对每一类元素进行数据分析,根据数据分析结果进行故事模型打分;S4:根据消费者的不同需求将概念要素整合成不同要素组合,将每个组合中的要素进行两两关联,计算每个要素组合的关联声量,将关联声量最大的要素组合作为最优组合;S5:将两两关联的要素组合表示成桑基图,利用桑基图在关注的要素点范围内,挖掘和扩展出要素内容。2.根据权利要求1所述的一种基于大数据的传播主张和消费者故事分析方法,其特征在于,所述消费者互联网数据获取的渠道包括:通用型社交媒体、论坛网站、行业垂直论坛。3.根据权利要求1所述的一种基于大数据的传播主张和消费者故事分析方法,其特征在于,步骤S2所述利用要素挖掘算法对获取的数据进行挖掘输出和目标消费者关注品类相关的概念要素具体步骤为:确定标注的要素;对训练数据进行标注;利用微调预训练模型的方法对现有的命名实体识别模型进行预训练,使命名实体识别模型学习标注数据中的信息;将要分析的文本输入至训练好的命名实体识别模型,输出概念要素。4.根据权利要求1所述的一种基于大数据的传播主张和消费者故事分析方法其特征在于,步骤S3中对概念要素进行分类,然后对每一类元素进行数据分析,根据数据分析结果进行故事模型打分具体步骤为:将概念要素分为五种类型,对每种要素类型进行数据分析,所述数据分析包括:基于声量的热度排行和上升速度排行分析;将数据分析结果输入至故事模型进行打分,得到消费者故事分数。5.根据权利要求4所述的一种基于大数据的传播主张和消费者故事分析方法其特征在于,所述基于声量的热度排行通过目标要素在筛选的时间范围内在互联网出现的文章提及声量值来计算得到;所述上升速度排行则通过目标要素在过去一段时间内,每个月的声量的增长情况来计算得到。6.根据权利要...

【专利技术属性】
技术研发人员:佘骏佳徐亚波李旭日王佳烁王可惠李剑何宇轩
申请(专利权)人:广州数说故事信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1