一种基于论坛用户言论的品牌亲密度计算方法技术

技术编号:20389817 阅读:22 留言:0更新日期:2019-02-20 02:50
本发明专利技术公开了一种基于论坛用户言论的品牌亲密度计算方法,包括以下步骤:获取用户的所有言论并打上设定好的标签,通过预先训练的词向量和深度态度预测模型,输出该用户对不同品牌的态度;获取用户的所有言论打上标签,输出该用户对不同品牌的行为标签;结合用户对品牌的态度、行为和该用户对其他品牌的态度,计算出用户对每个品牌的亲密度。本发明专利技术通过建模实现了精确的人群划分,可以有效帮助企业进行市场和用户群体分析。

【技术实现步骤摘要】
一种基于论坛用户言论的品牌亲密度计算方法
本专利技术涉及计算机领域及市场营销理论,具体涉及机器学习领域,尤其涉及自然语言处理中的情感分析任务以及人群分类任务。
技术介绍
近年来,社交网络发展迅速,越来越多的内容由网络用户自己产生,一些特定群体的用户通常会在一些特定论坛上讨论一些共同话题,这些特定的个性化信息中蕴含着大量用户的个人喜好和关注对象,通过这些言论数据可以帮助品牌更好的了解用户的需求和体验,可以帮助品牌提升、改善品牌形象,也有助于发现新的市场增长点,对于平台来说,也能帮助平台方理解用户行为,有助于合作精准投放。当前,传统的人群划分通常是根据一些用户的固有属性进行人群划分,例如利用用户的个人资料等静态信息进行人群划分,这种人群划分通常比较片面,而企业在做品牌市场研究的时候,除了以上固有信息外,用户的态度及行为动作也能直接反应用户对品牌的行为偏好,如果运用以上粗矿的人群划分方法,企业的研究结果只能是一个笼统的结果,并不能很精确地得出用户对品牌的亲密度,因此,现有技术中还缺少一种结合用户固有属性和用户的态度、行为以及用户对其他品牌的态度来判断用户对品牌亲密度的方法。
技术实现思路
针对上述技术问题,本专利技术提供了一种基于论坛用户言论的品牌亲密度计算方法,包括以下步骤:步骤S1:获取用户的所有言论并打上设定好的标签,通过预先训练的词向量和深度态度预测模型,输出该用户对不同品牌的态度;步骤S2:获取用户的所有言论打上标签,输出该用户对不同品牌的行为标签;步骤S3:结合用户对品牌的态度、行为和该用户对其他品牌的态度,计算出用户对每个品牌的亲密度。进一步地,所述步骤S1还包括:S101:提取用户的所有言论,并从中找出涉及某个具体品牌的文本;S102:对所述文本进行分词获得词向量,再将所述词向量输入已经训练好的态度预测模型;S103:根据预设表格生成每个用户对每个实体的态度。进一步地,所述词向量是根据Glove模型训练好的300维度词向量。进一步地,所述态度预测模型是双向LSTM结构。进一步地,所述步骤S2还包括:S201:根据用户的言论,对实体打上行为的标签;S202:根据用户对这个品牌最近的一次言论的行为作为行为标准。进一步地,所述行为的标签包括正用、曾用、将用和仅提及,所述S202的行为标准为用户对这个品牌最近的一次言论的非仅提及行为,若用户对这个品牌没有非仅提及行为,则以最近一次仅提及行为作为行为准则。进一步地,所述步骤S3还包括:S301:根据从实际情况出发定制的记分规则,结合用户对每个实体的态度及行为,输出用户对每个品牌的亲密度得分;S302:考虑竞争环境,对得分进行调整;S303:按照行为优先的规则,对得分再进行调整,最终得到用户对每个品牌的亲密度得分。进一步地,根据步骤S3计算的品牌亲密度分值,将每个用户划分成品牌相对应的人群。进一步地,所述人群根据亲密度分值由低至高划分成流失用户、考虑用户、偏好用户以及忠诚用户。本专利技术取得的有益效果在于:首先,本专利技术的基于论坛用户言论的品牌亲密度计算方法是一种只基于文本分析的创新的市场人群分类方法,目前大部分的文本分析通常是针对句子或一段文本的,本专利技术则是基于一个用户的所有言论,并考虑到时间的先后顺序以及用户的态度变化;其次,目前应用交广的人群分类大部分都是通过人群的属性或者一些标签对人群进行分类,本专利技术则通过结合用户固有属性和用户的态度、行为以及用户对其他品牌的态度来对人群进行了精确划分,有助于企业更具体地观察市场品牌的竞争力和市场占有情况,并且能帮助企业根据不同的人群来进行更具有针对性的市场情况分析。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例的基于论坛用户言论的品牌亲密度计算方法的流程图;图2是本专利技术一实施例的态度输出流程图;图3是本专利技术一实施例的行为标签输出流程图。具体实施方式为了便于本领域技术人员的理解,下面结合实施例与附图对本专利技术作进一步的说明,实施方式提及的内容并非对本专利技术的限定。如图1所示,本专利技术的一实施例中,使用本申请的基于论坛用户言论的品牌亲密度计算方法来预测某一母婴论坛的用户对各纸尿裤品牌的亲密度,步骤包括:S1:获取用户的所有言论并打上设定好的标签,通过预先训练的词向量和深度态度预测模型,输出该用户对不同品牌的态度;根据母婴论坛用户的ID(user_id)获取用户的所有文本数据(content),每个文本有对应的ID标记(id)和发言时间(created_at),再根据实际情况,对每条ID记录打上实体(品牌)和方面(维度)的标签,如果一条文本数据只提及实体而未提及具体的方面,则方面的标签为NULL,下述表1是文本数据的实体和方面标签的具体例子,表中第一列记录文本数据的ID标记,第二列记录用户的发言文本数据,第三列记录用户的ID,第四列记录文本数据的实体标签,第五列记录文本数据的方面标签。[表1]文本数据的实体和方面标签表本实施例的态度预测过程中,对文本数据用jieba进行分词,加入自定义的词典,分词之后的词向量用的是利用母婴论坛文本根据Glove模型训练出的词向量,输入的结构是双向LSTM。根据表1打上的标签,将数据输入态度预测模型,模型根据训练的结果输出每条文本数据对应实体及方面的态度,下述表2是文本数据对应实体及方面的态度的具体例子,表中第一列记录文本数据的ID标记,第二列记录用户的发言文本数据,第三列记录文本数据的实体标签,第四列记录文本数据的方面标签,第五列记录文本数据对应实体及方面的态度。[表2]文本数据对应实体及方面的态度表态度的输出类型有五种,分别是:正面:用户对实体和方面组合表达了明确的正向、肯定的态度;中性:用户对实体和方面组合表达了明确的中性、一般的态度;负面:用户对实体和方面组合表达了明确的负面、否定的态度;疑问:用户对实体和方面组合表达了疑问、不明确的态度;未提及:虽然用户的言论被实体和方面标记,但是用户并未对这个组合表达过态度。这五种态度分别表示了用户的言论中对实体的五种客观评价,这五种分类是结合业务总结出的结果,能比较好的帮助品牌研究用户行为以及帮助品牌研究自己的市场和行业状况。进一步地,由于每个用户对一个实体(品牌)都可能发表过多次言论,且每次提到的维度(方面)和态度都不相同,这个时候该用户对于这个实体(品牌)的态度会按照新的规则,即一个用户对一个实体(品牌)只有一个态度:排除掉未提及的文本,若该用户对该实体的态度只有正面和中性,则认为总体是正面;若该用户对该实体的态度只有负面和中性,则认为总体是负面;若该用户对该实体的态度只有中性,则认为总体是中性;其他的情况则认为总体是疑问,下述表3是根据以上规则所得到的用户001对各品牌的态度,表中第一列记录文本数据的ID标记,第二列记录用户的ID,第三列记录对应实体,第四列记录对应态度。[表3]用户001对各品牌态度结果iduser_id实体态度000001001品牌A正面000001001品牌B负面000002001品牌C本文档来自技高网...

【技术保护点】
1.一种基于论坛用户言论的品牌亲密度计算方法,其特征在于,包括:步骤S1:获取用户的所有言论并打上设定好的标签,通过预先训练的词向量和深度态度预测模型,输出该用户对不同品牌的态度;步骤S2:获取用户的所有言论打上标签,输出该用户对不同品牌的行为标签;步骤S3:结合用户对品牌的态度、行为和该用户对其他品牌的态度,计算出用户对每个品牌的亲密度。

【技术特征摘要】
1.一种基于论坛用户言论的品牌亲密度计算方法,其特征在于,包括:步骤S1:获取用户的所有言论并打上设定好的标签,通过预先训练的词向量和深度态度预测模型,输出该用户对不同品牌的态度;步骤S2:获取用户的所有言论打上标签,输出该用户对不同品牌的行为标签;步骤S3:结合用户对品牌的态度、行为和该用户对其他品牌的态度,计算出用户对每个品牌的亲密度。2.如权利要求1所述的基于论坛用户言论的品牌亲密度计算方法,其特征在于,所述步骤S1包括:S101:提取用户的所有言论,并从中找出涉及某个具体品牌的文本;S102:对所述文本进行分词获得词向量,再将所述词向量输入已经训练好的态度预测模型;S103:根据预设表格生成每个用户对每个品牌的态度。3.如权利要求2所述的基于论坛用户言论的品牌亲密度计算方法,其特征在于,所述词向量是根据Glove模型训练好的300维度词向量。4.如权利要求2所述的基于论坛用户言论的品牌亲密度计算方法,其特征在于,所述态度预测模型是双向LSTM结构,所述态度预测模型输出的态度有五种类型:正面:用户对实体和方面组合表达了明确的正向、肯定的态度;中性:用户对实体和方面组合表达了明确的中性、一般的态度;负面:用户对实体和方面组合表达了明确的负面、否定的态度;疑问:用户对实体和方面组合表达了疑问、不明确的态度;未提及:虽然用户的言论被实体和方面标记,但是用户并未对这个组合表达过态度。5.如权利要求1所述的基于论坛用户言论...

【专利技术属性】
技术研发人员:杨骏
申请(专利权)人:上海宏原信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1