一种基于用户情绪立场的用户画像建立方法及装置、用户画像的可视化方法制造方法及图纸

技术编号:28050026 阅读:24 留言:0更新日期:2021-04-14 13:07
本发明专利技术公开了一种基于用户情绪立场的用户画像建立方法及装置、用户画像的可视化方法,其中的用户画像建立方法包括:从用户历史数据中获取独立短文本语料;对获取的短文本语料根据情感倾向进行分类,并根据短文本语料分类结果中词语的分布情况,构建情感词库;根据应用场景构建立场触发词库;计算待分析语料块的情感概率;根据待分析语料块的情感概率,计算单个用户对应的立场触发词的情感概率;根据单个用户对应的立场触发词的情感概率,计算社群内立场触发词的平均情感概率,并根据平均情感概率进行排序;根据社群内立场触发词的排序情况和单个用户对立场触发词的情感概率,构建用户画像。本发明专利技术的方法可以提高用户情绪分析的准确性和直观性。的准确性和直观性。的准确性和直观性。

【技术实现步骤摘要】
一种基于用户情绪立场的用户画像建立方法及装置、用户画像的可视化方法


[0001]本专利技术涉及数据分析
,具体涉及一种基于用户情绪立场的用户画像建立方法及装置、用户画像的可视化方法。

技术介绍

[0002]用户在网络平台中的用户行为常常被用来描述一个用户的特征,这种用户特征被称为用户画像,而根据目的不同,构建用户画像的侧重点也会不同。例如电商平台侧重于用户的消费能力,购买偏好建立用户画像,而社交平台会基于用户的兴趣特点和社交关系建立用户画像,不同的用户画像会帮助平台对用户进行分类,更好的为用户实现定制化服务。
[0003]本申请专利技术人在实施本专利技术的过程中,发现现有技术的方法,至少存在如下技术问题:
[0004]现有技术中,在对用户进行情感分析时,其采用的情感词库中包含了大量的非网络用语和非日常用语的词汇,同时缺乏现今网络常用语的词汇,使得基于现有的情感词库的情感分析准确性和实用性有所限制。
[0005]由此可知,现有技术中的方法存在分析结果不够准确的技术问题。

技术实现思路
/>[0006]有鉴本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于用户情绪立场的用户画像建立方法,其特征在于,包括:从用户历史数据中获取独立短文本语料;对获取的短文本语料根据情感倾向进行分类,并根据短文本语料分类结果中词语的分布情况,构建情感词库,并计算情感词库中情感词的原始情感概率;其中,情感词库中包含正面情感词和负面情感词;根据应用场景构建立场触发词库,其中,立场触发词库中包含能够引起用户立场或情绪反应的立场触发词;提取出用户发布的文字信息中包含的立场触发词,并根据提取出的立场触发词组成待分析语料块,然后根据待分析语料块中情感词的情感概率、程度副词的数量和否定词的数量,计算待分析语料块的情感概率;根据待分析语料块的情感概率,计算单个用户对应的立场触发词的情感概率;根据单个用户对应的立场触发词的情感概率,计算由所有用户组成的社群内立场触发词的平均情感概率,并根据平均情感概率进行排序;根据社群内立场触发词的排序情况和单个用户对立场触发词的情感概率,构建用户画像。2.如权利要求1所述的方法,其特征在于,对获取的短文本语料根据情感倾向进行分类,并根据短文本语料分类结果中词语的分布情况,构建情感词库,并计算情感词库中情感词的情感概率,包括:对获取的短文本语料根据情感倾向进行分类,分为正向语料、中立语料和负向语料;将分类后的语料进行分词,并去冗余后得到语料词库;统计语料词库中的每一个词语在正向语料、中立语料和负向语料中的分布情况;根据词语的分布情况,结合卡方校验筛选出与正向、负向有关的词汇作为情感倾向的标志词候选;对标志词候选进行筛选,删除与对应情感倾向不匹配的词汇,构建情感词库;查找每一个正面情感词对应的所有原始语料,计算出正面情绪概率的平均值,作为正面情感词的原始情感概率,对于情感词库中的负面情感词,将1减去正面情绪概率的平均值的结果,作为负面情感词的原始情感概率。3.如权利要求1所述的方法,其特征在于,根据提取出的立场触发词组成待分析语料块,然后根据待分析语料块中情感词、程度副词和否定词的数量,计算待分析语料块的情感概率,包括:将提取出的立场触发词所在的句子以及前后n个句子组成待分析语料块,其中,n为大于等于1的正整数;查找待分析语料块中出现的正面情感词和负面情感词,并获取每个正面情感词和负面情感词的原始情感概率;根据每一个正面情感词和负面情感词,根据预设范围内否定词和程度副词的数量,确定否定系数和程度权重;根据情感词的原始情感概率、否定系数和程度权重,计算每个情感词的情感概率修正值;根据情感词的情感概率修正值、正面情感词的数量和负面情感词的数量,计算待分析
语料块的情感概率。4.如权利要求1所述的方法,其特征在于,根据待分析语料块的情感概率,计算单个用户对应的立场触发词的情感概率,包括:当立场触发词在用户发布的数...

【专利技术属性】
技术研发人员:刘垚邹更任钰欣黄梓杰
申请(专利权)人:武汉渔见晚科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1