【技术实现步骤摘要】
本专利技术属于自然语言处理,尤其涉及一种群体成员识别方法、装置、计算机设备和存储介质。
技术介绍
1、群体成员识别指对社交媒体个体与群体进行成员关系识别,判断出个体是否归属该群体的过程。目前主要是基于用户的社交媒体相关信息如兴趣特征来进行群体成员识别,该方法利用浅层语义模型对兴趣主题进行表征,但由于兴趣主题的广泛性,使得挖掘准度较低。此外,在对于兴趣主题的立场倾向分析方面,现有技术主要基于文本中显式的立场倾向特征词进行判断,在判断隐式立场倾向特征词场景下,预测效果不理想。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高识别精确性的群体成员识别方法、装置、计算机设备和存储介质。
2、本专利技术提供一种群体成员识别方法,包括:
3、从社交媒体平台中获取个体数据和群体数据;其中,所述个体数据包括个体用户对应的第一文本言论,所述群体数据包括群体成员对应的第二文本言论;
4、根据所述第一文本言论和所述第二文本言论构建兴趣主题文本集合和兴趣主题关
<本文档来自技高网...【技术保护点】
1.一种群体成员识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本言论和所述第二文本言论构建兴趣主题文本集合和兴趣主题关键词集合,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据每一个所述兴趣主题对应的分词集合中分词的重要度评分,筛选得到所述兴趣主题对应的关键词集,组合所述关键词集得到兴趣主题关键词集合,包括:
4.根据权利要求1所述的方法,其特征在于,所述个体数据还包括所述第一文本言论对应的相关信息,所述相关信息包括发表时间、点赞数、转发数、评论数、引用数中任一项或多项;所述基于
...【技术特征摘要】
1.一种群体成员识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本言论和所述第二文本言论构建兴趣主题文本集合和兴趣主题关键词集合,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据每一个所述兴趣主题对应的分词集合中分词的重要度评分,筛选得到所述兴趣主题对应的关键词集,组合所述关键词集得到兴趣主题关键词集合,包括:
4.根据权利要求1所述的方法,其特征在于,所述个体数据还包括所述第一文本言论对应的相关信息,所述相关信息包括发表时间、点赞数、转发数、评论数、引用数中任一项或多项;所述基于第一兴趣主题文本集合与所述兴趣主题关键词集合构建得到个体兴趣特征表示向量,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一兴趣主题文本集合中的第一文本言论和所述兴趣主题关键词集合中所述第一文本言论对应兴趣主题的关键词集,分别检测所述第一兴趣主题文本集合中第一文本言论的兴趣立场标签,包...
【专利技术属性】
技术研发人员:易志翔,段炼,陈晖,张圣栋,黄九鸣,
申请(专利权)人:湖南四方天箭信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。