群体成员识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:45061406 阅读:41 留言:0更新日期:2025-04-25 18:07
本发明专利技术涉及自然语言处理技术领域,公开了一种群体成员识别方法、装置、计算机设备和存储介质,所述方法包括:根据个体用户对应的第一文本言论和群体中群体成员对应的第二文本言论构建兴趣主题文本集合和兴趣主题关键词集合;基于第一兴趣主题文本集合、第二兴趣主题文本集合分别与所述兴趣主题关键词集合构建个体兴趣特征表示向量和群体兴趣特征表示向量;对所述个体兴趣特征表示向量和群体兴趣特征表示向量进行一致性判断,根据输出的判别标签确定个体用户是否属于群体。该方法通过挖掘用户的兴趣特征进行群体成员识别,能够提高识别的精准性。

【技术实现步骤摘要】

本专利技术属于自然语言处理,尤其涉及一种群体成员识别方法、装置、计算机设备和存储介质


技术介绍

1、群体成员识别指对社交媒体个体与群体进行成员关系识别,判断出个体是否归属该群体的过程。目前主要是基于用户的社交媒体相关信息如兴趣特征来进行群体成员识别,该方法利用浅层语义模型对兴趣主题进行表征,但由于兴趣主题的广泛性,使得挖掘准度较低。此外,在对于兴趣主题的立场倾向分析方面,现有技术主要基于文本中显式的立场倾向特征词进行判断,在判断隐式立场倾向特征词场景下,预测效果不理想。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高识别精确性的群体成员识别方法、装置、计算机设备和存储介质。

2、本专利技术提供一种群体成员识别方法,包括:

3、从社交媒体平台中获取个体数据和群体数据;其中,所述个体数据包括个体用户对应的第一文本言论,所述群体数据包括群体成员对应的第二文本言论;

4、根据所述第一文本言论和所述第二文本言论构建兴趣主题文本集合和兴趣主题关键词集合;

<本文档来自技高网...

【技术保护点】

1.一种群体成员识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本言论和所述第二文本言论构建兴趣主题文本集合和兴趣主题关键词集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据每一个所述兴趣主题对应的分词集合中分词的重要度评分,筛选得到所述兴趣主题对应的关键词集,组合所述关键词集得到兴趣主题关键词集合,包括:

4.根据权利要求1所述的方法,其特征在于,所述个体数据还包括所述第一文本言论对应的相关信息,所述相关信息包括发表时间、点赞数、转发数、评论数、引用数中任一项或多项;所述基于第一兴趣主题文本集合...

【技术特征摘要】

1.一种群体成员识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本言论和所述第二文本言论构建兴趣主题文本集合和兴趣主题关键词集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据每一个所述兴趣主题对应的分词集合中分词的重要度评分,筛选得到所述兴趣主题对应的关键词集,组合所述关键词集得到兴趣主题关键词集合,包括:

4.根据权利要求1所述的方法,其特征在于,所述个体数据还包括所述第一文本言论对应的相关信息,所述相关信息包括发表时间、点赞数、转发数、评论数、引用数中任一项或多项;所述基于第一兴趣主题文本集合与所述兴趣主题关键词集合构建得到个体兴趣特征表示向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述第一兴趣主题文本集合中的第一文本言论和所述兴趣主题关键词集合中所述第一文本言论对应兴趣主题的关键词集,分别检测所述第一兴趣主题文本集合中第一文本言论的兴趣立场标签,包...

【专利技术属性】
技术研发人员:易志翔段炼陈晖张圣栋黄九鸣
申请(专利权)人:湖南四方天箭信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1