一种基于多特征融合的群组线索发现方法技术

技术编号:44492038 阅读:41 留言:0更新日期:2025-03-04 17:57
本公开提供一种基于多特征融合的群组线索发现方法。包括两部分:基于多特征融合的重点群组识别模块和重点群组线索发现模块;基于多特征融合的重点群组识别模块经过位置编码后的词嵌入序列被输入到多层Transfor mer网络中利用自注意力机制进行深度特征提取;之后设计多专家混合模型对码值特征、文本特征的表征、降维后的统计特征进行特征融合与判别,具体而言,设计门控机制通过对输入特征进行分析,生成每个专家网络的加权系数,所述重点群组线索发现模块接收所述多专家混合模型的运算结果,通过基于大模型提示的文本线索发现和滑动窗口时序线索发现方法实现筛选重点组群,并得到组群筛选结果。

【技术实现步骤摘要】

本公开涉及计算机领域,更具体地讲,涉及一种基于多特征融合的群组线索发现方法


技术介绍

1、由于平台数据复杂性、多样性、实时性等特点导致的平台中流媒体信息传播媒介多样化,关键信息数据分布稀疏、占比极低、离散隐蔽等特点,这增加了平台中群组识别和获取群组线索的难度。此外,平台中的线索群组数据通常以多维度特征的形式出现,诸如文本、码值、统计信息等,而现有的方法大部分是对各类特征进行交互表征,并根据统一的表征来抽取多维度特征数据中的关键线索,但不同类别特征数据之间存在语义上的差别,因此现有方法难以学习到具有强关联属性的多维度特征,并且无法利用不同类别特征之间的内在联系和依赖关系辅助关键线索发现,从而导致模型抽取群组多维度特征的效果变差。


技术实现思路

1、本公开的实施例的目的在于提供一种基于多特征融合的群组线索发现方法,本专利技术的主要研究目标是更高效地识别和分析关键群体。

2、首先,本专利技术通过综合分析文本、编码值、统计信息等多种特征,识别出重点群组。这些特征包括但不限于文本语义特征、数值编码特征,以本文档来自技高网...

【技术保护点】

1.一种基于多特征融合的群组线索发现方法,其特征在于,包括两部分:基于多特征融合的重点群组识别模块和重点群组线索发现模块;

2.如权利要求1所述的一种基于多特征融合的群组线索发现方法,其特征在于,所述码值特征的分析方法为:关注在多个群组中重复出现或具有明显指向性的码值;

3.如权利要求2所述的一种基于多特征融合的群组线索发现方法,其特征在于,所述基于大模型提示的文本线索发现通过利用预训练的语言模型并设计合适的Prompt,模型在处理Prompt时,综合考虑文本中的词汇频率、语义关联以及情感表达,从而生成包含关键信息的输出,从而挖掘出与群组行为密切相关的文本线索,线...

【技术特征摘要】

1.一种基于多特征融合的群组线索发现方法,其特征在于,包括两部分:基于多特征融合的重点群组识别模块和重点群组线索发现模块;

2.如权利要求1所述的一种基于多特征融合的群组线索发现方法,其特征在于,所述码值特征的分析方法为:关注在多个群组中重复出现或具有明显指向性的码值;

3.如权利要求2所述的一种基于多特征融合的群组线索发现方法,其特征在于,所述基于大模型提示的文本线索发现通过利用预训练的语言模型并设计合适的prompt,模型在处理prompt时,综合考虑...

【专利技术属性】
技术研发人员:汤星詹嘉措景堃
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1