【技术实现步骤摘要】
本公开涉及计算机领域,更具体地讲,涉及一种基于多特征融合的群组线索发现方法。
技术介绍
1、由于平台数据复杂性、多样性、实时性等特点导致的平台中流媒体信息传播媒介多样化,关键信息数据分布稀疏、占比极低、离散隐蔽等特点,这增加了平台中群组识别和获取群组线索的难度。此外,平台中的线索群组数据通常以多维度特征的形式出现,诸如文本、码值、统计信息等,而现有的方法大部分是对各类特征进行交互表征,并根据统一的表征来抽取多维度特征数据中的关键线索,但不同类别特征数据之间存在语义上的差别,因此现有方法难以学习到具有强关联属性的多维度特征,并且无法利用不同类别特征之间的内在联系和依赖关系辅助关键线索发现,从而导致模型抽取群组多维度特征的效果变差。
技术实现思路
1、本公开的实施例的目的在于提供一种基于多特征融合的群组线索发现方法,本专利技术的主要研究目标是更高效地识别和分析关键群体。
2、首先,本专利技术通过综合分析文本、编码值、统计信息等多种特征,识别出重点群组。这些特征包括但不限于文本语义特
...【技术保护点】
1.一种基于多特征融合的群组线索发现方法,其特征在于,包括两部分:基于多特征融合的重点群组识别模块和重点群组线索发现模块;
2.如权利要求1所述的一种基于多特征融合的群组线索发现方法,其特征在于,所述码值特征的分析方法为:关注在多个群组中重复出现或具有明显指向性的码值;
3.如权利要求2所述的一种基于多特征融合的群组线索发现方法,其特征在于,所述基于大模型提示的文本线索发现通过利用预训练的语言模型并设计合适的Prompt,模型在处理Prompt时,综合考虑文本中的词汇频率、语义关联以及情感表达,从而生成包含关键信息的输出,从而挖掘出与群组行为密
...【技术特征摘要】
1.一种基于多特征融合的群组线索发现方法,其特征在于,包括两部分:基于多特征融合的重点群组识别模块和重点群组线索发现模块;
2.如权利要求1所述的一种基于多特征融合的群组线索发现方法,其特征在于,所述码值特征的分析方法为:关注在多个群组中重复出现或具有明显指向性的码值;
3.如权利要求2所述的一种基于多特征融合的群组线索发现方法,其特征在于,所述基于大模型提示的文本线索发现通过利用预训练的语言模型并设计合适的prompt,模型在处理prompt时,综合考虑...
【专利技术属性】
技术研发人员:汤星,詹嘉措,景堃,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。