基于对比嵌入对齐的数据检测方法、装置、设备及介质制造方法及图纸

技术编号:46571612 阅读:1 留言:0更新日期:2025-10-10 21:17
本发明专利技术涉及数据处理技术领域,可应用于医疗健康及金融科技等业务系统平台中,公开了一种基于对比嵌入对齐的数据检测方法,包括:获取历史违规数据,对所述历史违规数据进行预处理;将预处理后的历史违规数据输入特征提取模块中进行训练,生成特征对齐模块;获取待检测数据,并对所述待检测数据进行预处理;将预处理后的待检测数据输入特征对齐模块进行特征提取,输出待检测嵌入向量;将所述待检测嵌入向量输入原型网络进行小样本分类,输出分类结果;根据规则引擎对所述分类结果进行违规识别,输出检测结果。本发明专利技术通过特征对齐优化消除域间差异,结合原型网络分类和规则引擎二次识别,实现高精度、高鲁棒性的违规内容检测。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于对比嵌入对齐的数据检测方法、装置、设备及存储介质。


技术介绍

1、随着互联网内容的爆炸式增长,违规内容检测(如暴力、仇恨言论、虚假信息等)已成为网络治理的核心挑战。传统检测方法主要依赖监督学习,需要大量标注数据来训练针对特定领域的模型。然而,在实际应用中,违规内容表现出明显的跨域多样性和动态演化性。例如,不同平台的内容分布存在显著差异,同时新型违规形式也在不断涌现。这些特性使得传统方法面临诸多问题:一方面,现有的域适应方法需要针对每个新领域重新训练模型,难以满足实时变化的检测需求;另一方面,常规的小样本学习方法在跨域场景下由于域偏移(domain shift)问题,性能会急剧下降。此外,现有的跨域对齐技术大多关注全局特征分布的匹配,却忽略了违规语义的细粒度对齐。

2、针对上述问题,现有研究尝试将对比学习与域适应技术相结合。例如,有研究提出了语义一致性约束的跨域小样本学习框架,但该框架未能显式建模违规类别的跨域不变性;还有研究通过异常感知对比对齐实现图数据的跨域检测,但这种方法难以泛化到非图结构的内容;此外本文档来自技高网...

【技术保护点】

1.一种基于对比嵌入对齐的数据检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于对比嵌入对齐的数据检测方法,其特征在于,所述获取历史违规数据,对所述历史违规数据进行预处理,具体包括:

3.如权利要求2所述的基于对比嵌入对齐的数据检测方法,其特征在于,所述将所述预处理后的历史违规数据输入特征提取模块中进行训练,生成特征对齐模块,包括:

4.如权利要求2所述的基于对比嵌入对齐的数据检测方法,其特征在于,所述将所述预处理后的历史违规数据输入共享编码器中,输出嵌入向量,包括:

5.如权利要求2所述的基于对比嵌入对齐的数据检测方法,其特...

【技术特征摘要】

1.一种基于对比嵌入对齐的数据检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于对比嵌入对齐的数据检测方法,其特征在于,所述获取历史违规数据,对所述历史违规数据进行预处理,具体包括:

3.如权利要求2所述的基于对比嵌入对齐的数据检测方法,其特征在于,所述将所述预处理后的历史违规数据输入特征提取模块中进行训练,生成特征对齐模块,包括:

4.如权利要求2所述的基于对比嵌入对齐的数据检测方法,其特征在于,所述将所述预处理后的历史违规数据输入共享编码器中,输出嵌入向量,包括:

5.如权利要求2所述的基于对比嵌入对齐的数据检测方法,其特征在于,所述将所述预处理后的历史违规数据输入特征提取模块中进行训练,生成特征对齐模块,还包括:

6.如权利要求2所述的基于对比嵌入对齐的数据检测方法,其特征在于,所述将所述预处理后的历史违规数据输入特征提...

【专利技术属性】
技术研发人员:舒畅陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1