基于文本关联特征的防诈骗智能预警方法技术

技术编号:40047366 阅读:24 留言:0更新日期:2024-01-16 20:40
本发明专利技术涉及数据处理技术领域,具体涉及基于文本关联特征的防诈骗智能预警方法,包括:将采集的诈骗文本数据集依次划分为若干个段落,并得到每个段落中的核心词语,获取每个段落中的骗术主题密度,由此筛选出异常段落,以及每个异常段落中的异常关联词,再获取每个异常段落的上下文关系矩阵、异常段落序列的间距特征行向量,由此获取诈骗文本数据集的诈骗特征,从而得到防诈骗检测结果。本发明专利技术通过分析文本的上下文关联特征、异常段落之间的间距特征,获取诈骗特征,提高诈骗特征的可信度,使用诈骗特征训练防诈骗检测模型,提高诈骗文本检测的准确性。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及基于文本关联特征的防诈骗智能预警方法


技术介绍

1、文本诈骗在其特征上较为口语化,不同于书面语结构紧凑、主题思路明确、用于规范的特点,其含有大量问答对话,且问答对话中信息相对重要、主题多变而且容易漂移、主题交织且组织结构混乱等特点,造成自然语言语义分析的困难。诈骗文本实体识别是为了识别文本中各种专有名词,包括人名、地名、机构、组织、金额、联系方式等信息,这对识别是否诈骗至关重要。目前通讯网络诈骗文本命名实体识别主要使用规则匹配技术,根据诈骗语句进行人工智能下的模型训练得到规则模板,使用模板去匹配提取命名实体。

2、现有的问题:当前在对于诈骗文本进行实体的语言特征构建时,只针对文本中的每一句作为独立特征去进行标签化和特征化,利用这些单个句子进行诈骗检测,并没有关注到诈骗文本句子之间的文本联系。因此随着有害文本的变种层出不穷,针对单个诈骗语句的模板匹配技术严重滞后,单个句子所含有的诈骗信息越来少,可能会降低诈骗文本检测的准确性。


技术实现思路

1、本专利技术提供基于文本文档来自技高网...

【技术保护点】

1.基于文本关联特征的防诈骗智能预警方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述根据所有段落中每种相同的核心词语的数量、每个段落和核心词语中的文字数量,得到每个段落中的骗术主题密度,包括的具体步骤如下:

3.根据权利要求2所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述根据每个段落中的文字数量、每个段落中所有种主题词语的数量、主题词语中的文字数量,得到每个段落中的骗术主题密度,包括的具体步骤如下:

4.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所...

【技术特征摘要】

1.基于文本关联特征的防诈骗智能预警方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述根据所有段落中每种相同的核心词语的数量、每个段落和核心词语中的文字数量,得到每个段落中的骗术主题密度,包括的具体步骤如下:

3.根据权利要求2所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述根据每个段落中的文字数量、每个段落中所有种主题词语的数量、主题词语中的文字数量,得到每个段落中的骗术主题密度,包括的具体步骤如下:

4.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述在段落序列中的所有段落中,根据每个段落中的骗术主题密度,筛选出异常段落,并得到异常段落序列,包括的具体步骤如下:

5.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述在异常段落序列中的相邻异常段落中,根据异常关联词种类序列中每种异常关联词的数量差异,得到每个异常段落的上下文关系矩阵,包括的具体步骤如下:

6.根据权利...

【专利技术属性】
技术研发人员:李涛
申请(专利权)人:深圳世纪网通数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1