【技术实现步骤摘要】
本专利技术涉及数据处理,具体涉及基于文本关联特征的防诈骗智能预警方法。
技术介绍
1、文本诈骗在其特征上较为口语化,不同于书面语结构紧凑、主题思路明确、用于规范的特点,其含有大量问答对话,且问答对话中信息相对重要、主题多变而且容易漂移、主题交织且组织结构混乱等特点,造成自然语言语义分析的困难。诈骗文本实体识别是为了识别文本中各种专有名词,包括人名、地名、机构、组织、金额、联系方式等信息,这对识别是否诈骗至关重要。目前通讯网络诈骗文本命名实体识别主要使用规则匹配技术,根据诈骗语句进行人工智能下的模型训练得到规则模板,使用模板去匹配提取命名实体。
2、现有的问题:当前在对于诈骗文本进行实体的语言特征构建时,只针对文本中的每一句作为独立特征去进行标签化和特征化,利用这些单个句子进行诈骗检测,并没有关注到诈骗文本句子之间的文本联系。因此随着有害文本的变种层出不穷,针对单个诈骗语句的模板匹配技术严重滞后,单个句子所含有的诈骗信息越来少,可能会降低诈骗文本检测的准确性。
技术实现思路
1、
...【技术保护点】
1.基于文本关联特征的防诈骗智能预警方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述根据所有段落中每种相同的核心词语的数量、每个段落和核心词语中的文字数量,得到每个段落中的骗术主题密度,包括的具体步骤如下:
3.根据权利要求2所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述根据每个段落中的文字数量、每个段落中所有种主题词语的数量、主题词语中的文字数量,得到每个段落中的骗术主题密度,包括的具体步骤如下:
4.根据权利要求1所述基于文本关联特征的防诈骗智能预警
...【技术特征摘要】
1.基于文本关联特征的防诈骗智能预警方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述根据所有段落中每种相同的核心词语的数量、每个段落和核心词语中的文字数量,得到每个段落中的骗术主题密度,包括的具体步骤如下:
3.根据权利要求2所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述根据每个段落中的文字数量、每个段落中所有种主题词语的数量、主题词语中的文字数量,得到每个段落中的骗术主题密度,包括的具体步骤如下:
4.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述在段落序列中的所有段落中,根据每个段落中的骗术主题密度,筛选出异常段落,并得到异常段落序列,包括的具体步骤如下:
5.根据权利要求1所述基于文本关联特征的防诈骗智能预警方法,其特征在于,所述在异常段落序列中的相邻异常段落中,根据异常关联词种类序列中每种异常关联词的数量差异,得到每个异常段落的上下文关系矩阵,包括的具体步骤如下:
6.根据权利...
【专利技术属性】
技术研发人员:李涛,
申请(专利权)人:深圳世纪网通数据有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。