一种基于时序语义图的欺诈监测与预警方法技术

技术编号:13989703 阅读:52 留言:0更新日期:2016-11-13 15:23
本发明专利技术涉及一种基于时序语义图的欺诈监测与预警方法,利用时序语义图判断通讯文本中是否包含某种欺诈行为的语义信息、时序和逻辑特征,从而确定是否反馈预警信息;时序语义图由三种元素组成:位置、转移操作和有向连接;位置与转移操作之间的有向连接表征了每种欺诈模式的时序和逻辑特征,转移操作可以是语义信息匹配,或者是预警信息反馈,反映着欺诈模式的核心语义特征,通过判断通讯文本中是否包含这些语义信息,来确定文本中是否包含欺诈的语义信息,这些语义信息通过位置和转移操作之间的有向连接,有序地、有逻辑性地组织起来,从而更准确地表征了欺诈的模式。本发明专利技术提供更准确的欺诈监测和预警。

【技术实现步骤摘要】

本专利技术涉及一种即时通讯欺诈行为的监测与预警方法,特别是一种基于时序语义图的欺诈行为的监测与预警方法,属于信息技术应用领域。
技术介绍
近年来,利用电话、短信、在线聊天工具等即时通讯手段的欺诈案件时有发生。根据公安部门公布的信息,我国的欺诈案件大概分为15种类型,包括虚假中奖,引诱汇款等。欺诈行为的监测及预警对保障个人财产安全至关重要。目前欺诈监测主要有关键词检测和欺诈规则匹配的方法。关键词检测的方法:首先收集每种欺诈行为中出现频率非常高的词汇。比如,引诱汇款的欺诈行为中高频词汇是“银行账号”、“转账”。如果通讯内容中包含某种欺诈行为的高频词汇,通讯软件就会反馈给用户欺诈预警信息。关键词检测通过对关键词匹配的方法进行欺诈预警,往往会造成较低的查准率(precision)。也就是,很多正常的行为被认定为欺诈行为而向用户反馈预警信息。错误的预警往往会产生“狼来了”的效应,让用户丧失警惕。欺诈规则匹配的方法:首先收集欺诈行为的特征元素,然后组合这些特征元素构成欺诈规则的触发条件。而欺诈行为特征元素组合可能会存在很多的交集,降低了欺诈行为识别的效率。这种方法往往需要匹配整个特征元素的组合才能触发规则,反馈预警信息。很多类型的欺诈都表现出特定的时序和逻辑特征,也就是欺诈过程是经过精心设计,具有一定的操作流程。而关键词检测和欺诈规则匹配的方法忽视了这些特征。即时通讯的内容一般是语音或者文本的形式。语音形式的内容通常也可以转化为文本的形式。所以,识别欺诈行为需要对即时通讯的文本进行分析。语义网络分析是一种常见的文本分析的技术。它通常将文本信息的内容表示成一些信息对象组成的网络,网络的边描述对象之间的关系。然后通过查询这一网络来获得研究问题的信息。然而时序和逻辑特征很难用语义网络表征出来。Petri网是一种最常用的流程建模语言,其常被用于商业流程管理(Business Process Management)。Petri网可以用于描述事件之间的时序和逻辑关系。然而文本的语义信息却很难在Petri网中表示出来。因此,为了更准确地识别欺诈行为,需要一种方法既能识别通讯文本中的特定的语义信息,又能描述这些语义信息之间的时序和逻辑关系。
技术实现思路
本专利技术技术解决问题:克服现有技术的不足,提供一种基于时序语义图的欺诈监测与预警系统与预警方法,利用时序语义图更准确地表征了欺诈的模式,从而可以提供更准确的欺诈监测和预警。本专利技术技术解决方案:本专利技术提出了时序语义图的概念,以及基于时序语义图监测及预警欺诈行为的方法。每一种欺诈都有特定的模式。欺诈短信中常常有一些关键的语义信息反映某种欺诈行为。而这些关键的语义信息并不是孤立的,而是有时序、有逻辑性地组织在一起的。时序语义图既能表征文本中的语义信息,又能表征语义信息之间的时序和逻辑特征。基于时序语义图识别欺诈行为,能精确地匹配欺诈模式中的语义、时序和逻辑特征。本专利技术是通过以下技术方案实现的,具体步骤如下:(1)通过分析历史的欺诈行为数据,包括欺诈的通讯文本信息和对应的欺诈案件类型,可以提取出每一种欺诈类型的语义、时序和逻辑特征。根据这些特征,对于每一种欺诈类型,建立一个子时序语义图。这些子时序语义图“并联”起来,就是最终的用于识别欺诈行为的时序语义图。时序语义图结合了语义网络和Petri网的特点。一个子时序语义图由三种元素组成:位置、转移操作和有向连接。·位置描述当前在时序和逻辑过程中所处的阶段,用符号○来表示。当前位置用标记(token)●来表示。所以,位置有两种状态—被标记和没被标记。允许多个位置同时被标记。·转移操作有两种,用符号□来表示。一种是匹配特定的结构化的语义信息。不同的转移操作匹配不同的语义信息。另外一种是反馈给用户预警信息。转移操作有两种状态—未激活,已激活。·有向连接指明位置和转移操作之间的时序和逻辑关系,用符号→来表示。位置的标记信息、位置与其指向的转移操作之间的逻辑关系决定了转移操作是否被激活。比如,某一个转移操作有两个父位置,这两个父位置之间是“逻辑与”的关系。只有当这两个父位置都被标记时,这个转移操作才能被激活。当且仅当转移操作被激活时,才能进行相关的语义信息的匹配,或者才能向用户反馈预警信息。语义信息匹配是时序语义图中的转移操作。每一种欺诈行为都对应了特定的语义信息。这些语义信息通过时序语义图的位置与转移操作之间有向连接组织起来。一个转移操作只对应的一个特定结构的语义信息。比如,描述“中奖”这一语义信息,从句法的角度讲,一般是由一个动词和一个名词组成,而且这两个词在句子中是动宾关系。通讯文本中常出现的是“中了二等奖”、“抽选为幸运号”等。收集所有可能描述“中奖”这一语义信息的动词和名词,所有这些动词和名词之间分别具有“同义”的关系。因此,依据动宾关系和“同义”关系,对于每一个语义信息,都可以建立一个特定的语义结构,用来确定某一文本是否包含该语义信息。语义信息匹配成功,表明该文本中包含对应的语义信息,标记可以转移位置。(2)根据已建好的时序语义图,在其初始位置生成当前位置标记。初始位置指向的所有转移操作被激活。初始位置就是欺诈监测的开始,其指向的转移操作是语义信息的匹配。也就是匹配每一种欺诈模式最先出现的语义信息。读入第一条即时通讯的文本,判断该文本中是否包含已激活的转移操作对应的语义信息。如果某一个被激活的转移操作对应的语义信息存在于通讯文本中,表明可能会产生该类欺诈,因此需要继续匹配后续的该欺诈模式的语义信息。这个时候转移操作就被执行。也就是,标记从初始位置向转移操作指向的位置转移。可能存在第一条即时通讯的文本中含有多种欺诈模式的语义信息。所以,多个转移操作会被执行。这时,标记会分裂成多个,转移到相应的多个位置上。如果第一条通讯文本中没有任何欺诈模式最先出现语义信息,继续读入下一条通讯的文本,然后重复上述判断过程。(3)当标记转移到新的位置的时候,其指向的转移操作可能被激活。判断最新激活的转移操作是继续匹配欺诈模式的语义信息,还是反馈预警信息。如果是匹配语义信息,按照步骤(1)的方法执行;如果是向用户反馈预警信息,反馈之后,标记也要进行位置的转移。判断新的位置是否是结束位置。如果是,则欺诈行为识别结束;否则继续进行语义信息的匹配。也就是,该预警可能只是提醒用户,后续更进一步的匹配会提供更多的预警信息。本专利技术与现有关键词检测、欺诈规则匹配等技术相比的优点在于:(1)基于时序语义图的欺诈监测及预警的方法,不仅能判断通讯文本中是否包含某种欺诈模式的语义信息,而且能判断这些语义信息是否符合欺诈模式的时序和逻辑特征。每一种欺诈的语义信息之间都有特定的时序和逻辑关系。而现有的技术对欺诈行为的识别都是采用关键词检测的方法。关键词表征欺诈行为的方法忽视了这些特征。与单一的关键词表征相比,时序语义图表征的欺诈模式,提供了更丰富的信息,为更准确地识别欺诈行为奠定了基础。基于时序语义图的监测,根据欺诈模式的时序和逻辑的特征,一步一步地匹配语义信息,使欺诈行为的识别更有效更准确。(2)时序语义图匹配的是结构化的语义信息。关键词检测利用的是独立的语义信息,而时序语义图中转移操作对应的语义信息是结构化的,充分地描述了信息概念间的语义关系。基于时序语义图的语义信息匹配,能更本文档来自技高网
...

【技术保护点】
一种基于时序语义图的欺诈监测与预警方法,其特征在于:该方法利用时序语义图判断通讯文本中是否包含某种欺诈行为的语义信息、时序和逻辑特征,从而确定是否反馈预警信息,步骤如下:步骤(1):根据每一种欺诈类型的语义信息、时序和逻辑特征,建立相应的子时序语义图;所述子时序语义图既能表征文本中的语义信息,又能表征语义信息之间的时序和逻辑特征;子时序语义图由三种元素组成:位置、转移操作和有向连接;位置与转移操作之间的有向连接表征每种欺诈模式的时序和逻辑特征;位置描述当前在时序和逻辑过程中所处的阶段;位置有两种状态—被标记和没被标记;允许多个位置同时被标记;转移操作有两种,一种是语义信息的匹配;另外一种是反馈给用户预警信息;转移操作有两种状态:未激活和已激活;有向连接指明位置和转移操作之间的时序和逻辑关系;位置的标记信息、位置与其指向的转移操作之间的逻辑关系决定了转移操作是否被激活;仅当转移操作被激活时,才能进行相关的语义信息的匹配,或者才能向用户反馈预警信息;然后将这些子时序语义图的初始位置和结束位置合并,形成最终的欺诈监测及预警的时序语义图;步骤(2):根据已建好的时序语义图,在时序语义图初始位置生成当前位置标记;标记位置指向的语义信息匹配的转移操作被激活;读入一条即时通讯的文本,判断通讯的文本中是否包含已激活的转移操作对应的语义信息;如果对应的语义信息存在于通讯的文本中,标记从初始位置向转移操作指向的位置转移;如果该条通讯的文本中没有任何欺诈模式最先出现语义信息,继续读入下一条通讯的文本,然后重复上述判断过程;步骤(3):当标记转移到新的位置的时候,其指向的转移操作可能被激活。判断最新激活的转移操作是继续匹配欺诈模式的语义信息,还是反馈预警信息。如果是语义信息匹配,则继续匹配对应的语义信息;如果是向用户反馈预警信息,反馈之后,标记也要进行位置的转移。判断新的位置是否是结束位置。如果是,则欺诈行为识别结束;否则继续进行语义信息的匹配。也就是,该预警可能只是提醒用户,后续更进一步的匹配会提供更多的预警信息。直到反馈完所有的预警信息,标记到达结束位置时,一次欺诈行为监测并预警完成。...

【技术特征摘要】
1.一种基于时序语义图的欺诈监测与预警方法,其特征在于:该方法利用时序语义图判断通讯文本中是否包含某种欺诈行为的语义信息、时序和逻辑特征,从而确定是否反馈预警信息,步骤如下:步骤(1):根据每一种欺诈类型的语义信息、时序和逻辑特征,建立相应的子时序语义图;所述子时序语义图既能表征文本中的语义信息,又能表征语义信息之间的时序和逻辑特征;子时序语义图由三种元素组成:位置、转移操作和有向连接;位置与转移操作之间的有向连接表征每种欺诈模式的时序和逻辑特征;位置描述当前在时序和逻辑过程中所处的阶段;位置有两种状态—被标记和没被标记;允许多个位置同时被标记;转移操作有两种,一种是语义信息的匹配;另外一种是反馈给用户预警信息;转移操作有两种状态:未激活和已激活;有向连接指明位置和转移操作之间的时序和逻辑关系;位置的标记信息、位置与其指向的转移操作之间的逻辑关系决定了转移操作是否被激活;仅当转移操作被激活时,才能进行相关的语义信息的匹配,或者才能向用户反馈预警信息;然后将这些子时序语义图的初始位置和结束位置合并,形成最终的欺诈监测及预警的时序语义图;步骤(2):根据已建好的时序语义图,在时序语义图初始位置生成当前位置标记;标记位置指向的语义信息匹配的转移操作被激活;读入一条即时通讯的文本,判断通讯的文本中是否包含已激活的转移操作对应的语义信息;如果对应的语义信息存在于通讯的文本中,标记从初始位置向转移操作指向的位置转移;如果该条通讯的文本中没有任何欺诈模式最先出现语义信息,继续读入下一条通讯的文本,然后重复上述判断过程;步骤(3):当标记转移到新的位置的时...

【专利技术属性】
技术研发人员:余胜泉陈阳
申请(专利权)人:北京师范大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1