私人邮箱判断方法及判断装置制造方法及图纸

技术编号:25643431 阅读:13 留言:0更新日期:2020-09-15 21:35
本申请公开了一种私人邮箱判断方法及判断装置,包括获取收件箱、发件箱、发件人的姓名和发件人的手机号;对收件箱、发件箱和发件人的姓名进行预处理;分别计算收件箱前缀字符与发件箱前缀字符、发件人姓名扩展字符之间的类编辑距离,和收件箱前缀字符与发件人手机号重合的位数;计算相似度比率,判断该比率是否不小于设定值,若是,则认定该收件箱为当前发件人的私人邮箱。根据本申请实施例提供的技术方案,提供了一种邮件外发至私人邮箱时对于私人邮箱的识别技术,其中通过将收件邮箱分别与发件邮箱、发件人姓名信息以及发件人手机号等进行比较,判断收件邮箱与发件人的关联程度,进一步的判断出该收件箱是否为发件人的私人邮箱。

【技术实现步骤摘要】
私人邮箱判断方法及判断装置
本专利技术一般涉及计算机
,尤其涉及私人邮箱判断方法及判断装置。
技术介绍
企业在管理过程中普遍存在因邮件外发导致的内部数据泄漏的事件发生,因无法获得员工的私人邮箱,难以及时阻止员工外发企业内部数据至私人邮箱的行为,因此,及时的对员工使用的邮箱是否是私人邮箱进行判断较为重要。
技术实现思路
鉴于现有技术中的上述缺陷或不足,期望提供一种私人邮箱判断方法及判断装置。第一方面,提供一种私人邮箱判断方法,包括步骤:获取收件箱、发件箱、发件人的姓名和发件人的手机号;对所述收件箱、发件箱和发件人的姓名进行预处理,获取收件箱前缀字符、发件箱前缀字符和发件人姓名扩展字符;分别计算所述收件箱前缀字符与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号之间的类编辑距离,和所述收件箱前缀字符与所述发件人手机号重合的位数;根据所述类编辑距离和所述收件箱前缀字符分别与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号长度之和计算相似度比率,根据所述收件箱前缀字符与所述发件人手机号扩展字符重合的位数确定相似度比率;判断上述相似度比率是否不小于设定值,若是,则认定该收件箱为当前发件人的私人邮箱。第二方面,提供一种私人邮箱判断装置,包括:获取单元,用于获取收件箱、发件箱、发件人的姓名和发件人的手机号;预处理单元,用于对所述收件箱、发件箱和发件人的姓名进行预处理,获得收件箱前缀字符、发件箱前缀字符和发件人姓名扩展字符;第一计算单元,用于分别计算所述收件箱前缀字符与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号之间的类编辑距离;第二计算单元,用于计算所述收件箱前缀字符与所述发件人手机号重合的位数;第三计算单元,用于根据所述类编辑距离和所述收件箱前缀字符分别与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号长度之和计算相似度比率;第四计算单元,根据所述收件箱前缀字符与所述发件人手机号扩展字符重合的位数确定相似度比率;私人邮箱确定单元,用于判断上述相似度比率是否不小于设定值,若是,则认定该收件箱为当前发件人的私人邮箱。根据本申请实施例提供的技术方案,提供了一种邮件外发至私人邮箱时对于私人邮箱的识别技术,其中通过将收件邮箱分别与发件邮箱、发件人姓名信息以及发件人手机号等进行比较,判断收件邮箱与发件人的关联程度,进一步的判断出该收件箱是否为发件人的私人邮箱。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本实施例中私人邮箱判断方法流程图;图2为本实施例中私人邮箱判断装置结构示意图;图3为根据本申请实施例提供的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。请参考图1,本实施例中提供一种私人邮箱判断方法,包括步骤:获取收件箱、发件箱、发件人的姓名和发件人的手机号;对所述收件箱、发件箱和发件人的姓名进行预处理,获取收件箱前缀字符、发件箱前缀字符和发件人姓名扩展字符;分别计算所述收件箱前缀字符与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号之间的类编辑距离,和所述收件箱前缀字符与所述发件人手机号重合的位数;根据所述类编辑距离和所述收件箱前缀字符分别与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号长度之和计算相似度比率,根据所述收件箱前缀字符与所述发件人手机号扩展字符重合的位数确定相似度比率;判断上述相似度比率是否不小于设定值,若是,则认定该收件箱为当前发件人的私人邮箱。本实施例的判断方法在发件人在发送邮件的时候,对该发件人的发件箱、收件箱、发件人的姓名、发件人手机号进行获取,并且对获取的信息进行预处理,将需要进行操作处理的信息提取出来,需要提取出的信息包括发件箱的前缀、收件箱的前缀以及对发件人姓名的扩展,将收件箱前缀分别与发件箱前缀、发件人姓名的扩展以及发件人的手机号进行比较,其中采用了两种比较方式,一是计算类编辑距离即计算一个字符串转换成另一个字符串所需要的个编辑方式指定数值和,二是判断收件箱与发件人手机号的重合位数,进一步的判断收件箱前缀与发件人的关联度,若与发件人姓名或者手机号等私人信息的关联度较大,则进一步的判断收件箱是否为该发件人的私人邮箱。进一步的,所述“获取所述发件人姓名的扩展字符”包括步骤:根据发件人的姓名拼音进行扩展,所述扩展字符至少包括:姓名任意组合全拼、姓名任意两字组合全拼、姓名首字母任意组合、某一字首字母和其他全拼任意组合。经过观察发现大部分人会按照自己的姓名来设置邮箱账号,因此本实施例中首先需要对发件人的姓名进行预处理,将员工的姓名转换成拼音进行扩展,求解扩展后的字符与收件箱前缀的类编辑距离,进一步的确定该邮箱是否为私人邮箱;对员工姓名拼音的扩展至少包括上述几个方面,例如顺序全拼、倒叙全拼、混合顺序全拼、顺序首字母、倒叙首字母、混合顺序首字母等等,本实施例中提供较多种可能性的姓名扩展字符,以便尽可能的覆盖与发件人姓名相关的情况;例如:发件人姓名为刘德华,拼音全称为liudehua,对该姓名进行扩展,可以得到以下姓名扩展字符:dehualiu、huadeliu、liuhuade、ldh、dhl、hdl、lhd、liudh、dhliu、hdliu、dliuh、hliud、ldhua、lhuad、huadl、huald、huadl、dlhua、dhual、ldeh、lhde、dehl、delh、hlde、hdel等等,尽可能进行拼音的全扩展,以便增加后续比较计算的准确度。进一步的,计算所述类编辑距离为:计算将所述收件箱前缀字符编辑为所述发件箱前缀字符或者所述发件人姓名扩展字符或者发件人手机号的编辑次数,所述编辑方式为插入或者删除或者替换,所述类编辑距离等于各编辑方式指定数值之和,所述删除和插入指定数值为1、所述替换指定数值为2。本实施例中根据上述预处理后的字符进行类编辑距离的计算,例如,将‘victoria’转换成‘victory’的编辑距离有两种求解:a)‘victoria’删除‘i’和‘a’,再插入‘y’得到‘victory’,共经过2次删除,1次插入,因此类编辑距离为3;b)‘victoria’删除‘i’或者‘a’,再用‘y’替换,得到‘victory’,共经过1次删除,1次替换,因此类编辑距离为3。进一步的,若所述收件箱前缀字符或者所述发件箱前缀字符包括多个数字,则还包括步骤:对所本文档来自技高网...

【技术保护点】
1.一种私人邮箱判断方法,其特征在于,包括步骤:/n获取收件箱、发件箱、发件人的姓名和发件人的手机号;/n对所述收件箱、发件箱和发件人的姓名进行预处理,获取收件箱前缀字符、发件箱前缀字符和发件人姓名扩展字符;/n分别计算所述收件箱前缀字符与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号之间的类编辑距离,和所述收件箱前缀字符与所述发件人手机号重合的位数;/n根据所述类编辑距离和所述收件箱前缀字符分别与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号长度之和计算相似度比率,根据所述收件箱前缀字符与所述发件人手机号扩展字符重合的位数确定相似度比率;/n判断上述相似度比率是否不小于设定值,若是,则认定该收件箱为当前发件人的私人邮箱。/n

【技术特征摘要】
1.一种私人邮箱判断方法,其特征在于,包括步骤:
获取收件箱、发件箱、发件人的姓名和发件人的手机号;
对所述收件箱、发件箱和发件人的姓名进行预处理,获取收件箱前缀字符、发件箱前缀字符和发件人姓名扩展字符;
分别计算所述收件箱前缀字符与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号之间的类编辑距离,和所述收件箱前缀字符与所述发件人手机号重合的位数;
根据所述类编辑距离和所述收件箱前缀字符分别与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号长度之和计算相似度比率,根据所述收件箱前缀字符与所述发件人手机号扩展字符重合的位数确定相似度比率;
判断上述相似度比率是否不小于设定值,若是,则认定该收件箱为当前发件人的私人邮箱。


2.根据权利要求1所述的私人邮箱判断方法,其特征在于,所述获取所述发件人姓名的扩展字符包括步骤:根据发件人的姓名拼音进行扩展,所述扩展字符至少包括:姓名任意组合全拼、姓名任意两字组合全拼、姓名首字母任意组合、某一字首字母和其他全拼任意组合。


3.根据权利要求1所述的私人邮箱判断方法,其特征在于,计算所述类编辑距离为:计算将所述收件箱前缀字符编辑为所述发件箱前缀字符或者所述发件人姓名扩展字符或者发件人手机号的类编辑距离,所述编辑方式为插入或者删除或者替换,所述类编辑距离等于各编辑方式指定数值之和,所述删除和插入指定数值为1、所述替换指定数值为2。


4.根据权利要求1所述的私人邮箱判断方法,其特征在于,若所述收件箱前缀字符或者所述发件箱前缀字符包括多个数字,则还包括步骤:对所述收件箱前缀字符和/或者所述发件箱前缀字符进行预处理,去除所述收件箱前缀字符中的数字和字母,分别获取收件箱前缀第一字符和收件箱前缀第二字符;和/或者所述发件箱前缀字符中的数字,获取发件箱前缀第一字符;
计算所述收件箱前缀字符与所述发件箱前缀字符之间的类编辑距离还包括:分别计算所述收件箱前缀字符与发件箱前缀字符、所述收件箱前缀第一字符与发件箱前缀字符、所述收件箱前缀字符与发件箱前缀第一字符、所述收件箱前缀第一字符与发件箱前缀第一字符之间的类编辑距离,取最小值为所述收件箱前缀字符与所述发件箱前缀字符之间的类编辑距离;
计算所述收件箱前缀字符与所述发件人手机号之间的类编辑距离为:计算所述收件箱前缀第二字符与所述发件人手机号之间的类编辑距离。


5.根据权利要求2所述的私人邮箱判断方法,其特征在于,“根据所述类编辑距离和所述收件箱前缀字符分别与所述发件箱前缀字符、所述发件人姓名扩展字符、所述发件人手机号长度之和计算相似度比率”为:(所述收件箱前缀字符长度+所述发件箱前缀字符长度-所述类编辑距离)/(所述收件箱前缀字符长度+所述发件箱前缀字符长度),或者(所述收件箱前缀字符长度+所述发件人姓名扩展字符长度-所述类编辑距离)...

【专利技术属性】
技术研发人员:马敏胡泽柱黄丽诗
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1