一种针对邮件的个人塑像方法及系统技术方案

技术编号:23893411 阅读:29 留言:0更新日期:2020-04-22 07:25
本发明专利技术公开了一种针对邮件的个人塑像方法及系统,涉及信息安全领域,该方法包括选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件。遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件。遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱。遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱。匹配私人邮件中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱。遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。

【技术实现步骤摘要】
一种针对邮件的个人塑像方法及系统
本专利技术涉及信息安全领域,具体涉及一种针对邮件的个人塑像方法及系统。
技术介绍
在信息技术的快速发展的前景下,出现了用户画像分析技术,用户画像是客观、准确地描述目标用户的工具和方法。在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。现有技术中,大部分用户画像的生成方法采用关键词提取方法来生成用户标签,这种画像方式简单迅速,但是对于复杂的数据类型,难以进行。电子邮件作为用户的信息之一,是—种用电子手段提供信息交换的通信方式,是互联网应用最广的服务。通过网络的电子邮件系统,用户可以简单、高速、低成本的与世界上任何一个角落的网络用户联系。这些邮件内容可以很真实的反映出一个人的生活状体。但是电子邮件的数据为多层次、多级别、多种类型的数据,是难以通过简单的关键词提取的方式来画像的。
技术实现思路
针对现有技术中存在的缺陷,本专利技术的目的在于提供一种针对邮件的个人塑像方法及系统,能够通过对取证后的邮件账户进行全方位的分析,塑造用户的身份画像。为达到以上目的,第一方面,本专利技术实施例提供一种针对邮件的个人塑像方法,其包括:选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;遍历所有私人邮件,匹配私人邮件的正文中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱;遍历所有行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。作为一个优选的实施方案,遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件,包括:匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。作为一个优选的实施方案,提取所述全部邮件包括:设置收件人和/或发件人的白名单,正文关键词的黑名单;遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;将得到的邮件作为全部邮件。作为一个优选的实施方案,所述遍历所有带有账号邮件标签的邮件,提取邮件正文,并通过关键字匹配,得到私人账号信息包括:设置邮件的发件人以及收件人的匹配名单,并与预设的格式匹配样式进行匹配;筛选账号邮件中符合所述匹配名单的邮件,并对应所述格式匹配样式,提取所述邮件正文中的账户信息,所述账户信息包括:账户所属网址、账户名称。作为一个优选的实施方案,所述设置数据还包括账户登录信息,所述登录信息包括登录时间,登录地点。作为一个优选的实施方案,获取所述账户登录信息,绘制运动轨迹图谱。作为一个优选的实施方案,所述设置数据包括所述邮箱账户的邮箱订阅数据、收藏夹数据、小标签数据、星标邮件数据、邮箱网盘数据。第二方面,本专利技术实施例还提供一种针对邮件的个人塑像系统,其包括:取证模块,用于选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;分类模块,用于遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;帐号信息模块,用于遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;社交模块,用于遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;私人信息模块,用于遍历所有私人邮件,匹配私人邮件的正文中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱;行为模块,用于遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。作为一个优选的实施方案,所述分类模块包括:第一标记模块,用于匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;第二标记模块,用于通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;第三标记模块,用于通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。作为一个优选的实施方案,其还包括过滤模块,所述过滤模块用于设置收件人和/或发件人的白名单,正文关键词的黑名单;遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;将得到的邮件作为全部邮件。与现有技术相比,本专利技术的优点在于:本专利技术一种针对邮件的个人塑像方法及系统首先提取出一个邮件账号中可能使用的所有数据:设置数据和全部邮件,其中设置数据包括了个人对邮箱账号的各个偏好设置,拥有较强的个人偏好信息,而全部邮件为个人在生活中涉及的方方面面且与邮箱有关的信息。提取这些信息保证拥有该邮箱账号的个人的信息能够完整的使用。进一步的,本专利技术将该账号中的所有邮件进行了分类,器分类为私人邮件、行为邮件和账号邮件。通过这些邮件的分类,能够反映个人各个方面的信息,其中私人邮件反映了邮箱账户所有人与其他收件人、发件人的亲密关系,行为邮件反映了邮箱所有人在生活中各个方面行为,如在网校进行学习、在酒店进行住宿,且网校以及酒店向用户发送了邮件。账号邮件则是邮箱账户所有人将该邮箱设置为其各个账户的绑定邮箱、或者找回密码的邮箱时,该邮箱账号会收到关于账号信息的邮件,通过对这些邮件的中的账号信息提取,能够找出邮箱账户所有人的各个账户信息,进而绘制图谱。最终从身份、社交关系、行为体现了邮箱账户所有人的较为完整的信息。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面对实施例对应的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一种针对邮件的个人塑像方法实施例步骤流程图;图2为本专利技术一种针对邮件的个人塑像系统实施例的结构示意图。<本文档来自技高网...

【技术保护点】
1.一种针对邮件的个人塑像方法,其特征在于,其包括:/n选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;/n遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;/n遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;/n遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;/n遍历所有私人邮件,匹配私人邮件的正文中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱;/n遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。/n

【技术特征摘要】
1.一种针对邮件的个人塑像方法,其特征在于,其包括:
选定邮箱账号,提取所述邮箱账号中的设置数据以及全部邮件;
遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件;
遍历所有账号邮件,提取账号邮件的正文,并通过关键字匹配,得到私人账号信息,结合所述邮箱账户的设置数据,绘制账号信息图谱;
遍历所有私人邮件,提取私人邮件中的收件人信息、发件人信息,并提取正文中联系人的称呼,并与通讯录、关键字匹配,绘制社交信息图谱;
遍历所有私人邮件,匹配私人邮件的正文中预设的专有词语、偏好词语、话题词语,结合设置信息中的偏好设置信息,添加预设的人物标签,绘制私人信息图谱;
遍历所有带行为邮件,通过关键字匹配,得出用户的生活行为信息,绘制行为轨迹图谱。


2.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于,遍历全部邮件,并将全部邮件分类为:私人邮件、行为邮件、账号邮件,包括:
匹配邮件的收件人和/或发件人与对应企业的预设邮箱,匹配一致则该邮件为所述选定邮箱账号与企业之间的往返邮件,并为该邮件添加行为邮件的标签;
通过邮件的标题以及正文内容与关键词匹配,若该邮件为向所述选定邮箱账号的用户确认私人账号信息的往返邮件,则为该邮件添加账号邮件的标签;
通过邮件的正文以及通讯录与关键词匹配,若该邮件为用户与他人往返邮件时,则为该邮件添加私人邮件的标签。


3.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于,提取所述全部邮件包括:
设置收件人和/或发件人的白名单,正文关键词的黑名单;
遍历选定邮箱账号中的所有邮件,并与所述白名单、黑名单匹配,汇总白名单中的邮件,剔除含有黑名单的邮件;
将得到的邮件作为全部邮件。


4.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于,所述遍历所有带有账号邮件标签的邮件,提取邮件正文,并通过关键字匹配,得到私人账号信息包括:
设置邮件的发件人以及收件人的匹配名单,并与预设的格式匹配样式进行匹配;
筛选账号邮件中符合所述匹配名单的邮件,并对应所述格式匹配样式,提取所述邮件正文中的账户信息,所述账户信息包括:账户所属网址、账户名称。


5.如权利要求1所述的一种针对邮件的个人塑像方法,其特征在于:所述...

【专利技术属性】
技术研发人员:李聪
申请(专利权)人:武汉市烽视威科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1