【技术实现步骤摘要】
搜索邮件内容方法、装置、终端及存储介质
本专利技术涉及邮件搜索领域,尤其涉及一种搜索邮件内容方法、装置、终端及存储介质。
技术介绍
移动通信技术、网络技术、信息技术的相互融合与交织发展,使得电子邮件在工作、生活中替代了传统书信成为了主要的书面通信载体。据统计平均一个企业员工每天四分之一的时间处理与邮件相关的业务,平均每天发信43封。且在涉及电子邮件取证调查的案件中,调查人员通过搜索邮件内容来寻找与调查事件相关的参与人、发生的事件、发生的时间等线索,需要详细了解邮件内容。目前多数调查通过关键字搜索结合人工处理的方式完成,由于关键字搜索获得大量与调查无关的命中结果所以检查效率不高,根据调查统计关键字搜索的技术水平在数字取证发展的最近三十年时间里没有显著的提高。因此待查的邮件数据规模通常使得调查工作面临资源(计算资源、人力资源)不足的困难,从而造成积压滞后,主要原因包括以下几点:1)相关取证工具对于文本内容搜索效率不高。当前工具主要依赖相对简单的哈希及搜索算法限制了检查的效率。有限数量的关键词搜索(10-20个关键词)处理时间往往要耗费数天时间,重要证据常常被淹没在大量 ...
【技术保护点】
1.一种搜索邮件内容方法,其特征在于,包括以下步骤:从网络数据中提取并存储邮件内容;提取所述邮件内容中的特征向量,将所述特征向量输入到预先构建的事件类型分类器中,利用所述事件类型分类器中预定义事件类型对所述邮件内容进行分类;根据所述分类得出用于进行相关邮件搜索的事件类型。
【技术特征摘要】
1.一种搜索邮件内容方法,其特征在于,包括以下步骤:从网络数据中提取并存储邮件内容;提取所述邮件内容中的特征向量,将所述特征向量输入到预先构建的事件类型分类器中,利用所述事件类型分类器中预定义事件类型对所述邮件内容进行分类;根据所述分类得出用于进行相关邮件搜索的事件类型。2.如权利要求1所述的方法,其特征在于,所述提取邮件内容中的特征向量,包括:通过设定的第一神经网络提取所述邮件内容中词级特征,形成词级特征向量;通过设定的第二神经网络提取所述邮件内容中句子级别特征,形成句子级别特征向量;将所述词级特征向量与所述句子级别特征向量组成特征向量。3.如权利要求2所述的方法,其特征在于,所述第一神经网络包括:长短期记忆LTSM循环神经网络;和/或,所述第二神经网络包括:卷积神经网络。4.如权利要求1所述的方法,其特征在于,所述从网络数据中提取并存储邮件内容,包括:解析网络数据包提取并存储邮件传输协议数据包,以邮件格式存储邮件内容。5.如权利要求1或4所述的方法,其特征在于,在所述从网络数据中提取并存储邮件内容之后,还包括:对所述邮件内容进行完整性校验。6.如权利要求1所述的方法,其特征在于,在所述提取邮件内容中的特征向量之前,还包括...
【专利技术属性】
技术研发人员:张博,王焮,胡罡,吴鹏,王丹辉,王宏,连礼泉,武文曦,杨欣欣,
申请(专利权)人:中国电子科技集团公司电子科学研究院,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。