【技术实现步骤摘要】
信息识别方法及装置
本申请涉及互联网
,尤其涉及信息识别方法及装置。
技术介绍
随着互联网技术的不断发展,针对电子邮件的安全防御也成为了一个关键问题。现有技术中,针对电子邮件的安全防御一般采用反垃圾反病毒的方法。其中,反垃圾是基于文本进行检测,反病毒是基于已有的病毒特征库进行检测。但是,攻击者可以通过伪造文本或伪造特征的方式来避免被检测到,使得现有的反垃圾反病毒的方法对邮件防御的安全性能很低,容易对用户造成大量的损失。
技术实现思路
本申请提供信息识别方法及装置,以解决现有技术中的反垃圾反病毒的方法对信息识别的安全性能很低,容易对用户造成大量的损失的问题。根据本申请实施例的第一方面,提供一种信息识别方法,所述方法包括:获取待识别信息;计算所述待识别信息与历史信息的相似度;根据所述相似度判断所述待识别信息是否为特定类型信息。根据本申请实施例的第二方面,提供一种信息识别装置,所述装置包括:获取单元,用于获取待识别信息;计算单元,用于计算所述待识别信息与历史信息的相似度;第一识别单元,用于根据所述相似度判断所述待识别信息是否为特定类型信息。根据本申请实施例的第三方面, ...
【技术保护点】
一种信息识别方法,其特征在于,所述方法包括:获取待识别信息;计算所述待识别信息与历史信息的相似度;根据所述相似度判断所述待识别信息是否为特定类型信息。
【技术特征摘要】
1.一种信息识别方法,其特征在于,所述方法包括:获取待识别信息;计算所述待识别信息与历史信息的相似度;根据所述相似度判断所述待识别信息是否为特定类型信息。2.根据权利要求1所述的方法,其特征在于,所述待识别信息为当前邮件信息,所述历史信息为设定时间内的历史邮件信息;所述计算所述待识别信息与历史信息的相似度,包括:判断当前邮件信息是否属于设定安全类型的邮件信息;当所述当前邮件信息不属于设定安全类型的邮件信息时,则对所述当前邮件信息进行信息提取,得到至少一个第一要素信息;当设定白名单和设定黑名单中均不包括各个所述第一要素信息时,则从所述历史邮件信息中获取与所述第一要素信息对应的第二要素信息;计算所述第一要素信息和对应的第二要素信息之间的相似度,所述相似度为第一相似度。3.根据权利要求2所述的方法,其特征在于,所述对所述当前邮件信息进行信息提取,得到至少一个第一要素信息,包括:按照第一设定要素类型从所述当前邮件信息中提取对应的要素信息,并将所述第一设定要素类型对应的要素信息确定为所述第一要素信息,所述第一设定要素类型包括以下至少一项:发件人、收件人、邮件主题、链接地址、发送时间和邮件正文;当检测到所述当前邮件中包括至少一个附件时,则按照第二设定要素类型从所述附件中提取对应的要素信息,并将所述第二设定要素类型对应的要素信息也确定为所述第一要素信息,所述第二设定要素类型包括文件名称、文件大小、文件类型和文件散列值。4.根据权利要求3所述的方法,其特征在于,所述计算所述第一要素信息和对应的第二要素信息之间的相似度,包括:对所述第一设定要素类型对应的要素信息和对应的第二要素信息进行基于文本的相似度计算;对所述第二设定要素类型对应的要素信息进行基于文件的相似度计算。5.根据权利要求2所述的方法,其特征在于,所述根据所述相似度判断所述待识别信息是否为特定类型信息,包括:当检测到至少一个第一相似度大于设定相似度阈值时,则判定当前邮件信息为特定类型信息。6.根据权利要求5所述的方法,其特征在于,所述当检测到至少一个第一相似度大于设定相似度阈值时,则判定当前邮件信息为特定类型信息,包括:当检测到至少一个第一相似度大于所述设定相似度阈值时,则计算各个要素类型中大于所述设定相似度阈值的第二要素信息的第一数量;当检测到至少一个所述第一数量大于第一设定数量阈值时,则判定当前邮件信息为特定类型信息。7.根据权利要求5所述的方法,其特征在于,所述当检测到至少一个第一相似度大于设定相似度阈值时,则判定当前邮件信息为特定类型信息,包括:当检测到至少一个第一相似度大于所述设定相似度阈值时,则计算至少一个指定要素类型中大于所述设定相似度阈值的第二要素信息的第二数量;当检测到至少一个所述第二数量大于第二设定数量阈值时,则判定当前邮件信息为特定类型信息。8.根据权利要求2所述的方法,其特征在于,所述方法还包括:当所述设定黑名单中包括至少一个所述第一要素信息时,则判定当前邮件信息为特定类型信息。9.根据权利要求2至8任一项所述的方法,其特征在于,所述特定类型信息为包括病毒的信息;所述方法还包括:当判定当前邮件信息为特定类型信息时,对当前邮件进行防御处理;所述对当前邮件进行防御处理,包括:输出拦截提示,所述拦截提示包括允许拦截和拒绝拦截;当接收到针对所述允许拦截的确认指令时,则对当前邮件进行拦截。10.根据权利要求2所述的方法,其特征在于,所述方法还包括:当所述设定白名单中包括至少一个所述第一要素信息时,则判定当前邮件信息不是特定类型信息,并对当前邮件进行放行处理。11.一种信息识别装置,其特征在于,所述装置包括:获取单元,用于获取待识别信息;计算单元,用于计算所述待识别信息与历史信息的相似度;第一识别单元,用于根...
【专利技术属性】
技术研发人员:卞雄峰,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。