【技术实现步骤摘要】
本专利技术涉及通信
,尤其涉及。
技术介绍
目前,进行文本分类使用的是人工智能分类算法,这些算法需先对学习样本进行学习,构造出对应的判别模型后,才可进行文本分类;因此,需先获取学习样本,目前获取学习样本的方法是人工直接对一批抽样进行标注,标注邮件为垃圾邮件或非垃圾邮件。由于分类算法需要有足够的学习信息量,至少需要对几万封学习样本进行学习才能构造出一个可靠的模型,因此,需要安排专人对几万封邮件进行分类标注,其工作量巨大,而且人工长期进行这类重复工作,容易出现失误,导致样本错误率增高,影响分类算法最终的学习效果;另外,在对邮件进行分类标注时,需人工阅读用户邮件,侵犯了用户的隐 私。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供,该方法无需安排专人对大量邮件进行分类标注,而是直接利用计算机收集用户的反馈信息,减轻了人工的工作量,确保了分类的准确率,同时也无需人工对邮件进行阅读,保护了用户的隐私。为了解决上述技术问题,本专利技术实施例提供了,包括扫描服务器中所有被举报的邮件,提取被举报次数大于或等于η的目标邮件,η为默认值,所述被举报的邮件包括被举报为正 ...
【技术保护点】
一种电子邮件收集分类方法,其特征在于,包括:扫描服务器中所有被举报的邮件,提取被举报次数大于或等于n的目标邮件,n为默认值,所述被举报的邮件包括被举报为正常邮件及被举报为垃圾邮件的邮件;计算所述目标邮件的置信度,得出计算结果;根据所述计算结果判定所述目标邮件为垃圾邮件或正常邮件,并存储到数据库中。
【技术特征摘要】
【专利技术属性】
技术研发人员:林延中,潘庆峰,
申请(专利权)人:盈世信息科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。