一种优化ｌａｍ％的信息分类阈值的设定方法及使用该方法的信息过滤系统技术方案

技术编号：3937164 阅读：395 留言：0更新日期：2012-04-11 18:40

一种优化ｌａｍ％的信息分类阈值的设定方法及使用该方法的信息过滤系统，涉及到一种信息过滤方法及该方法中的阈值设定方法。它解决了现有信息过滤模型中存在的优化目标和过滤问题评价指标不一致、模型优化结果产生偏差、性能受到制约的问题。所述优化ｌａｍ％的信息分类阈值的设定方法是设定偏置的分类阈值，使ｈｍ％或ｓｍ％趋近于０，进而使得ｌａｍ％的值趋近于０。所述信息过滤系统包括特征权重库、训练器、信息过滤器，其中，信息过滤器用于对接收信息进行特征提取并获得特征信息的信息、以及基于特征权重库中的特征对于接收到信息进行识别，将所述信息分为正常信息和垃圾信息。本发明专利技术可应用于网络信息过滤和手机垃圾短信过滤等电子信息的过滤。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及到一种信息过滤方法及该方法中的阈值设定方法，具体涉及到垃圾邮件、短信过滤等信息过滤方法，即该方法中的分类阈值设定方法。
技术介绍
随着信息技术的迅猛发展，电子邮件、手机短信已经成为人们日常工作和生活中进行通讯和交流的主要手段，有效地促进了人类社会的生产和进步。但是，伴随而来的大量垃圾邮件和垃圾短信严重影响了它们的的正常使用。2008年三季度中国网民平均每周收到垃圾邮件的数量为17. 86封，与去年同期相比增加1. 17封，增幅为7. 0% ；收到垃圾邮件所占的比例为57. 89%，与去年同比上升了 2. 04个百分点，全球的平均水平更是高于上述数据(“2008年第三季度中国反垃圾邮件调查报告”http://WWW. 12321. cn/viewnews. php id=10752)。而垃圾短信的数量更是惊人，央视2008年“315晚会”曝光垃圾短信制造内幕，垃圾短信每天发送数亿条。这些垃圾信息危害社会，浪费了用户的时间、精力和金钱，损害了用户的利益。少数别有用心者利用垃圾邮件、垃圾短信散播各种虚假信息或有害信息，严重危害了社会的稳定。如何有效地进行这些垃圾信息进行有效过滤是当前迫切需要解决的问题。垃圾邮件过滤和垃圾短信过滤都是典型的信息过滤系统，基于内容的过滤系统采用了相同或相似的技术手段。为了解决信息过滤问题，人们提出了许多解决方案，其中过滤技术具有自动化程度高、准确度高、易被使用者接受的优点，具备研究价值和发展空间，逐渐成为研究的热点。为了检验各种过滤技术在实际垃圾邮件过滤中的有效性，国内外举办了高水平的会议和...

【技术保护点】
一种邮件分类阈值的设定方法，其特征在于，所述设定方法为：设定偏置的分类阈值，使ｈｍ％或ｓｍ％趋近于０，进而使得ｌａｍ％的值趋近于０。

【技术特征摘要】

【专利技术属性】
技术研发人员：韩咏，齐浩亮，杨沐昀，何晓宁，李生，王丁，孙育华，雷国华，
申请(专利权)人：黑龙江工程学院，哈尔滨工业大学，
类型：发明
国别省市：93[中国|哈尔滨]

全部详细技术资料下载我是这个专利的主人