【技术实现步骤摘要】
一种无效数据过滤系统
本专利技术属于数据过滤领域,涉及一种无效数据过滤技术,具体是一种无效数据过滤系统。
技术介绍
随着信息社会的到来,人们接收的信息也越来越多,基本可以做到足不出门,就能知晓“天下事”的地步;与此同时,人们接收信息的设备也越来越多;但是,与此而来的一件麻烦事也就出现了,也就是所谓的信息轰炸,在大量信息接收过程中,容易忽略到用户想获取的消息;尤其是对于人们的手机而言,经常会收到很多各种各样的短信息;但是存在不少垃圾信息,既占用内存还又阻止人们获取到所需信息;而当前对于信息拦截,普遍都是比较简单粗暴,以标定某些特定词语,然后就全部拦截出现该类词语的信息,这样也会导致一些需要的信息被拦截,也有可能导致想要拦截的无法拦截;为了解决上述问题,现提供一种解决方案。
技术实现思路
本专利技术的目的在于提供一种无效数据过滤系统。本专利技术所要解决的技术问题为:(1)、如何针对个人社交,区别的识别无效数据信息;(2)、如何根据不同时间的不同需求,转变数据过滤规则。本专利技术的目的可以通过以下技术方案实现:一种无效数据过滤系统,包括数据获取单元、数据甄别单元、数据滤除单元、规则库、主控单元、显示单元、来往信息获取模块、信息录入模块和存储模块;其中,所述数据获取单元用于获取所需智能设备收到的接纳数据信息,所述数据获取单元用于将接纳数据信息传输到数据甄别单元,所述数据甄别单元用于结合通讯录对接纳数据信息进行初步甄别,具体甄别过程如下:步骤一:获取到接纳数据信息及对应的发件人;步骤二:将通讯录内存储的号码发来的接纳数据信息标定为联系信息,将通讯内未存储的号码发来的接纳 ...
【技术保护点】
1.一种无效数据过滤系统,其特征在于,包括数据获取单元、数据甄别单元、数据滤除单元、规则库、主控单元、显示单元、来往信息获取模块、信息录入模块和存储模块;其中,所述数据获取单元用于获取所需智能设备收到的接纳数据信息,所述数据获取单元用于将接纳数据信息传输到数据甄别单元,所述数据甄别单元用于结合通讯录对接纳数据信息进行初步甄别,具体甄别过程如下:步骤一:获取到接纳数据信息及对应的发件人;步骤二:将通讯录内存储的号码发来的接纳数据信息标定为联系信息,将通讯内未存储的号码发来的接纳数据信息标记为未联系信息;所述数据甄别单元将接纳数据信息传输到数据滤除单元,接纳数据信息包括联系信息和未联系信息;所述规则库内存储有数据滤除规则,所述数据滤除单元用于结合规则库内的数据滤除规则对接纳数据信息进行数据滤除,数据滤除规则具体表现为:步骤一:获取到发来的接纳数据信息;步骤二:当接纳数据信息为联系信息时进行亲近滤除处理,具体处理步骤表现为:S100:获取到联系信息;S200:获取到联系信息的总字数,并将总字数标记为Zz;S300:获取到滤除规则内预设设置的字数上限Z1;S400:获取到滤除规则内预先设置的无 ...
【技术特征摘要】
1.一种无效数据过滤系统,其特征在于,包括数据获取单元、数据甄别单元、数据滤除单元、规则库、主控单元、显示单元、来往信息获取模块、信息录入模块和存储模块;其中,所述数据获取单元用于获取所需智能设备收到的接纳数据信息,所述数据获取单元用于将接纳数据信息传输到数据甄别单元,所述数据甄别单元用于结合通讯录对接纳数据信息进行初步甄别,具体甄别过程如下:步骤一:获取到接纳数据信息及对应的发件人;步骤二:将通讯录内存储的号码发来的接纳数据信息标定为联系信息,将通讯内未存储的号码发来的接纳数据信息标记为未联系信息;所述数据甄别单元将接纳数据信息传输到数据滤除单元,接纳数据信息包括联系信息和未联系信息;所述规则库内存储有数据滤除规则,所述数据滤除单元用于结合规则库内的数据滤除规则对接纳数据信息进行数据滤除,数据滤除规则具体表现为:步骤一:获取到发来的接纳数据信息;步骤二:当接纳数据信息为联系信息时进行亲近滤除处理,具体处理步骤表现为:S100:获取到联系信息;S200:获取到联系信息的总字数,并将总字数标记为Zz;S300:获取到滤除规则内预设设置的字数上限Z1;S400:获取到滤除规则内预先设置的无效词组;其中,无效词组内包括若干个无效词,将无效词标记为Wi,i=1...n;S500:对联系信息进行分词处理,得到由若干个分词组成的联系信息,将总词数标记为Sc;S600:任选一无效词;S700:将该无效词Wi与组成联系信息的分词进行一一比对,得到该无效词的出现次数,将该出现次数标记为撞词数;S800:任选下一无效词,重复步骤S700-S800直至完成所有无效词Wi的比对,得到所有无效词Wi的撞词数Zci,i=1...n;Zci与Wi一一对应;S900:根据公式计算得到该联系信息的无效度Wx;其中,无效词Wi和字数上限Z1均通过用户预先设置;S110:当无效度Wx≥X1时,将该联系信息标记为存疑消息;否则将其标记为可接收消息;X1为预设值;步骤三:当接纳数据信息为未联系信息时进行陌生滤除处理,具体处理步骤表现为:S1:获取到未联系信息S2:获取到无效词组Wi,i=1...n;S3:将未联系信息替代亲近滤除处理中的联系信息,并重复亲近滤除处理中的步骤S500-S800,得到未联系信息的总词数S2c,以及对应的撞词数Z2i,i=1...n;S4:利用公式计算得到未联系信息的无效值W2x;当W2x≥X2时,将对应的未联系信息标记为核验数据信息;否则将该未联系信息标记为正常信息;其中,X2为预设值,且X2<X1;所述数据滤除单元用于将存疑消息、可接收消息核验数据信息和正常信息传输到主控单元,所述主控单元用于将可接收消息和正常消息传输到...
【专利技术属性】
技术研发人员:陈海林,张蓬,赵绪龙,
申请(专利权)人:珍岛信息技术上海股份有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。