信息过滤系统、信息过滤方法以及信息过滤程序技术方案

技术编号:5474911 阅读:502 留言:0更新日期:2012-04-11 18:40
字符串匹配部(110)通过输入文档(801)与匹配条件信息(109)表示的分类关键字的字符串匹配来确定输入文档(801)的类型。学习数据(209)表示各类型的统计信息。分类部(220)根据输入文档(801)与学习数据(209)表示的统计信息的对应比率确定输入文档(801)的类型。正确答案比较部(120)比较字符串匹配部(110)确定的类型与正确答案信息(803)的类型。学习部(210)比较分类部(220)确定的类型与正确答案信息(803)的类型。错误率计算部(310)根据正确答案比较部(120)的比较结果与学习部(210)的比较结果计算字符串匹配型过滤器部(100)与学习型过滤器部(200)的分类错误率。结果输出部(320)将由分类错误率小的过滤器确定出的类型作为分类对象文档(804)的分类结果(301)而输出。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及例如对输入文档进行分类的信息过滤系统、信息过滤方法以及信息过 滤程序。
技术介绍
信息过滤是指,通过是否与用户事先设定的要求(过滤条件)符合,来自动地挑选 信息的信息处理。在信息过滤中,一般采用如下方法为了提高过滤的精度,使用通过机械 学习进行的文档的自动分类技术,通过用户指定的反馈来追加或者变更过滤条件(专利文 献1)。将其称为学习型过滤器。进而,作为用于提高过滤的精度的方法,还有组合了具有不同的过滤条件的多个 学习型过滤器的过滤方法(专利文献2)。在该方法中,多个过滤器的输出(对过滤条件的 适应性)根据用户的指定而合成,成为最终输出。专利文献1 日本特开平9-288683号公报专利文献2 日本特开2001-229164号公报
技术实现思路
但是,在这样的学习型过滤器中,存在在学习量少的初始状态下过滤精度较低这 样的课题。为了解决该课题,例如,在系统的运用前准备充分的量的学习样品数据,直到得 到充分的精度为止系统进行学习即可。但是,在学习样品数据的制作中需要通过人工识别 是否与要求(过滤条件)符合。因此,在实际的系统中难以准备充分的量的学习样品数据。另外,在由于环境变化本文档来自技高网...

【技术保护点】
一种信息过滤系统,其特征在于,具备:第1过滤器部,从输入设备输入属于多个种类中的至少任意一个种类的文档数据,使用CPU(CentralProcessingUnit,中央处理单元)来执行确定所输入的上述文档数据所属的种类的规定的分类处理,将输入的上述文档数据所属的种类确定为第1分类信息;第2过滤器部,从输入设备输入上述文档数据,使用CPU来执行与上述第1过滤器部的上述分类处理不同的规定的分类处理,将输入的上述文档数据所属的种类确定为第2分类信息;第1正确答案比较部,使用CPU,对将预先确定了所属的种类的多个学习文档数据分别作为上述文档数据而由上述第1过滤器部确定出的上述多个学习文档数据的上述第1...

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:加藤守郡光则
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1