通过时间分片进行文本的自动化分类的系统和方法技术方案

技术编号:2876240 阅读:208 留言:0更新日期:2012-04-11 18:40
公开了一种用于信息处理系统的自动分类文本的系统和方法。该系统包括文本分类器控制器,读取带有一个或多个包含在文本内的一个或多个故事段中的关键词的文本。文本分类器控制器标识每行中的关键词,并响应该标识一行文本中的至少一个关键词,将该行文本分类为该文本内的故事段的一部分。文本分类器控制器还标识文本内特定类别的关键词中的关键词的个数减少到低于阈值的关键词转换点。文本分类器控制器还标识文本内特定类别的关键词中的关键词的个数增加到高于阈值的关键词转换点。文本分类器控制器基于关键词转换点的位置分类故事段。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术总体涉及文本(text)自动化分类的系统和方法,更具体来说,涉及对在视频、音频和/或文本广播内出现的个别故事片断(storysegment)的文本进行自动化分类的系统和方法。个别故事片断的文本的分类,可以被用来将视频片断分类,以便以后能选择性地检索分类的视频片断。存在用于标识和记录含有用户需要记录的主题的无线电或电视广播的片断的计算机化个人信息检索系统。所需要的片断一般根据用户输入的关键词来标识。在典型的应用中,计算机系统在后台运行,监视来自诸如因特网的源的信息的内容。内容选择是由用户所提供的关键词引导的。如果在关键词与所监视信息的内容之间发现匹配,就将该信息存储起来,供用户以后回放或观看。尽管下载的信息可能包含向也能被用户下载的音频或视频剪辑(clips)的链接,对要存储的信息的选择主要是根据用户所提供的关键词载广播材料中出现的频率。允许用户选择和检索部分的无线电或电视节目供以后回放的计算机化个人信息检索系统,一般满足三个主要条件。第一,一般有某种系统和方法用于将输入的视频信号解析(parsing)成视频信号的可视成分、音频成分和文本成分。第二,一般有某种系统和方法本文档来自技高网...

【技术保护点】
一种在信息处理系统(105)中使用的用于自动分类文本的装置,包含:一个文本分类器控制器(110,275),能够读取文本,文本有至少一个关键词,包含在所述文本内的至少一个故事片断内;并且能标识所述文本的每行内的关键词,并响应标识某文本行内 的所述关键词的至少一个,分类所述文本行为所述文本内所述至少一个故事片断的一部分。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:TE麦吉N迪米特罗瓦
申请(专利权)人:皇家菲利浦电子有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1