节目检索装置及节目检索方法制造方法及图纸

技术编号:8134239 阅读:158 留言:0更新日期:2012-12-27 13:42
无论有无字幕数据,均可适当检索节目、节目内的规定场景。节目检索装置420具有:表格更新部180,提取节目码流中含有的字幕数据或节目信息,分割为词素,将该词素登录到许可单词表格;节目保持部464;数据获取部482,获取和节目相关的文本数据,并且使获取时间信息关联;数据加工部184,将文本数据分割为词素,分割的词素未登录到许可单词表格时,将词素置换为预先设定的标记;索引授与部492,将置换的文本数据、及获取时间信息的组作为索引数据授与保持的节目码流;节目提取部494,根据关键字和索引数据,提取节目或节目内的规定场景(图11)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种根据任意步骤加工文本数据、作为索引数据用于检索的。
技术介绍
在电视播放中,将每天播放的节目暂时存储到装置中,用户事后可收视收听该存储的节目,这一技术一直被使用。其中,当节目中附加了字幕数据时(文字多重播放),将该字幕数据作为索引数据与节目、节目内的规定场景关联后,节目检索装置通过对索引数据进行关键字检索,可从存储的节目中迅速提取用户所需的节目、节目内的规定场景。并且下述技术也为人所知(例如专利文献I):根据辞典数据等将任意的文字串和说明该文字串的文章建立关联并保持到数据库装置中,在获取节目的字幕数据时,将该字幕数据分割为词素,比较该词素和数据库装置中保持的文字串,仅突出显示一致的词素。用户仅通过选择该突出显示的词素,就可参照数据库装置中存储的说明该词素的文章。现有技术文献专利文献专利文献I :专利第3538955号
技术实现思路
专利技术要解决的问题目前,从地波模拟播放到地波数字播放的转换获得进展。因此,在地波数字播放中,字幕数据、节目信息与节目同时作为节目码流多重化播放的情况较多,将字幕数据、节目信息作为检索用的索引数据使用的上述技术可有效地使用。但是,即使是地波数字播放,节目也未必附加字幕数据。例如,对于新闻、直播这样的无法预先提示其播放内容的,不含有字幕数据,或者即使含有也是标题等极有限的信息。因此,在装置中存储的多个节目中,含有(附加)字幕数据的节目和不含有(不附力口)字幕数据的节目混合存在。换言之,附加了索引数据的节目和没有索引的节目混合存在。因此,后者的节目(未附加字幕数据的节目)不能变为检索对象,从而难以作为收视收听对象提取。这样一来,即使检索存储的节目、节目内的规定场景,也会产生无法适当提取所需的节目、节目内的规定场景的情况。因此,本专利技术鉴于这一问题,其目的在于提供一种无论有无字幕数据均可适当检索节目、节目内的规定场景的。用于解决问题的手段为解决上述课题,本专利技术提供下述。(I)一种节目检索装置,其特征在于,具有表格保持部,保持使多个词素和其出现次数建立对应的许可单词表格;节目码流获取部,获取根据播放道德规定生成的节目码流;表格更新部,在获取的上述节目码流中含有字幕数据或作为与节目内容相关的第I文本数据的节目信息时,从上述节目码流中提取上述字幕数据或上述节目信息,分割为词素,如果分割的上述词素在上述许可单词表格中不存在,则将该词素登录在上述许可单词表格中,如果分割的上述词素在上述许可单词表格中存在,则更新和上述词素对应的出现次数;节目保持部,保持获取的节目码流中含有的节目;数据获取部,获取与所保持的上述节目相关的第2文本数据,并且与获取时间信息建立关联;数据加工部,将上述第2文本数据分割为词素,如果分割的上述词素未登录在上述许可单词表格中,或者分割的上述词素虽然登录在上述许可单词表格中但与该词素对应的出现次数小于预先设定的第I阈值,则将上述词素置换为预先设定的标记,作为第3文本数据再结合;索引授与部,将下述组合作为索引数据授与保持的上述节目再结合的上述第3文本数据;与和该第3文本数据对应的上述第2文本数据建立关联的上述获取时间信息;节目提取部,根据为进行检索而输入的关键字和上述索引数据,提取上述节目保持部中保持的节目或节目内的规定场景。(2)—种节目检索装置,其特征在于,具有表格保持部,保持使多个词素和其出现次数建立对应的许可单词表格;节目信息获取部,获取根据播放道德规定生成的、作为和节目内容相关的第I文本数据的节目信息;表格更新部,将上述节目信息分割为词素,如果分割的上述词素在上述许可单词表格中不存在,则将该词素登录在上述许可单词表格中,如果分割的上述词素在上述许可单词表格中存在,则更新和上述词素对应的出现次数;节目保持部,保持获取的节目码流中含有的节目;数据获取部,获取与所保持的上述节目相关的第2文本数据,并且与获取时间信息建立关联;数据加工部,将上述第2文本数据分割为词素,如果分割的上述词素未登录在上述许可单词表格中,或者分割的上述词素虽然登录在上述许可单词表格中但与该词素对应的出现次数小于预先设定的第I阈值,则将上述词素置换为预先设定的标记,作为第3文本数据再结合;索引授与部,将下述组合作为索引数据授与保持的上述节目再结合的上述第3文本数据;与和该第3文本数据对应的上述第2文本数据建立关联的上述获取时间信息;节目提取部,根据为进行检索而输入的关键字和上述索引数据,提取上述节目保持部中保持的节目或节目内的规定场景。(3)根据上述(I)或(2)所述的节目检索装置,其特征在于,对于上述索引授与部,保持的上述节目中如果附加了字幕数据,则将该字幕数据作为索引数据授与上述节目,上述节目中如果未附加字幕数据,或者视为未附加字幕数据,则上述索引授与部将再结合的上述第3文本数据作为索引数据授与上述节目。(4)根据上述(3)所述的节目检索装置,其特征在于,上述索引授与部在作为每I秒的字幕数据数的字幕率小于预先设定的第2阈值时,视为上述节目中未附加字幕数据。(5) 一种节目检索方法,其特征在于获取根据播放道德规定生成的节目码流,在获取的上述节目码流中含有字幕数据或作为与节目内容相关的第I文本数据的节目信息时,从上述节目码流中提取上述字幕数据或上述节目信息,分割为词素,如果分割的上述词素在使多个词素和其出现次数建立对应的许可单词表格中不存在,则将该词素登录到上述许可单词表格中,如果分割的上述词素在上述许可单词表格中存在,则更新和上述词素对应的出现次数,将获取的节目码流中含有的节目保持在节目保持部中,获取与所保持的上述节目相关的第2文本数据,并且与获取时间信息建立关联,将上述第2文本数据分割为词素,如果分割的上述词素未登录在上述许可单词表格中,或者分割的上述词素虽然登录在上述许可单词表格中但与该词素对应的出现次数小于预先设定的第I阈值,则将上述词素置换为预先设定的标记,作为第3文本数据再结合,将下述组合作为索引数据授与保持的上述节目再结合的上述第3文本数据;与和该第3文本数据对应的上述第2文本数据建立关联的上述获取时间信息,根据为进行检索而输入的关键字和上述索引数据,提取上述节目保持部中保持的节目或节目内的规定场景。(6) 一种节目检索方法,其特征在于获取根据播放道德规定生成的、作为和节目内容相关的第I文本数据的节目信息,将上述节目信息分割为词素,如果分割的上述词素在使多个词素和其出现次数建立对应的许可单词表格中不存在,则将该词素登录在上述许可单词表格中,如果分割的上述词素在上述许可单词表格中存在,则更新和上述词素对应的出现次数,将获取的节目码流中含有的节目保持在节目保持部,获取与所保持的上述节目相关的第2文本数据,并且与获取时间信息建立关联,将上述第2文本数据分割为词素,如果分割的上述词素未登录在上述许可单词表格中,或者分割的上述词素虽然登录在上述许可单词表格中但与该词素对应的出现次数小于预先设定的第I阈值,则将上述词素置换为预先设定的标记,作为第3文本数据再结合,将下述组合作为索引数据授与保持的上述节目再结合的上述第3文本数据;与和该第3文本数据对应的上述第2文本数据建立关联的上述获取时间信息,根据为进行检索而输入的关键字和上述索引数据,提取上述节目保·持部中保持的节目或节目内本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.10.14 JP 2010-2320081.一种节目检索装置,其特征在于,具有 表格保持部,保持使多个词素和其出现次数建立对应的许可单词表格; 节目码流获取部,获取根据播放道德规定生成的节目码流; 表格更新部,在获取的上述节目码流中含有字幕数据或作为与节目内容相关的第I文本数据的节目信息时,从上述节目码流中提取上述字幕数据或上述节目信息,分割为词素,如果分割的上述词素在上述许可单词表格中不存在,则将该词素登录在上述许可单词表格中,如果分割的上述词素在上述许可单词表格中存在,则更新和上述词素对应的出现次数; 节目保持部,保持获取的节目码流中含有的节目; 数据获取部,获取与所保持的上述节目相关的第2文本数据,并且与获取时间信息建立关联; 数据加工部,将上述第2文本数据分割为词素,如果分割的上述词素未登录在上述许可单词表格中,或者分割的上述词素虽然登录在上述许可单词表格中但与该词素对应的出现次数小于预先设定的第I阈值,则将上述词素置换为预先设定的标记,作为第3文本数据再结合; 索引授与部,将下述组合作为索引数据授与保持的上述节目再结合的上述第3文本数据;与和该第3文本数据对应的上述第2文本数据建立关联的上述获取时间信息; 节目提取部,根据为进行检索而输入的关键字和上述索引数据,提取上述节目保持部中保持的节目或节目内的规定场景。2.一种节目检索装置,其特征在于,具有 表格保持部,保持使多个词素和其出现次数建立对应的许可单词表格; 节目信息获取部,获取根据播放道德规定生成的、作为和节目内容相关的第I文本数据的节目信息; 表格更新部,将上述节目信息分割为词素,如果分割的上述词素在上述许可单词表格中不存在,则将该词素登录在上述许可单词表格中,如果分割的上述词素在上述许可单词表格中存在,则更新和上述词素对应的出现次数; 节目保持部,保持获取的节目码流中含有的节目; 数据获取部,获取与所保持的上述节目相关的第2文本数据,并且与获取时间信息建立关联; 数据加工部,将上述第2文本数据分割为词素,如果分割的上述词素未登录在上述许可单词表格中,或者分割的上述词素虽然登录在上述许可单词表格中但与该词素对应的出现次数小于预先设定的第I阈值,则将上述词素置换为预先设定的标记,作为第3文本数据再结合; 索引授与部,将下述组合作为索引数据授与保持的上述节目再结合的上述第3文本数据;与和该第3文本数据对应的上述第2文本数据建立关联的上述获取时间信息; 节目提取部,根据为进行检索而输入的关键字和上述索引数据,提取上述节目保持部中保持的节目或节目内的规定场景。3.根据权利要求I或2所述的节目检索装...

【专利技术属性】
技术研发人员:藤井毅也
申请(专利权)人:JVC建伍株式会社
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1