信息处理设备、信息处理方法和程序技术

技术编号:2917587 阅读:181 留言:0更新日期:2012-04-11 18:40
一种信息处理设备,包括:形态分析装置,用于对文本文件进行形态分析;管理装置,用于管理表示预定词类的语素的连接关系的连接模式;以及提取装置,用于从通过由形态分析装置进行形态分析而获得的语素串中提取短语,该短语包括具有与由管理装置管理的连接模式所表示的连接关系相同的连接关系的多个语素。

【技术实现步骤摘要】
对相关申请的交叉引用本专利技术包含涉及2007年9月5日提交日本专利局的日本专利申请JP2007-230622的主题,其全部内容通过引用合并与此。
本专利技术涉及信息处理设备、信息处理方法和程序。例如,本专利技术涉及能够提取可以用作内容推荐理由的短语的信息处理设备、信息处理方法和程序。
技术介绍
通常通过自然语言处理实现相关技术的关键字/短语提取技术(日本未经审查的专利申请公开No.2006-209173)。迄今为止,市场上可用的相关技术的文本挖掘工具中的、以及Web应用中的关键字/短语提取功能的目的是用于提取文本文件和对于查询的问题回答(日本未经审查的专利申请公开No.2006-344102)。近年来,在一些网站或AV(视听)设备中已经实现了内容推荐系统(日本未经审查的专利申请公开No.2006-309751)。在这些系统中,一些设备具有推荐内容和呈现从包括内容信息描述的文本文件中提取的单词级关键字或全部句子的功能。
技术实现思路
如果如日本未经审查的专利申请公开No.2006-209173中所描述的那样通过自然语言处理来实现关键字/短语提取技术,则使用语法分析技术是绝对必要的,如从文本文件中提取段及进行修改等。为了优化语法分析算法,需要使用大规模的语料库数据进行学习。这样,在时间和整个系统方面成本很高。-->日本未经审查的专利申请公开No.2006-344102中公开的关键字/短语提取功能的目的不同于从描述内容的评论或赞誉的文本文件中提取特征短语。用户难以通过使用单词或全部句子来呈现推荐理由的功能立即掌握内容的特征,如在日本未经审查的专利申请公开No.2006-309751中所公开的那样。本专利技术是在考虑了这些情况的背景下作出的,例如希望可提取可以用作内容推荐理由的短语。根据本专利技术的一个实施例,提供了一种信息处理设备,包括:形态分析装置,用于对文本文件进行形态分析;管理装置,用于管理表示预定词类的语素的连接关系的连接模式;以及提取装置,用于从通过由形态分析装置进行形态分析而获得的语素串中提取短语,该短语包括具有与由管理装置管理的连接模式所表示的连接关系相同的连接关系的多个语素。在本专利技术的一个实施例中,管理装置可以管理每个连接模式的权重,提取装置可以根据表示包含在短语中的语素的连接关系的连接模式来给所提取的短语赋予权重。本专利技术的实施例还可以包括:推荐装置,用于选择要推荐给用户的内容;以及显示控制装置,用于将由推荐装置选择的内容的信息显示给用户使用的信息处理终端。在此情况下,形态分析装置可以对由推荐装置选择的内容的文本文件进行形态分析,提取装置可以从通过形态分析装置对由推荐装置选择的内容的文本文件进行形态分析所获得的语素中提取短语,显示控制装置还可以将由提取装置提取的短语显示为内容的推荐理由。在本专利技术的一个实施例中,显示控制装置可基于由提取装置向各短语赋予的权重来选择要显示为内容的推荐理由的短语。在本专利技术的一个实施例中,管理装置可根据用户的评价来更新和管理每个连接模式的权重,其中,该用户已经检查了由显示控制装置显示为内容的推荐理由的短语。根据本专利技术的另一个实施例,提供了一种使计算机执行包括下列步骤的处理的程序:对文本文件进行形态分析;管理表示预定词类的语素的连接关系的连接模式;以及从通过由形态分析步骤进行形态分析而获得的语素串中提取短语,该短语包括具有与由所管理的连接模式表示的连接关系相同的连接关系的多个语素。-->在本专利技术的一个实施例中,对文本文件进行形态分析,管理表示预定词类的语素的连接关系的连接模式,以及从通过执行形态分析而获得的语素串中提取短语,该短语包括具有与所管理的连接模式所表示的连接关系相同的连接关系的多个语素。通过本专利技术的一个实施例,可以例如提取能够用作内容的推荐理由的短语。附图说明图1示出了根据本专利技术一个实施例的内容推荐系统的配置的实例图;图2示出了内容推荐服务器的硬件配置的实例框图;图3示出了内容推荐服务器的功能配置框图;图4示出了图3中的推荐理由生成部分的配置的实例框图;图5示出了内容推荐服务器的内容推荐处理的流程图;图6示出了在图5的步骤S2中执行的文本文件分析处理的流程图;图7示出了文本文件的实例图;图8示出了形态分析的结果图;图9示出了形态分析的结果图,是图8的继续;图10示出了在图6的步骤S15中执行的词类连接短语分析处理的流程图;图11示出了词类连接模式的给定值(index value)的实例图;图12示出了各词类连接模式的权重的实例图;图13示出了所确定的短语的实例图;图14示出了推荐屏的显示的实例图;以及图15示出了评价屏的显示的实例图。具体实施方式下面,将对本专利技术的实施例进行描述。将如下地示范本专利技术的构成特征和说明书或附图中所描述的实施例之间的关系。此描述用于确认在说明-->书或附图中包括支持本专利技术的实施例。相应地,如果存在包括在说明书或附图中的实施例,但这里包括的实施例未作为对应于本专利技术的构成特征的实施例,此事实并不意味该实施例不对应于本专利技术的构成特征。相反,如果这里包括作为对应于本专利技术的构成特征的实施例,此事实并不意味该实施例不对应于该构成特征之外的构成特征。根据本专利技术的一个实施例,提供了一种信息处理设备(例如,图1中的内容推荐服务器1),包括:形态分析装置(例如,图4中的形态分析部分42),用于对文本文件进行形态分析;管理装置(例如,图4中的参数管理部分43),用于管理表示预定词类的语素的连接关系的连接模式;以及提取装置(例如,图4中的短语提取部分44),用于从通过由形态分析装置进行形态分析而获得的语素串中提取短语,该短语包括具有与由管理装置管理的连接模式所表示的连接关系相同的连接关系的多个语素。信息处理设备还可以包括:推荐装置(例如,图3中的内容推荐部分32),用于选择要推荐给用户的内容;以及显示控制装置(例如,图3中的显示数据生成部分34),用于将由推荐装置选择的内容的信息显示给用户使用的信息处理终端。根据本专利技术的另一个实施例,提供了一种使计算机执行包括下列步骤的处理的程序:对文本文件进行形态分析;管理表示预定词类的语素的连接关系的连接模式;以及从通过由形态分析步骤进行形态分析而获得的语素串中提取短语(例如,图6中的步骤S15),该短语包括具有与由所管理的连接模式表示的连接关系相同的连接关系的多个语素。下面,将参考附图对本专利技术的实施例进行描述。图1示出了根据本专利技术一个实施例的内容推荐系统的配置的实例图。内容推荐系统包括通过因特网3彼此连接的内容推荐服务器1和用户终端2。虽然在图1中只示出了一个终端作为能够与内容推荐服务器1进行通信的终端,但是在现实中,多个终端被连接到因特网3,并能够与内容推荐服务器1进行通信。内容推荐服务器1对如电视节目等的内容的信息进行管理,从其信息作为推荐内容而被管理的内容中选择预定的内容,并通过因特网3将推荐内容的信息提供给用户终端2。对于推荐内容,例如选择符合用户终端2的用户的喜好的内容。可以选择涉及简单地吸引公众注意力的主题的内-->容,或由广播电台强烈推荐的内容。基于从内容推荐服务器1传送的信息,内容推荐屏被显示在用户终端2上。在内容推荐屏上,不仅显示推荐内容的信息如标题、摘要等,而且显示推荐理由。推荐理由是通过从推荐内本文档来自技高网...

【技术保护点】
一种信息处理设备,包括: 形态分析装置,用于对文本文件进行形态分析; 管理装置,用于管理表示预定词类的语素的连接关系的连接模式;以及 提取装置,用于从通过由形态分析装置进行形态分析而获得的语素串中提取短语,该短语包括具有与由管理装置管理的连接模式所表示的连接关系相同的连接关系的多个语素。

【技术特征摘要】
JP 2007-9-5 2007-2306221.一种信息处理设备,包括:形态分析装置,用于对文本文件进行形态分析;管理装置,用于管理表示预定词类的语素的连接关系的连接模式;以及提取装置,用于从通过由形态分析装置进行形态分析而获得的语素串中提取短语,该短语包括具有与由管理装置管理的连接模式所表示的连接关系相同的连接关系的多个语素。2.根据权利要求1所述的信息处理设备,其中,管理装置管理每个连接模式的权重;以及提取装置根据表示包含在短语中的语素的连接关系的连接模式来给所提取的短语赋予权重。3.根据权利要求2所述的信息处理设备,还包括:推荐装置,用于选择要推荐给用户的内容;以及显示控制装置,用于将由推荐装置选择的内容的信息显示给用户使用的信息处理终端;其中,形态分析装置对与由推荐装置选择的内容有关的文本文件进行形态分析;提取装置从通过形态分析装置对与由推荐装置选择的内容有关的文本文件进行形态分析所获得的语素串...

【专利技术属性】
技术研发人员:宫嵜充弘
申请(专利权)人:索尼株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1