当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理设备、信息处理方法和程序技术

技术编号:8452974 阅读:133 留言:0更新日期:2013-03-21 15:43
本发明专利技术公开了一种信息处理设备、信息处理方法和程序,该信息处理设备对一个或多个所收集的文档执行主题分析以计算表示构成所收集的文档的每个语句对于局部主题的每个项目的适合度的概率,对所收集的文档执行语言分析以检测局部主题的每个项目中的特有表述方式,基于评价者对构成所收集的文档的每个语句的评价而设置该语句的主题有用度,基于主题分析结果和主题有用度而对局部主题的每个项目设置总评价值,基于总评价值选择局部主题的项目,以及从所收集的文档中提取适合于所选择的局部主题的项目中的特有表述方式的语句作为深奥文本候选。

【技术实现步骤摘要】
信息处理设备、信息处理方法和程序
本公开内容涉及一种信息处理设备、信息处理方法和程序,更具体地,涉及使得能够从大量文档中提取记载了关于关注目标(诸如,人、内容和想法)的知识的深奥文本的信息处理设备、信息处理方法和程序。
技术介绍
在现有技术中,已广泛地尝试通过统计地分析大量文档(对大量文档执行统计自然语言处理)来获得知识。例如,在没有创建辞典的专业领域中,通过对专业领域中的文档执行统计自然语言处理来自动创建该专业领域的辞典。在统计自然语言处理中,经常使用上下文信息(表示包括文档中引起关注的词和出现在该词前后的预定数量的词的词群)的特征量。另外,通过计算上下文信息的特征量的类似度,执行引起关注的词的同义词的分析、多义性的分析、两个名词之间的关系的分析、 词的情态(modality)的分析等。例如,在 Takaaki Hasegawa, Satoshi Sekine and Ralph Grishman 在 Proceedings of the Conference of the Association for Computational Linguistics 2004 中发表的文献“本文档来自技高网...

【技术保护点】
一种信息处理设备,包括收集单元,收集包括一个或多个语句的文档;主题分析单元,通过对所收集的文档执行主题分析,计算表示构成所收集的文档的每个语句对于局部主题的每个项目的适合度的概率;语言分析单元,通过对所收集的文档执行语言分析,检测所述局部主题的每个项目中的特有表述方式;评价设置单元,基于评价者对构成所收集的文档的每个语句的评价,设置所述语句的主题有用度,并且基于主题分析结果和所述主题有用度而对所述局部主题的每个项目设置总评价值;以及深奥文本提取单元,基于所述总评价值选择所述局部主题的项目,并且从所收集的文档提取适合于所选择的所述局部主题的项目中的特有表述方式的语句作为深奥文本候选。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:宫嵜充弘高松慎吾
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1