【技术实现步骤摘要】
【国外来华专利技术】
本公开内容涉及一种用于基于文本文档提供数字信息的方法。此外,本公开内容涉及一种数据处理装置、一种计算机程序,且涉及一种适用于执行该方法的非暂存性计算机可读介质。
技术介绍
已知与用于将文本显示给用户的显示器结合地使用电子数据处理设备。例如,用户在所谓的“电子书阅读器”设备上而非印刷媒体上阅读文本(例如,书籍和杂志)正变得日益流行。同样地,用户使用桌上型电脑、膝上型电脑、或者平板电脑从互联网下载文本并且在与计算机通信或者内置于计算机中的显示设备上阅读文本变得越来越流行。如果有兴趣获得与文本有关的进一步信息,则用户可以使用(例如)搜索引擎来输入查询更多信息。在此所提供的〝背景〞说明是用于一般性地呈现本专利技术的背景之目的。在此背景章节,以及在申请时可能不被认定为现有技术的说明观点中所述范围内的目前所指名专利技术人的著述,并未被明确地或暗示地认可作为相对本专利技术的现有技术。
技术实现思路
本专利技术的目的是提供一种增强用户阅读体验的方法。通过根据独立权利要求的一种方法、数据处理装置、计算机程序、以及非暂存性计算机可读介质实现了此目的。一种用于基于文本文档提供数字信息的方法,包括:针对文本文档的至少第一章节(passage,片段),使用第一自然语言分析(natural language analysis,自然语言分析法)生成指示第一章节的主题的第一主题数据;使用第一主题数据执 ...
【技术保护点】
一种用于基于文本文档提供数字信息的方法,包括:使用第一自然语言分析为所述文本文档中的至少第一章节生成指示所述第一章节的主题的第一主题数据,使用所述第一主题数据执行所述数字信息的第一搜索,所述第一搜索提供第一搜索结果,将所述第一搜索结果链接至所述第一章节,并且应请求显示所述第一搜索结果。
【技术特征摘要】
【国外来华专利技术】2012.07.13 EP 12005169.31.一种用于基于文本文档提供数字信息的方法,包括:
使用第一自然语言分析为所述文本文档中的至少第一章节生成
指示所述第一章节的主题的第一主题数据,
使用所述第一主题数据执行所述数字信息的第一搜索,所述第
一搜索提供第一搜索结果,
将所述第一搜索结果链接至所述第一章节,并且
应请求显示所述第一搜索结果。
2.根据权利要求1所述的方法,进一步包括:
加载所述第一搜索结果的内容。
3.根据权利要求1或2所述的方法,进一步包括:
根据显示参数显示所述第一章节,其中
根据所述第一主题数据、所述第一搜索结果及所述第一搜索结
果的语义内容中的至少一个确定所述显示参数。
4.根据前述权利要求中任一项所述的方法,其中
所述第一搜索结果与所述第一章节一起显示。
5.根据前述权利要求中任一项所述的方法,包括:
一旦选择所述第一搜索结果中包含的第二文本文档,使用第二
自然语言分析为所述第二文本文档中的至少第二章节生成指示所述
第二章节的主题的第二主题数据;
使用所述第二主题数据执行进一步的数字信息的第二搜索,所
述第二搜索提供第二搜索结果,并且
将所述第二搜索结果链接至所述第二章节。
6.根据权利要求5所述的方法,其中
还使用所述第一主题数据进一步执行所述第二搜索。
7.根据权利要求5或6所述的方法,其中
所述第一主题数据与所述第二主题数据相比对所述第二搜索具
有较小的影响。
8.根据前述权利要求中任一项所述的方法,其中
当执行所述第一搜索时,使用来自预定次数的先前搜索的主题
数据,并且
在所述第一搜索的搜索查询中,包含来自所述先前搜索的搜索
词语。
9.根据前述权利要求中任一项所述的方法,其中
一旦选择所述文本文档中包含的第三章节,使用所述第一主题
数据和第三主题数据执行第三搜索,所述第三搜索提供精确的搜索
结果作为所述第一搜索结果,其中
使用第三自然语言分析来生成所述第三主题数据并且所述第三
主题数据指示所述第三章节的语义内容。
10.根据权利要求9所述的方法,其中
所述第一主题数据与所述第三主题数据相比对所述第三搜索具
有更多或更少的影响。
11.根据权利要求5至10中任一项所述的方法,其中,所述执行所述第
二搜索使用另一用户的搜索历史数据。
12.根据前述权利要求中任一项所述的方法,其中
所述第一章节包括所述文本文档中的多个短语、句子和/或段
落,所述短语、句子和/或段落具有相应的语义内容,并且其中
通过根据所述文本文档的各部分的各自的语义内容将所述各部
分进行聚类来自动地确定所述多个短语、句子和/或段落。
13.根据前述权利要求中任一项所述的方法,其中
使用以下选项中的至少一个,基于在各个章节和/或在相邻章节
中识别的字词确定所述各个章节的所述第一主题数据、所述第二主
题数据和/或所述第三主题数据:
-所述字词在所述各个章节中的频率,
-所述字词在所述文本文档中的频率,
-所述字词在所述文本文档中和在进一步的文本文档的集合中
的词语频率-逆文档频率,
-所述字词至本体的映射,
-与至少一个所述字词相关联的各个权重,使用所述至少一个字
词的出现频率和/或所述至少一个字词距选择项的距离确定所述各
个权重,以及
-所述字词的语义分析。
14.根据前述权利要求中任一项所述的方法,其中
应所述请求,所述第一搜索结果显示在列表中,其中所述列表
和/或所述列...
【专利技术属性】
技术研发人员:威廉·哈格,托马斯·克姆普,
申请(专利权)人:索尼公司,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。