当前位置: 首页 > 专利查询>索尼公司专利>正文

提供文本阅读器的信息制造技术

技术编号:11152394 阅读:46 留言:0更新日期:2015-03-18 09:05
一种用于基于文本文档提供数字信息的方法,包括:使用第一自然语言分析为文本文档的至少第一章节生成指示第一章节的主题的第一主题数据,使用第一主题数据执行数字信息的第一搜索,第一搜索提供第一搜索结果,将第一搜索结果链接至第一章节,并且在请求时显示第一搜索结果。

【技术实现步骤摘要】
【国外来华专利技术】
本公开内容涉及一种用于基于文本文档提供数字信息的方法。此外,本公开内容涉及一种数据处理装置、一种计算机程序,且涉及一种适用于执行该方法的非暂存性计算机可读介质。
技术介绍
已知与用于将文本显示给用户的显示器结合地使用电子数据处理设备。例如,用户在所谓的“电子书阅读器”设备上而非印刷媒体上阅读文本(例如,书籍和杂志)正变得日益流行。同样地,用户使用桌上型电脑、膝上型电脑、或者平板电脑从互联网下载文本并且在与计算机通信或者内置于计算机中的显示设备上阅读文本变得越来越流行。如果有兴趣获得与文本有关的进一步信息,则用户可以使用(例如)搜索引擎来输入查询更多信息。在此所提供的〝背景〞说明是用于一般性地呈现本专利技术的背景之目的。在此背景章节,以及在申请时可能不被认定为现有技术的说明观点中所述范围内的目前所指名专利技术人的著述,并未被明确地或暗示地认可作为相对本专利技术的现有技术。
技术实现思路
本专利技术的目的是提供一种增强用户阅读体验的方法。通过根据独立权利要求的一种方法、数据处理装置、计算机程序、以及非暂存性计算机可读介质实现了此目的。一种用于基于文本文档提供数字信息的方法,包括:针对文本文档的至少第一章节(passage,片段),使用第一自然语言分析(natural language analysis,自然语言分析法)生成指示第一章节的主题的第一主题数据;使用第一主题数据执行关于数字信息的第一搜索,第一搜索提供第一搜索结果;将第一搜索结果链接至第一章节;并且经请求,将第一搜索结果与第一章节一起显示。一种数据处理装置包括:数据接收器,数据接收器适用于接收文本文档。自然语言分析器,自然语言分析器适用于对文本文档的第一章节执行第一自然语言分析并且适用于生成指示第一章节的主题的第一主题数据;数据处理器,数据处理器适用于使用第一主题数据执行关于数字信息的第一搜索,第一搜索提供第一搜索结果,并且数据处理器适用于将第一搜索结果链接至第一章节;以及显示器,显示器适用于经请求将第一搜索结果与第一章节一起显示。一种计算机程序包括计算机程序指令,该计算机程序指令在由计算机执行时使计算机执行下列方法,该方法包括:针对文本文档的至少第一章节,使用第一自然语言分析生成指示第一章节的主题的第一主题数据;使用第一主题数据执行关于数字信息的第一搜索,第一搜索提供第一搜索结果;将第一搜索结果链接至第一章节;并且经请求,将第一搜索结果与第一章节一起显示。此外,一种非暂存性计算机可读介质包括上述的计算机程序。已经通过一般介绍方式提供了上述章节,并且上述章节并不旨在限制所附权利要求的范围。通过参考结合附图的具体实施方式,将更好理解所描述的实施方式以及进一步的优点。附图中的元件相对于彼此不一定按比例绘制。附图说明当结合附图考虑时,通过参考下列细节描述,由于变得更易于理解,所以容易获得对本公开内容更为完整的认识和本公开内容的许多伴随优点,其中:图1示出了一种用于基于文本文档提供数字信息的方法;图2示出了图1中的方法与(非限制性)示范文本结合使用时的步骤;图3示出了通过图1中的方法结合示范文本实施时所实现的效果;图4示出了结合图1中的方法来产生迭代搜索方法可选执行的进一步步骤;图5示出了图4中所示的可选的进一步步骤对示例性文本实现的效果;图6示出了图4中所示的可选的进一步步骤在该方法的另一实施方式的效果;图7示出了结合图1中的方法来产生精确搜索方法可执行的进一步可选步骤。图8示出了图7中的可选方法步骤对示范文本的应用;图9示出了图1中的方法的协作应用;图10示出了基于自然语言分析的示范文本的聚类;图11示出了图1中方法的用于显示搜索结果的实施方式;图12示出了其中执行要被显示的搜索结果的关键字相关选择的另外实施方式;图13示出了其中数字信息的最佳匹配文档与文本文档一起显示的实施方式;图14示出了数据处理装置的实施方式;并且图15示出了数据处理装置的另外实施方式。具体实施方式现参考附图,其中,贯穿几幅图,相同参考标号指相同或者相应的部分,图1示出了一种用于基于文本文档提供数字信息的方法。在框100中,使用第一自然语言分析对文本文档的至少第一章节生成第一主题数据,第一主题数据指示第一章节的主题。文本文档可以是任何形式的文本,诸如,文本文件、在文本编辑器中待读取或者编辑的文本文档、在查看器中以查看格式(例如,“便携式文档格式”PDF)显示的文本文档、网页、电子存储的书籍或者杂志(例如“电子书”)、或者任何其他类型的电子存储文档。例如,文本文档可包括文本的一个或多个部分或者整体的ASCII表示、文本的一个或多个部分或者整体的Unicode表示、文本的一个或多个部分或者整体的XML表示、文本的一个或多个部分或者整体的HTML表示和/或文本的一个或多个部分或者整体的二进制表示。文本文档可以存储或者位于执行该方法的设备上、本地服务器和/或经由网络可以访问的远程服务器上。例如,网络可以是本地网络、内联网、或者互联网、或者任何其他网络,诸如用于电信等的网络。可以从文本文档中选择第一章节。第一章节可以是文本文档的任何片段(segment),诸如,片段包括几个段落、单个段落、几个或单个句子、几个或者单个短语和/或几个或者单个字词(word)。例如,该片段可包括不需要连续位于文本内的子片段。此外,在框100,也可以选择多个章节。例如,文本(即,整个文本或者该文本的整个显示部分)可被自动地划分成多个章节,例如,被划分成第一章节至第x章节。在这种情况下,可以选择单个章节(即,第一章节)和/或多个章节的子集,该子集包括多个所选择的章节。通过对触控式显示器的对应区域进行触摸或者通过命令,读者(例如)通过利用定点设备对其操作,可以明确选择第一章节(或相应地包括多个所选择的段落的子集)。此外,另外,例如,当读者侧重于、停留在或标志第一段第一章节或者对应章节时,例如,即使没有读者(reader)的注意(notice,通知),该选择可以隐含发生。在进行选择时,第一章节通过该方法可以但不必被自动地突出显示(highlight,加亮)。例如,根据用于突出显示的预定显示参数,第一章节可以其他格式来显示。显示参数可以由用户使用该方法进行设定或者可自动确定。当自动确定时,可以根据第一章节的本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201380037264.html" title="提供文本阅读器的信息原文来自X技术">提供文本阅读器的信息</a>

【技术保护点】
一种用于基于文本文档提供数字信息的方法,包括:使用第一自然语言分析为所述文本文档中的至少第一章节生成指示所述第一章节的主题的第一主题数据,使用所述第一主题数据执行所述数字信息的第一搜索,所述第一搜索提供第一搜索结果,将所述第一搜索结果链接至所述第一章节,并且应请求显示所述第一搜索结果。

【技术特征摘要】
【国外来华专利技术】2012.07.13 EP 12005169.31.一种用于基于文本文档提供数字信息的方法,包括:
使用第一自然语言分析为所述文本文档中的至少第一章节生成
指示所述第一章节的主题的第一主题数据,
使用所述第一主题数据执行所述数字信息的第一搜索,所述第
一搜索提供第一搜索结果,
将所述第一搜索结果链接至所述第一章节,并且
应请求显示所述第一搜索结果。
2.根据权利要求1所述的方法,进一步包括:
加载所述第一搜索结果的内容。
3.根据权利要求1或2所述的方法,进一步包括:
根据显示参数显示所述第一章节,其中
根据所述第一主题数据、所述第一搜索结果及所述第一搜索结
果的语义内容中的至少一个确定所述显示参数。
4.根据前述权利要求中任一项所述的方法,其中
所述第一搜索结果与所述第一章节一起显示。
5.根据前述权利要求中任一项所述的方法,包括:
一旦选择所述第一搜索结果中包含的第二文本文档,使用第二
自然语言分析为所述第二文本文档中的至少第二章节生成指示所述
第二章节的主题的第二主题数据;
使用所述第二主题数据执行进一步的数字信息的第二搜索,所
述第二搜索提供第二搜索结果,并且
将所述第二搜索结果链接至所述第二章节。
6.根据权利要求5所述的方法,其中
还使用所述第一主题数据进一步执行所述第二搜索。
7.根据权利要求5或6所述的方法,其中
所述第一主题数据与所述第二主题数据相比对所述第二搜索具
有较小的影响。
8.根据前述权利要求中任一项所述的方法,其中
当执行所述第一搜索时,使用来自预定次数的先前搜索的主题
数据,并且
在所述第一搜索的搜索查询中,包含来自所述先前搜索的搜索
词语。
9.根据前述权利要求中任一项所述的方法,其中
一旦选择所述文本文档中包含的第三章节,使用所述第一主题
数据和第三主题数据执行第三搜索,所述第三搜索提供精确的搜索
结果作为所述第一搜索结果,其中
使用第三自然语言分析来生成所述第三主题数据并且所述第三
主题数据指示所述第三章节的语义内容。
10.根据权利要求9所述的方法,其中
所述第一主题数据与所述第三主题数据相比对所述第三搜索具
有更多或更少的影响。
11.根据权利要求5至10中任一项所述的方法,其中,所述执行所述第
二搜索使用另一用户的搜索历史数据。
12.根据前述权利要求中任一项所述的方法,其中
所述第一章节包括所述文本文档中的多个短语、句子和/或段
落,所述短语、句子和/或段落具有相应的语义内容,并且其中
通过根据所述文本文档的各部分的各自的语义内容将所述各部
分进行聚类来自动地确定所述多个短语、句子和/或段落。
13.根据前述权利要求中任一项所述的方法,其中
使用以下选项中的至少一个,基于在各个章节和/或在相邻章节
中识别的字词确定所述各个章节的所述第一主题数据、所述第二主
题数据和/或所述第三主题数据:
-所述字词在所述各个章节中的频率,
-所述字词在所述文本文档中的频率,
-所述字词在所述文本文档中和在进一步的文本文档的集合中
的词语频率-逆文档频率,
-所述字词至本体的映射,
-与至少一个所述字词相关联的各个权重,使用所述至少一个字
词的出现频率和/或所述至少一个字词距选择项的距离确定所述各
个权重,以及
-所述字词的语义分析。
14.根据前述权利要求中任一项所述的方法,其中
应所述请求,所述第一搜索结果显示在列表中,其中所述列表
和/或所述列...

【专利技术属性】
技术研发人员:威廉·哈格托马斯·克姆普
申请(专利权)人:索尼公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1