The examples of this article expose measurements of multiple regions of digital content and determine the correlation between multiple regions of the digital content positioned adjacent to each other. The example discloses identifying breakpoints in digital content based on determined correlation measurements.
【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
电子出版涉及数字图书馆的发展和电子书籍、数字杂志的数字出版物。这些数字出版物可以由寻求传达特定想法的作者创建。此外,这些数字出版物可以用作学生从事信息和/或想法交换的学习工具。附图说明在附图中,相似的附图标号表示相似的组件或块。以下详细描述参考附图,其中:图1是获得数字内容的多个区域以用于断点识别的示例系统的框图;图2A是在其中将由多个区域组成的数字内容划分成多个章节的示例断点的框图;图2B是图示出根据针对彼此相邻定位的多个区域产生的相关性值的示例断点识别的图表;图3A是图示出数字内容的多个区域之中的章节的示例断点的图;图3B是区域与其中该区域所属章节和相邻章节的中心平均值之间的相似度的示例可视化的图;图4是获得数字内容的多个区域以用于基于相关性测量来识别数字内容的多个区域之间的断点的示例方法的流程图;图5是基于所调整的相关性测量来修改数字内容中所识别的断点的示例方法的流程图;图6是如果内容长度低于所确定的内容最小长度,则调整断点的示例方法的流程图;和图7是具有执行机器可读存储介质中的指令以用于基于相关性值和相似性值来修改所识别的断点的处理器的示例计算设备的 ...
【技术保护点】
一种系统,包括:处理引擎,用于获得数字内容的多个区域的顺序;相关性引擎,用于确定彼此相邻定位的数字内容的多个区域之间的相关性值;和识别引擎,用于:基于所述相关性值来识别所述数字内容的多个区域之间的断点;和在识别了所述断点时,保持所述数字内容的多个区域的顺序。
【技术特征摘要】
【国外来华专利技术】1.一种系统,包括:处理引擎,用于获得数字内容的多个区域的顺序;相关性引擎,用于确定彼此相邻定位的数字内容的多个区域之间的相关性值;和识别引擎,用于:基于所述相关性值来识别所述数字内容的多个区域之间的断点;和在识别了所述断点时,保持所述数字内容的多个区域的顺序。2.根据权利要求1所述的系统,其中,所述处理引擎还用于:将所述数字内容分割成所述多个区域;和从所述数字内容的多个区域的每个区域中移除停止和词干内容。3.根据权利要求1所述的系统,包括:调整引擎,用于:确定针对与所识别的断点相邻的数字内容的多个区域中的每个区域的所调整的相关性值;和根据所调整的相关性值来调整所识别的断点。4.一种在数字内容中创建断点的方法,所述方法包括:获得数字内容的多个区域;确定彼此相邻定位的所述数字内容的多个区域之间的相关性测量;和基于所确定的相关性测量来识别所述数字内容中的断点。5.根据权利要求4所述的方法,其中,所识别的断点包括识别包括所述数字内容的多个区域的章节和部分中的至少一个。6.根据权利要求4所述的方法,其中,确定彼此相邻定位的所述数字内容的多个区域之间的相关性测量包括:确定针对彼此相邻定位的多个区域的区域对的相关性值;和对多个相关性值之中的相关性值进行排序以识别所述数字内容中的断点。7.根据权利要求4所述的方法,其中,接收所述数字内容的多个区域包括:将所述数字内容分割成页面、段落和句子中的至少一个以产生所述多个区域。8.根据权利要求4所述的方法,包括:确定针对与所述断点相邻的数字内容的多个区域中的每个区域的所调整的相关性测量;和基于所调整的相关性测量来修改所述断点。9.根据权利要求4所述的方法,其中,基于所确定的相关性测量来识别所述数字内容中的断点包括:确定所述数字内容的总长度;基于所述数字内容的总长度来确定与所述断点相邻的内容的最小长度;确定与所述...
【专利技术属性】
技术研发人员:S·吴,刘磊,J·J·刘,
申请(专利权)人:惠普发展公司,有限责任合伙企业,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。