引用解释制造技术

技术编号:16048964 阅读:71 留言:0更新日期:2017-08-20 08:40
示例涉及引用解释。本文中提供了一种用以提供引用解释的过程。该过程分析原始文档以提取引用声明。该过程生成被引用文档的可能对应于引用声明的候选片段的集合。该过程还分析候选片段的集合。

【技术实现步骤摘要】
【国外来华专利技术】引用解释
技术介绍
在线教育系统和电子书已经开始占主要地位。读者可能检查引用来回顾关于被引用的术语的定义或获得关于被引用的术语的进一步解释。读者还可能想要确定参考材料是否以所声称的方式支持作者的论证,或者估计作者使用的材料的力量和有效性。附图说明以下详细描述参考附图,在所述附图中:图1图示了根据示例的用于生成引用解释的系统的框图;图2-3图示了根据示例的引用解释设备的框图;图4-5图示了根据示例的用于提供引用解释的过程的流程图;图6-7图示了根据示例的用于提取引用声明的过程的流程图;图8-9图示了根据示例的用于提供被引用文档的候选片段的过程的流程图;以及图10-12图示了根据示例的引用解释的示意图。具体实施方式以下详细描述涉及附图。每当可能时,在图和以下描述中使用相同的参考号码来指代相同或类似的部分。虽然在本文档中描述了若干示例,但是修改、改编和其他实现是可能的。相应地,以下详细描述不限制所公开的示例。代之以,所公开的示例的适当范围可以由所附权利要求书限定。在线阅读和学习越来越流行并且提供许多优点。例如,在线文档可以包括到参考材料的链接,所述参考材料诸如被引用文档、定义和解释。引用可以包括单个引用和/或成列引用。第一示例包括一列引用,“关联规则不同于我们的优先级模式并且其对推荐与特定项(item)[9,16,27]相关的项有用”。第二示例包括单个引用,“查询个性化[34]”。伴随第一和第二示例的文本潜在地是方法或特征的概要、术语,其可能被定义在一个或多个引用和/或引述中。然而,在阅读和学习过程期间,参考材料还可能给读者提供干扰和打断。示例涉及可以为独立的文档提供参考材料的引用解释。提供引用解释的过程包括分析原始文档以提取引用声明。该过程生成被引用文档的可能对应于引用声明的候选片段的集合。该过程还基于预定义标准来评价(evaluate)候选片段的集合。还可以通过该过程提供对引用解释的推荐。如本文中使用的那样,“原始文档”指代读者正在查看的诸如文本和/或图片之类的内容。该内容可以包含支持作者在文档中呈现的文本和其他内容的引用。使用引用解释可以通过利用本文中提供的参考材料制作独立的文档来减少干扰和打断。如本文中使用的那样,“引用”指代对在文档的主体中嵌入的来源的参考。引用可以以不同的形式出现。例如,引用可以是一列引用或单个引用。例如,引用可能伴随有可以是来自被引用文档的引述、释义、概要和/或定义的文本。引用可以以不同风格出现,诸如:“Geo等人,[3]”、“[3]”、“[Geo93]”等。如本文中使用的那样,“被引用文档”指代参考的来源。来源可以是例如在引用中参考的文本或图像。所涉及的来源可以是书、文章、著名艺术作品、法律条款、判例法等。来源可能源于文档的物理副本,诸如书或出版物,或者来源可能源于文档的电子副本,诸如博客或在线文章。如本文中使用的被引用文档涉及至少一个来源。至少一个来源不限于仅一个被引用文档,而还设想使用多个被引用文档。如本文中使用的那样,“引用声明”指代使用引用和/或提供引用的上下文(context)的文本。换言之,该文本要求使用特定引用。例如,“信息检索和信息过滤已经被称作“同一硬币的两面”(例如,[5])”。在该示例中,引述“同一硬币的两面”可以是提供引用(例如,“[5]”)的上下文的文本。如本文中使用的那样,“候选片段”指代被引用文档的可以解释、定义、支持和/或一般地提供与引用声明相关的较多细节的部分。如本文中使用的那样,“经修订(revised)的候选片段”指代被修改或调整的候选片段。例如,经修订的候选片段可以是合并在一起的两个候选片段,或被分成两个候选片段的一个候选片段。现在参考各图,图1图示了根据示例的用于提供引用解释的系统的框图。可以在不背离所公开的示例的范围的情况下以多个不同的配置来实现系统100。在图1中,系统100可以包括引用解释设备120、文档设备140、数据库160和用于将引用解释设备120与数据库160和/或文档设备140连接的网络180。引用解释设备120可以是执行与所公开的示例一致的各种功能的计算系统,所述各种功能诸如提供被引用文档的引用解释。例如,引用解释设备120可以是台式计算机、膝上型计算机、平板计算设备、移动电话、服务器和/或任何其他类型的计算设备。在一些示例中,引用解释设备120可以使用对原始文档的部分的句法分析而从原始文档提取引用声明。例如,引用声明可以包括来自被引用文档的引述、释义、概要和/或定义。引用解释设备120可以对引用声明执行预处理以提供引用声明的表示。引用声明的表示可以以单词的向量、引用声明的主题表示、引用的确切的单词或短语(即引述)的形式。引用解释设备120可以基于预定义分类的指派对引用声明和/或引用声明的表示进行分类。例如,可以通过“定义”、“概要”、“引述”、“方法”和/或“概要”对引用声明归类来确定分类。可以使用不同的方法来执行分类,所述方法诸如决策树、规则或更复杂的方法。可以训练模型来考虑声明的句法、语法和语言特征。引用解释设备120还可以标识被引用文档的可能对应于引用声明的候选片段的集合。术语“可能对应”可以指代基于分析的关联和/或关系,即候选片段与引用声明之间的关联或关系。例如,可以将被引用文档和引用声明进行比较以生成匹配或解释引用声明的至少一个候选片段。可以选择被引用文档的该部分来表示至少一个候选片段。可以对候选片段的集合中的每个进行排名(rank)。排名可以包括基于至少一个标准给每个候选片段赋值,所述至少一个标准诸如关键术语的数目、术语的位置和/或片段在被引用文档中的位置。在标识候选片段的集合时,引用解释设备120可以调整或修改候选片段以将片段与引用声明更好地对准。例如,可以合并候选片段中的至少两个以形成新的或经修订的候选片段。可以确定经修订的候选片段的更新的排名。可以执行合并候选片段中的至少两个以基于排名标准提供更好地捕捉原始文档与被引用文档之间的关系的候选片段。排名标准可以指代被引用文档的基准点测定(benchmarking)特性,诸如关键术语、关键术语的频率、结构数据、分类数据和候选片段在被引用文档中的位置。根据另一示例,候选片段还可以被分裂成两个候选片段。如果确定候选片段过大或包含无关信息,则可以分裂该片段。分裂可以将候选片段分成至少两个候选片段,其具有初始候选片段的所有片段。替代地,可以移除初始候选片段的至少一个部分并且可以创建至少两个经修订的候选片段以集中在仅相关片段上并且省略无关片段。下面关于例如图2-12来更详细地描述引用解释设备120的示例和可以由引用解释设备120执行的某些功能。文档设备140可以是维持、接收或传送来自数据集合的数据的任何设备。例如,文档设备140可以是扫描设备或计算设备,诸如台式计算机、膝上型计算机、平板计算设备、移动电话、服务器或任何其他类型的计算设备。文档设备140可以接收、传送或否则访问数据集合,诸如文章和受控的数据集,用来为引用解释设备120收集数据。例如,文档设备140可以提供对文档的访问。文档设备140还可以收集、维持、查询和/或分析文档的数字版本。文档设备140可以包括处理器,并且可以经由处理器访问数据集合的数字版本,诸如原始文档和/或被引用文档。下面关于本文档来自技高网...
引用解释

【技术保护点】
一种用于提供引用解释的系统,包括:提取引擎,用以使用对原始文档的部分的句法分析而从原始文档提取引用声明;片段生成引擎,用以标识被引用文档的可能对应于引用声明的候选片段的集合;以及评价引擎,用以分析候选片段的集合以对候选片段的集合中的每个候选片段进行排名。

【技术特征摘要】
【国外来华专利技术】1.一种用于提供引用解释的系统,包括:提取引擎,用以使用对原始文档的部分的句法分析而从原始文档提取引用声明;片段生成引擎,用以标识被引用文档的可能对应于引用声明的候选片段的集合;以及评价引擎,用以分析候选片段的集合以对候选片段的集合中的每个候选片段进行排名。2.根据权利要求1所述的系统,其中提取引擎对引用声明执行预处理以提供声明的表示。3.根据权利要求1所述的系统,其中提取引擎基于预定义分类的指派对引用声明进行分类。4.根据权利要求1所述的系统,其中评价引擎合并候选片段中的至少两个以形成经修订的候选片段并且给经修订的候选片段提供更新的排名。5.一种非瞬时计算机可读存储介质,其被编码有指令,所述指令在被处理器执行时实行方法,使得过程:使用对原始文档的部分的句法分析从原始文档提取引用声明并对所述引用声明进行分类;生成被引用文档的可能对应于引用声明的候选片段的集合;以及分析候选片段的集合以对候选片段的集合中的每个候选片段进行排名。6.根据权利要求5所述的非瞬时计算机可读存储介质,其中引用声明包括从单词的向量、主题表示和确切的单词集合选择的至少一个结构。7.根据权利要求5所述的非瞬时计算机可读存储介质,其中基于可解释性得分来选择候选片段的集合中的...

【专利技术属性】
技术研发人员:G·库特里卡A·西米特西斯
申请(专利权)人:惠普发展公司有限责任合伙企业
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1