创作用于基于文本的文档的视觉表示制造技术

技术编号:18179054 阅读:20 留言:0更新日期:2018-06-09 20:55
本文中描述了用于创作针对基于文本的文档的视觉表示的技术。在一些示例中,这些技术利用自然语言处理(NLP)来处理文档内的文本。基于NLP,用户可以与文档交互地工作,以创建代表文档中文本的视觉表示。通过允许用户基于NLP来与文档交互地工作,这些技术可以为用户提供生成文档的特定概念的表示的能力。

【技术实现步骤摘要】
【国外来华专利技术】创作用于基于文本的文档的视觉表示
技术介绍
文本文档通常包括复杂的信息,其对于个人而言很难快速阅读和理解。这些文档可以包括法律文档、财务报告、科学论文、医学期刊文章等。如此,个人通常通过制订简要概述、创建图表、绘制图片等来概括这些文档的核心概念。然而,这些手动过程通常很耗时,并且不能准确地反映文档的核心概念。
技术实现思路
本文中所讨论的技术和构造便于针对基于文本的文档创作视觉表示。在一些示例中,这些技术可以包括:接收包括文本的文档,以及使用自然语言处理技术来处理文档。用户界面可以提供呈现文档的文档区域以及呈现用于文档的视觉表示的创作区域。可以接收对在用户界面的文档区域中呈现的文本的一部分的选择。基于自然语言处理技术,可以生成针对文本部分的视觉表示。该表示可以被提供用于在用户界面的创作区域中呈现。在一些示例中,可以接收对文本的另一部分的选择。基于自然语言处理技术,可以生成针对文本的其他部分的另一视觉表示。可以提供该另一视觉表示以供在用户界面的创作区域中呈现。在各种示例中,可以创建视觉表示与另一视觉表示之间的关联。提供本概述是为了以简化形式介绍将在以下具体实施方式中进一步描述的概念选择。本
技术实现思路
并非旨在确定所要求保护的主题的关键特征或基本特征,也不旨在用作确定所要求保护的主题的范围的辅助。术语“技术”比如可以是指如由上文和整个文档中所描述的上下文所准许的一个或多个系统、一个或多个方法、计算机可读指令、一个或多个模块、算法、硬件逻辑和/或一个或多个操作。附图说明参考附图对具体实施方式进行描述。在这些附图中,附图标记的一个或多个最左边的数字标识该附图标记首次出现的附图。不同附图中的相同附图标记指示相似或相同的项目。图1是描绘其中可以创作用于基于文本的文档的视觉表示的示例环境的框图。图2是描绘来自图1的服务提供商的一个或多个计算设备的示例细节的框图。图3A至图3D图示了用于创作针对文档的视觉表示的示例图形用户界面。图4图示了提供文本候选列表的示例图形用户界面。图5示出了呈现表格的视觉表示的示例GUI。图6图示了基于自然语言处理来创建节点图的示例过程。图7图示了用于文档的示例节点图。图8是用于创作用于文档的视觉表示的示例过程的流程图。图9是用于关联视觉表示的示例过程的流程图。图10是用于合并视觉表示的示例过程的流程图。具体实施方式本公开涉及用于创作针对基于文本的文档的视觉表示的技术。在一些示例中,这些技术利用自然语言处理(NLP)来处理文档内的文本。基于NLP,用户可以与文档交互地工作,以创建表示文档中的文本的视觉表示。通过利用NLP允许用户与文档交互地工作,本文中所描述的技术可以为用户提供快速和/或高效地生成文档概念(例如,核心概念或其他概念)的表示的能力。在本文中所描述的技术的一些示例中,系统可以为用户设备提供用户界面,其包括用于创建视觉表示的各种工具。用户界面可以包括呈现文档的文档区域(即,第一部分)以及显示用于文档内的文本的视觉表示的创作区域(即,第二部分)。用户可以选择文档区域中的文档内的文本(例如,单词或短语),并且创建用于所选择的文本的视觉表示以在创作区域中显示。比如,用户可以选择文档区域中的文本并且将文本拖动到创作区域以创建视觉表示。视觉表示可以链接到所选择的文本。可以在文档区域和/或创作区域中可视地指示链接(例如,通过注释文本)。在一些实例中,用户可以选择文档区域中的文本,并且创建用于文档中的、与选定文本有关的其他文本的视觉表示。举例而言,响应于在文档区域中选择单词或短语,可以呈现与单词或短语有关的文本候选列表(例如,文档中的其他单词或短语)。文本候选列表可以基于使用NLP来处理文档。例如,该列表可以包括文本,其通过从NLP输出的信息(诸如解析树、实体信息(例如,共同参考链)、关系短语信息等)链接到选定文本。从NLP输出的这种信息可以指示文档内的单词和/或短语之间的关系。举例而言,解析树可以描述句子中的单词或短语之间的关系,而实体信息可以指示不同句子的实体之间的关系。在一些实例中,可以处理从NLP输出的信息以形成描述文档内的各种类型的关系的节点图,诸如文档中的实体之间的关系、句子的单词之间的关系、不同句子的单词或短语之间的关系等。节点图可以被用来生成文本候选。无论如何,用户可以从文本候选列表中选择候选,并且可以在用户界面的创作区域中呈现用于候选的对应视觉表示。在一些示例中,视觉表示可以包括文本框,其包括来自文档的所选择的文本。比如,视觉表示可以包括由用户从第一句子中选择的文本和/或从第二句子中选择的文本(例如,来自陈述“混合动力车辆正被更频繁地使用”的一个段落的文本,以及来自陈述“在2009年混合动力汽车购买量增加了15%”的另一段落的文本)。附加地或备选地,视觉表示可以包括文档中的文本的图形表示。比如,视觉表示可以包括表示文本的不同部分之间的相关性的图(例如,图示了针对标识不同年份的股票价格的文本的、随时间推移的股票价格的图)。进一步地,视觉表示可以包括用于所选择的文本的图像(例如,用于术语“汽车”的汽车的图像)。而且,视觉表示可以包括由用户输入的文本。附加地或备选地,视觉表示可以包括用户已经提供的绘图或草图(例如,通过在画布区域或创作区域中用触笔进行绘制)。在其他示例中,视觉表示可以包括其他类型的内容,诸如视频、音频、网页、文档等。在一些示例中,用户可以将视觉表示彼此链接。这可以提供文档的其他视觉上下文。比如,用户可以使用指示视觉表示之间的关联的视觉指示符将视觉表示彼此连接。在用户界面的创作区域内使用线条、箭头或其他图形表示可以图形化地图示视觉指示符。创作区域可以允许用户链接任何数目的视觉表示和/或链接任何布置中的视觉表示(例如,创建视觉表示组,创建子元素等)。用户可以标记或注释视觉表示之间的链接以指示文本的各部分之间的关系。在许多实例中,本文中所描述的技术使得用户能够生成用于基于文本的文档的视觉表示。视觉表示可以表示文档的特定概念、想法等。这可以帮助用户理解文档的内容。在一些实例中,视觉表示对于理解相对复杂和/或技术性的文档(诸如法律文档、财务报告、科学论文、医学期刊文章等)可能是有用的。进一步地,通过使得用户能够交互地生成视觉表示(例如,通过用户界面),可以生成准确地描绘底层源文本的信息。而且,通过使用NLP,本文中所描述的技术可以智能地标识在整个文档中相关的文本并且创建用于那些关系的视觉表示。在一些实例中,相关文本可以用突出显示、图标、链接、建议框等在视觉上进行注释。本文中所描述的技术可以在多种上下文中实现。例如,可以使用任何数目的计算设备和/或环境来实现这些技术。作为一个示例,远程资源(例如,服务器)可以向与用户对接的客户端设备提供后端功能。举例而言,客户端设备可以使用浏览器或其他网络应用来对接由远程服务所执行的处理。作为另一示例,这些技术可以通过在客户端设备上运行的应用来实现,诸如便携式文档格式(PDF)阅读器/编辑器、文字处理器应用(例如,等)、电子表格应用(例如,等)、电子邮件应用、或呈现文本的任何其他应用。说明性环境图1示出了其中可以创作针对基于文本的文档的视觉表示的示例环境100。在一些示例中,环境100的各种设备和/或部件包括服务提供商102,其可以经由一个或多个本文档来自技高网...
创作用于基于文本的文档的视觉表示

【技术保护点】
一种系统,包括:一个或多个处理器;以及存储器,其通信地耦合到所述一个或多个处理器并且存储计算机可执行指令,所述计算机可执行指令当由所述一个或多个处理器执行时,使得所述一个或多个处理器执行以下操作,包括:接收包括文本的文档;使用自然语言处理来处理所述文档;提供用户界面,所述用户界面包括文档区域以及创作区域,所述文档区域呈现所述文档的所述文本,所述创作区域呈现用于所述文档的一个或多个视觉表示;接收对被呈现在所述文档区域中的所述文本的第一部分的第一选择;至少部分基于所述自然语言处理来生成用于所述文本的所述第一部分的第一视觉表示;以及提供所述第一视觉表示用于在所述用户界面的所述创作区域中呈现。

【技术特征摘要】
【国外来华专利技术】2015.10.16 US 62/242,740;2015.11.19 US 14/945,8691.一种系统,包括:一个或多个处理器;以及存储器,其通信地耦合到所述一个或多个处理器并且存储计算机可执行指令,所述计算机可执行指令当由所述一个或多个处理器执行时,使得所述一个或多个处理器执行以下操作,包括:接收包括文本的文档;使用自然语言处理来处理所述文档;提供用户界面,所述用户界面包括文档区域以及创作区域,所述文档区域呈现所述文档的所述文本,所述创作区域呈现用于所述文档的一个或多个视觉表示;接收对被呈现在所述文档区域中的所述文本的第一部分的第一选择;至少部分基于所述自然语言处理来生成用于所述文本的所述第一部分的第一视觉表示;以及提供所述第一视觉表示用于在所述用户界面的所述创作区域中呈现。2.根据权利要求1所述的系统,其中所述操作还包括:接收对被呈现在所述文档区域中的所述文本的第二部分的第二选择;至少部分基于所述自然语言处理来生成用于所述文本的所述第二部分的第二视觉表示;提供所述第二视觉表示用于在所述用户界面的所述创作区域中呈现;接收用户输入,所述用户输入请求将所述第二视觉表示与所述第一视觉表示相关联;以及将所述第一视觉表示与所述第二视觉表示相关联。3.根据权利要求1或2所述的系统,其中所述操作还包括:至少部分基于所述自然语言处理来生成用于所述文本的所述第一部分的文本候选列表;以及从所述文本候选列表接收对文本候选的选择,并且其中生成用于所述文本的所述第一部分的所述第一视觉表示包括:生成用于所述文本候选的视觉表示。4.根据权利要求1至3中的任一项所述的系统,其中所述处理所述文档包括:使用所述自然语言处理来处理所述文档,以确定以下至少一项:用于所述文档中的句子的解析树、指示所述文档中指代同一实体的两个或更多个单词或短语之间的关系的实体信息、或者关系短语信息,所述关系短语信息指示用于所述文档中的主语、动词和宾语的关系。5.根据权利要求4所述的系统,其中所述操作还包括:基于以下至少一项来生成用于所述文档的节点图:所述解析树、所述实体信息、或者所述关系短语信息,所述节点图指示所述文档的所述文本的所述第一部分与所述文档的所述文本或其他文本的第二部分之间的关系;以及通过以下方式生成用于所述文本的所述第一部分的文本候选列表:确定在所述节点图中,所述文本或所述其他文本的所述第二部分与所述文本的所述第一部分具有所述关系;以及生成用于所述文本的所述第二部分的文本候选;以及从所述文本候选列表接收对文本候选的选择,并且其中生成用于所述文本的所述第一部分的所述第一视觉表示包括:生成用于所述文本候选的视觉表示。6.一个或多个存储可执行指令的计算机可读存储介质,所述可执行指令当由一个或多个处理器执行时,使得所述一个或多个处理器执行以下动作,包括:呈现包括文本的文档;接收对所述文档的所述文本的第一部分的第一用户选择;呈现第一视觉表示以表示所述文本的所述第一部分,所述第一视觉表示至少部分地基于使用自然语言处理来处理所述文档;接收对所述文档的所述文本的第二部分的第二用户选择;呈现第二视觉表示以表示所述文本的所述第二部分,所述第二视觉表示至少部分地基于使用自然语言处理来处理所述文档;接收用户输入以将所述第一视觉表示与所述第二视觉表示相关联;至少部分基于所述用户输入,来创建所述第一视觉表示与所述第二视觉表示之间的关联;以及提供所述第一视觉表示、所述第二视觉表示以及所述关联,作为表示所述文档的内容的复合表示。7.根据权利要求6所述的一个或多个计算机可读存储介质,其中所述第一视觉表示呈现以下至少一项:所述文本的所述第一部分、或者表示所述文本的所述第一部分的图像,并且其中所述动作还包括:标识(i)表示第一值的所述文本的所述第一部分内的第一术语或短语以及(ii)表示第二值的第二术语或短语;以及生成所述第一视觉表示,所述第一视觉表示相对于所述第二值表示所述第一值,所述第一视觉表示包括以下至少一项:图、图表或表格。8.根据权利要求7所述的一个或多个计算机可读存储介质,其中所述动作还包括:使得用户能够更新以下至少一项:所述第一值...

【专利技术属性】
技术研发人员:李奉信T·德维尔N·H·里什
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1