将口述想法变换为视觉表示制造技术

技术编号:23293603 阅读:25 留言:0更新日期:2020-02-08 22:39
公开了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的应用和服务。对口述想法进行变换可以包括接收用户的口述想法的音频输入,并且将该音频输入转换为所述口述想法的文本。该系统可以使用词语频率来从所述文本中识别多个主题,并且可以通过确定所述多个主题中的主题之间的关系来创建所述多个主题的主题图,并且至少基于所确定的关系来向所述多个主题中的每个主题分配权重。该系统可以通过使用主题形状表示所述多个主题的相关主题来生成对所述多个主题的主题图的视觉显示,所述主题形状可以由所确定的关系来连接并且由所分配的权重来确定大小。

Transform oral thoughts into visual representations

【技术实现步骤摘要】
【国外来华专利技术】将口述想法变换为视觉表示
技术介绍
头脑风暴是指人们可以用来为了创作内容(例如,写文章)而产生想法的一种方法。在头脑风暴的过程期间,人们将他们所有的想法都写到纸上而并不担心如何将它们组合在一起。然而,头脑风暴对于具有诸如书写障碍和阅读障碍之类的某些缺陷的人来说会是一个困难的过程。书写障碍是指书写能力的缺陷;而阅读障碍则是指阅读失常,其特征在于尽管拥有正常智力但在阅读方面存在困难。一些拥有书写障碍和阅读障碍的人拥有想法,但是确难以将它们从头脑中取出并表达于纸面上,也无法将它们组织为关键主题。他们会发现大声说出他们的想法会更加自然。将经组织的想法写在纸上对于他们构成障碍,这妨碍了他们容易地进行自我表达。
技术实现思路
公开了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的应用和服务。将口述想法变换为在所述口述想法中发现的相关主题的视觉表示可以包括接收用户的口述想法的音频输入以及将该音频输入转换为所述口述想法的文本。接着,该系统能够使用词语频率来从文本中识别多个主题,并且能够通过确定所述多个主题中的主题之间的关系来创建所述多个主题的主题图,并且至少基于所确定的关系来向所述多个主题中的每个主题分配权重。接着,该系统能够通过使用主题形状表示所述多个主题中的相关主题来生成对所述多个主题的主题图的视觉显示。所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。在一些情况下,该系统能够基于所述主题形状的大小和所确定的关系来向所述主题形状中的每个主题形状分配大纲参数,并且基于该大纲参数来生成大纲。提供了该
技术实现思路
以用简化的形式引入对在以下的具体实施方式中进一步描述的概念的选择。应当理解的是,该
技术实现思路
不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。附图说明图1图示了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的示例过程。图2图示了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的示例过程。图3A-3E图示了将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的一些示例场景。图4图示了示例计算系统的组件。具体实施方式公开了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的应用和服务。尽管引用了“应用”,但是应当理解的是,应用可以具有不同的功能范围。也就是说,应用可以是独立应用或者另一个产品的插件或特征。应用可以是本地的或者在线被提供或者作为服务。主题是词语或词语的分布,并且可以对应于实体的方面或者实体本身。实体可以是指人、地方、东西、事件、任务、或概念。主题充当相关信息的主体或类别。表达(例如,句子、短句、或语段)的主题可以被用于实体歧义消除(例如,使用隐含狄利克雷分布(LDA)及其层级变化形式)。实体歧义消除是指从文本中识别实体并且利用几个实体类型标签中的一个对其进行标记。在一些情况下,维基百科(Wikipedia)可以被用作大规模实体歧义消除的综合参考目录。在其他情况下,可以使用其他公共和/或私有的语料库来促进实体歧义消除。实体可以从用户口述的想法中被识别并且被用作相关主题和/或被用来确定相关主题。将口述想法变换为在所述口述想法中发现的相关主题的视觉表示可以包括接收用户的口述想法的音频输入以及将该音频输入转换为所述口述想法的文本。接着,该系统能够使用词语频率来从文本中识别多个主题,并且能够通过确定所述多个主题中的主题之间的关系来创建所述多个主题的主题图,并且至少基于所确定的关系来向所述多个主题中的每个主题分配权重。接着,该系统能够通过使用主题形状表示所述多个主题中的相关主题来生成对所述多个主题的主题图的视觉显示。所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。在一些情况下,该系统能够基于所述主题形状的大小和所确定的关系来向所述主题形状中的每个主题形状分配大纲参数。该大纲参数表示大纲的组织层级,例如标题或副标题。该系统接着可以基于该大纲参数来生成大纲。所公开的应用和服务允许用户向计算设备中讲话,同时该系统基于用户已经以自由形式的口头语言所讨论的想法来为他们创建结构(主题图的视觉显示)。有利的是,这有助于人们使用口头的“大声说话”方法来收集想法。这对于认为将他们的想法大声说出来要比将它们键入或书写更加舒适的人们来说是特别有帮助的。在用户说话时,该系统基于用户向系统中说出的想法来创建对主题图的视觉显示。该主题图可以单独从用户的音频输入来生成,而不要求用户将主要的主题直接输入到系统中。有利的是,该系统可以从接收自用户的音频输入来确定主要主题以及子主题。图1图示了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的示例过程。参考图1,执行过程100的计算设备例如可以被实施为关于图4所描述的系统400,并且可以被用来访问诸如口述想法变换应用(“变换应用”)之类的应用以及网络上的诸如话音到文本服务之类的宽泛的服务。用户计算设备可以是但不限于个人计算机(例如,台式计算机)、膝上型计算机、个人数字助理(PDA)、视频游戏设备、移动电话(或智能电话)、平板计算机、板式计算机、终端、可穿戴设备,等等。应当意识到的是,用户计算设备可以是为其用户提供加载并执行软件程序的能力以及输入音频的能力的任意类型的计算系统,并且可以如关于系统400所描述的那样被实施。变换应用可以被存储在用户计算设备上(例如,客户端侧应用)或者使用web浏览器(例如,标准互联网浏览器)作为(例如,在服务器上运行或者在云端托管的)基于web的变换应用被访问,并且该应用的界面可以在web浏览器内向用户显示。因此,该应用可以是客户端侧应用和/或非客户端侧(例如,基于web的)应用。在一些情况下,该变换应用可以是诸如内容创建应用之类的应用的特征。往来于计算设备的通信可以在一些情况下经由应用编程接口(API)来实行。API是由程序代码组件或硬件组件(下文被称为“API实现组件”)所实现的接口,其允许不同的程序代码组件或硬件组件(下文被称为“API调用组件”)访问并使用由API实现组件所提供的一个或多个功能、方法、过程、数据结构、类、和/或其他服务。API可以定义在API调用组件与API实现组件之间传递的一个或多个参数。API通常是用于使得两个或更多个应用能够互相通信的一组程序指令和标准,并且一般地通过互联网被实现为一组超文本传输协议(HTTP)请求消息以及根据REST(表述性状态传输)或SOAP(简单对象访问协议)架构的响应消息的指定格式或结构。所述网络可以是但不限于蜂窝(例如,无线电话)网络、互联网、局域网(LAN)、广域网(WAN)、Wi-Fi网络,或者其组合。这样的网络可以涉及网络部件的连接,所述网络部件例如集线器、桥接器、路由器、交换机、服务器、和网关。例如,该网络可以包括一个或多个连接的网络(例如,多网络环境),包括诸如互联网之类的公共网络和/或诸如安全企业私有网络之类的私有网络。如本领域技术人员将会理解的,针对网络的访问本文档来自技高网
...

【技术保护点】
1.一种将口述想法变换为对在所述口述想法中发现的相关主题的视觉表示的方法,包括:/n在计算设备处接收用户的口述想法的音频输入;/n将所述音频输入转换为所述口述想法的文本;/n使用词语频率从所述文本中识别多个主题;/n通过以下操作来在所述计算设备处创建所述多个主题的主题图:确定所述多个主题中的主题之间的关系,以及至少基于所确定的关系来向所述多个主题中的每个主题分配权重;以及/n通过使用主题形状表示所述多个主题中的相关主题来在所述计算设备处生成对所述多个主题的所述主题图的视觉显示,其中,所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。/n

【技术特征摘要】
【国外来华专利技术】20170620 US 15/628,1611.一种将口述想法变换为对在所述口述想法中发现的相关主题的视觉表示的方法,包括:
在计算设备处接收用户的口述想法的音频输入;
将所述音频输入转换为所述口述想法的文本;
使用词语频率从所述文本中识别多个主题;
通过以下操作来在所述计算设备处创建所述多个主题的主题图:确定所述多个主题中的主题之间的关系,以及至少基于所确定的关系来向所述多个主题中的每个主题分配权重;以及
通过使用主题形状表示所述多个主题中的相关主题来在所述计算设备处生成对所述多个主题的所述主题图的视觉显示,其中,所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。


2.根据权利要求1所述的方法,还包括:
基于所述主题形状的大小和所确定的关系向所述主题形状中的每个主题形状分配大纲参数;以及
基于所述大纲参数来生成大纲,其中,所述大纲参数包括标题和副标题。


3.根据权利要求1所述的方法,其中,识别所述多个主题还包括:
定义针对在所述文本中包括的词语的评价系统;以及
使用所述词语频率和所分配的评价来形成词语聚类,其中,所述词语聚类定义主旨领域。


4.根据权利要求1所述的方法,其中,确定所述多个主题中的主题之间的关系包括:
将所述文本分组成与所述多个主题中的每个主题相关联的文本群组;并且
确定所述文本群组中的每个文本群组之间的关系。


5.根据权利要求1所述的方法,其中,至少基于所确定的关系来向所述多个主题和实体中的每个分配所述权重包括:
针对所述多个主题中的每个主题将所述文本分组成文本群组;
计算每个文本群组的总文本百分比;以及
基于每个文本群组的所述总文本百分比来向每个文本群组分配权重。


6.一种用于变换口述想法的系统,包括:
用户输入接口;
处理系统;
一个或多个存储介质;
存储在所述一个或多个存储介质中的至少一个存储介质上的应用,所述应用当由所述处理系统执行时,指导所述处理系统进行以下操作:
在计算设备处接收用户的口述想法的音频输入;
将所述音频输入转换为所述口述想法的文本;
使用词语频率从所述文本中识别多个主题;
通过以下操作来在所述计算设备处创建所述多个主题的主题图:确定所述多个主题中的主题之间的关系,以及至少基于所确定的关系来向所述多个主题中的每个主题分配权重;以及
通过使用主题形状表示所述多个主题中的相关主题来在所述计算设备处生成对所述多个主题的所述主题图的视觉显示,其中,所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。


7.根据权利要求6所述的系统,其中,所述应用还指导所述处理系统进...

【专利技术属性】
技术研发人员:L·C·谢里安
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1