具有音频接口的智能通信助手制造技术

技术编号:24366233 阅读:67 留言:0更新日期:2020-06-03 04:50
呈现了用于具有音频接口的智能通信助手的方法、系统、和计算机程序。一种方法包括用于得到寻址到用户的消息的操作。所述消息来自于一个或多个消息源并且每个消息包括包含文本的消息数据。该方法还包括用于进行以下动作的操作:分析该消息数据以确定每个消息的含义,基于每个消息的相应消息数据和含义来为每个消息生成得分,并且基于所述消息的消息得分和含义来为所述消息生成文本概要。话音概要是基于该文本概要来创建的,并且该话音概要接着被发送至与该用户相关联的扬声器。该音频接口还允许该用户针对所述消息口头请求动作。

Intelligent communication assistant with audio interface

【技术实现步骤摘要】
【国外来华专利技术】具有音频接口的智能通信助手
本文所公开的主题总体上设计用于改进用户与电子设备的交互的方法、系统、和程序。
技术介绍
环境(ambient)设备在人们的生活中正变得日益普及,例如车上的免提设备、智能头戴式耳机、没有显示器的数字助手、蓝牙耳机等。因此,基于话音的接口正变得日益普及。口头交互对于询问简单问题(例如,几点了,现在什么温度,谁写了唐璜,在5点提醒我打开烤箱)而言是容易的,但是却难以消化诸如电子邮件之类的长消息。在许多情况下用户不容易访问到具有显示器的电子设备并且用户想要查看通信状态,例如新的电子邮件、新的文本消息、新的社交网络帖子等。常常,通信包括文本组件,并且在有显示器可用时要消费这种类型的通信是非常容易的,但是要经由音频通信来访问该内容则要困难得多。处理向某人“读出”的消息明显比简单地读消息更难,这是因为与读消息相比,这要求大脑更加集中于聆听它们。例如,如果用户正在慢跑则不便于读显示器,然而该用户能够收听消息。不幸的是,一些消息(例如,电子邮件消息)可能很长,并且简单地让电子设备读出这些长消息可能耗时很长并且要大量注意力。另外,在慢跑的同时尝试读显示器可能造成危险性后果,例如发生事故或者跌落并损坏电话。附图说明各附图仅图示出本公开的示例实施例而并不应当被认为对其范围有所限制。图1图示了根据一些示例实施例的具有音频接口的智能通信助手的使用。图2是根据一些示例实施例的用于实现智能通信助手的系统的架构。图3图示了根据一些示例实施例的智能通信助手的模块。图4是根据一些示例实施例的用于消息收集和排序的方法的流程图。图5是根据一些示例实施例的用于实现音频接口的方法的if流程图。图6是根据一些示例实施例的用于消息评分和排序的方法的if流程图。图7图示了根据一些示例实施例的机器学习程序的训练和使用。图8是根据一些示例实施例的用于实现具有音频接口的智能通信助手的方法的流程图。图9是图示了可以在其上实现一个或多个示例实施例的机器的示例的框图。具体实施方式示例方法、系统和计算机程序针对一种具有音频接口的通信助手。示例仅代表可能的变化形式。除非另外明确指出,否则组件和功能是可选的并且可以被组合或细分,并且操作的顺序可以有所变化或者被组合或细分。在以下描述中,出于解释的目的而阐述了许多具体细节以提供对示例实施例的全面理解。然而,对于本领域技术人员而言,当前主题显然可以在没有这些具体细节的情况下被实践。随着诸如智能扬声器、具有免提计算机的连接的汽车、以及连接的耳机设备之类的更多环境设备的出现,用户希望经由话音接口来监视基于文本的通信,例如电子邮件、文本消息、社交网络消息等。然而,利用话音接口可能难以消费文本通信,这是因为所述通信可能很长或者可能存在太多需要为了呈现而被优先化的消息。另外,与将文本转换为话音相比,利用显示器来消费文本通信则明显更加容易。本文所呈现的实施例提供了一种具有音频接口的智能通信助手,其能够经由口头命令和口头响应来与用户进行交互。该智能通信助手能够从多个源收集消息,分析所述消息以识别含义和优先级,并且接着提供与所选择的消息相关的消息概要或详细信息。本文所呈现的系统提供了针对消息的多种来源的访问,随后是对通信的分析和优先化,这包括创建与消息内容相关的洞察(insight)以更好地口头通知用户。例如,该智能通信助手能够报告新消息的概要,识别来自重要人员的消息,识别消息正文中所请求的动作项,识别来自航空公司的值机请求,等等。基于话音的接口允许用户使用自然语言进行通信以请求与文本消息相关的操作,例如提供概要、读消息、得到消息的概要、口述并发送消息,等等。在一个实施例中,提供了一种方法。该方法包括用于从一个或多个消息源得到消息的操作。所述消息寻址到用户,并且每个消息包括包含文本的消息数据。该方法还包括用于进行以下动作的操作:分析所述消息数据以确定每个消息的含义,基于每个消息的相应消息数据和含义来为每个消息生成得分,并且基于所述消息的消息得分和含义来为所述消息生成文本概要。所述话音概要是基于所述文本概要创建的,并且所述话音概要接着被发送至与该用户相关联的扬声器。该音频接口还允许用户针对该消息口头地请求动作。在另一个实施例中,一种系统包括存储器以及一个或多个计算机处理器,所述存储器包含指令。所述指令在被所述一个或多个计算机处理器执行时使得所述一个或多个计算机处理器实行以下操作,包括:从一个或多个消息源得到一个或多个消息,所述一个或多个消息寻址到用户,每个消息包括包含文本的消息数据;分析所述消息数据以确定每个消息的含义;基于每个消息的相应消息数据和含义来为每个消息生成得分;基于所述消息的消息得分和含义来为所述消息生成文本概要;基于所述文本概要来创建话音概要;并且将该话音概要发送至与该用户相关联的扬声器。在又另一个实施例中,一种包括指令的非暂时性机器可读存储介质,所述指令当由机器执行时使得该机器实行以下操作,包括:从一个或多个消息源得到一个或多个消息的,所述一个或多个消息寻址到用户,每个消息包括包含文本的消息数据;分析所述消息数据以确定每个消息的含义;基于每个消息的相应消息数据和含义来为每个消息生成得分;基于所述消息的消息得分和含义来为所述消息生成文本概要;基于所述文本概要来创建话音概要;并且将该话音概要发送至与该用户相关联的扬声器。图1图示了根据一些示例实施例的具有音频接口的智能通信助手的使用。用户102正在听着耳机108慢跑,所述耳机108无线地连接至电话106。电话106提供了用户界面104,其示出了多个不同的消息应用,例如电子邮件、电话、团队协作应用、消息、和还可以包括其他类型的消息app以用于智能通信助手144,例如社交网络消息。所述应用提供了文本通信,但是也可以利用其他类型的通信,例如语音通信(例如,语音邮件)。例如,智能通信助手114可以收听语音邮件并且将该语音邮件转换为文本。在一些示例实施例中,每个应用包括数字指示符,其示出已经有多少新的通信到达。用户102已经请求了新到来通信的概要,并且智能通信助手114分析不同类型的消息以便为该用户生成口头概要110,例如“您有一封来自您上司的电子邮件,以及为您的航班办理值机的电子邮件,请求您的简历的文本,来自您父亲的语音邮件,以及27个其他消息”。在图1的示例中,用户接着口头上请求112“我的上司想要什么?”,并且智能通信助手114以来自该用户上司的电子邮件的概要作为回应。如果用户要求“为我读出来自我上司的消息”,则智能通信助手114将读出该消息而不是提供概要。所述交互可以在智能通信助手114与用户102之间继续进行。注意到,本文呈现的实施例是参考文本通信来描述的,但是相同的原理可以被应用于其他形式的通信。在一些示例实施例中,智能通信助手114可以将其他类型的通信转换为文本并且接着利用其他基于文本的通信来处理它们。例如,智能通信助手114可以将语音邮件、传真、电子邮件附件、扫描本文档来自技高网...

【技术保护点】
1.一种系统,包括:/n包括指令的存储器;以及/n一个或多个计算机处理器,其中,所述指令当由所述一个或多个计算机处理器运行时,使得所述一个或多个计算机处理器执行以下操作,包括:/n从一个或多个消息源得到一个或多个消息,所述一个或多个消息被寻址到用户,每个消息包括包含文本的消息数据;/n分析所述消息数据以确定每个消息的含义;/n基于每个消息的相应的消息数据和所述含义来为每个消息生成得分;/n基于所述一个或多个消息的消息得分和所述含义来为所述一个或多个消息生成文本概要;/n基于所述文本概要来创建话音概要;以及/n将所述话音概要发送至与所述用户相关联的扬声器。/n

【技术特征摘要】
【国外来华专利技术】20171017 US 15/786,1841.一种系统,包括:
包括指令的存储器;以及
一个或多个计算机处理器,其中,所述指令当由所述一个或多个计算机处理器运行时,使得所述一个或多个计算机处理器执行以下操作,包括:
从一个或多个消息源得到一个或多个消息,所述一个或多个消息被寻址到用户,每个消息包括包含文本的消息数据;
分析所述消息数据以确定每个消息的含义;
基于每个消息的相应的消息数据和所述含义来为每个消息生成得分;
基于所述一个或多个消息的消息得分和所述含义来为所述一个或多个消息生成文本概要;
基于所述文本概要来创建话音概要;以及
将所述话音概要发送至与所述用户相关联的扬声器。


2.根据权利要求1所述的系统,其中,生成所述得分还包括:
针对每个消息,基于所述消息数据来识别多个属性中的每个属性的属性值;
针对每个属性,基于所述属性值来生成属性得分;以及
基于每个消息的所述属性得分来为每个消息生成所述得分。


3.根据权利要求2所述的系统,其中,第一属性是所述消息是否来自所述用户的上司,其中,第二属性是所述消息的发送者和所述用户之间的工作关系,所述工作关系是基于组织图的。


4.根据权利要求2所述的系统,其中,第三属性是在所述消息的文本中检测针对要由所述用户执行的动作的请求,其中,第四属性是检测所述消息中的紧急性,所述紧急性是基于所述消息的所述文本中的词语被检测的。


5.根据权利要求1所述的系统,其中,所述指令还使得所述一个或多个计算机处理器执行以下操作,包括:
为所述用户提供话音接口以用于从所述用户接收命令,所述命令包括以下中的一个或多个:针对所述话音概要的请求、用于读出消息的请求、用于转发消息的请求、用于创建提醒的请求、以及针对消息的概要的请求。


6.一种方法,包括:
由一个或多个处理器从一个或多个消息源得到一个或多个消息,所述一个或多个消息被寻址到用户,每个消息包括包含文本的消息数据;
由所述一个或多个处...

【专利技术属性】
技术研发人员:N·戈特比A·尼豪斯S·温勒哥帕兰A·安东尼耶维奇T·塔迪奇V·阿格拉瓦尔L·施蒂费尔曼
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1