提供用于转写通过统一消息传达系统发送的语音邮件的音频文件的经改进的系统和方法。创建并使用专用于语音邮件接收方的定制文法以便通过将该音频文件与接收方常用的词语、名称、简称以及短语作比较来转写所接收的语音邮件。从最终的文本转写中标识出关键元素以帮助接收方基于语音邮件中所包含的重要内容来处理所接收的语音邮件。
【技术实现步骤摘要】
【国外来华专利技术】个人化用户专用文法 背景统一消息传送系统通常包括诸如电子邮件、语音信箱、传真等各种通 信技术到单个服务的整合。语音邮件通常作为电子邮件的音频文件附件被 接收到接收方的邮箱中。然而,音频文件附件的特性是接收语音邮件的接 收方不能简单地通过査阅音频文件来确定语音邮件的内容。并且接收方也 无法识别哪个语音邮件附件比其它更重要。语音到文本(Speech-to-text)软件可用来将语音邮件的音频文件转换 成可被接收方在视觉上可阅读的文本文件。通过由语音到文本模块处理文 本文件,可创建接收方能在计算机屏幕上、个人数字助理(PDA)屏幕上 等查阅的诸如电子邮件正文的文本表示或文件。然而,出于效率目的,语 音到文本软件必须处理音频文件中非常复杂的变化,以便确定与语音发声 相匹配的正确文字。由于发送方的嗓音的诸变化,语音到文本转写不总是 能带来准确结果。此外,在一群人或专业人事中常说的词语或简称可能不 能被语音到文本模块识别。因此,语音邮件的音频文件的文本文件可能包 含不可识别的句子或字符,这些句子或字符使文本文件阅读困难并且妨碍 了统一消息传送系统带来的好处。概述通过使用专用于接收方、发送方、组织内的一群人、组织内的人事阶层的 各个层次等的定制文法并通过标识和提取语音邮件消息内的关键短语来将语 音邮件消息转写成文本文件的经改进方法克服了公知
中的一个或多 个缺陷。在一个方面,提供一种计算机实现的方法和系统,该方法和系统使用从统 一消息传达系统内的个人或多群人中提取的常用词语、名称、简称以及短语的 定制文法。然后,当将语音邮件的音频文件转写成文本文件时,可参考该定制文法,以提高该文本文件的准确率。在另一个方面,从文本文件中提取包含在音频文件中的关键元素并且将其作为发送到接收方的邮件的一部分包括在内。然后,关键元素被用来突出显示语音邮件中的重要信息并且使得接收方能确定其相对于接收方的收件箱中的其它电子邮件和语音邮件的重要性。或者,本专利技术可包括各种其它方法和装置。 其它特征在下文中将有部分变得明显并且被部分地指出。附图简述附图说明图1是示出本专利技术的示例性系统的框图。图2是示出示例性定制文法和文法之间的相互关系的框图。 图3是示出本专利技术的一个实施例的示例性方法的流程图。 图4是包含关键元素、文本转写以及音频文件的消息的一个实施例的示例 性屏幕截图。图5是示出在其中处理传入电子邮件的本专利技术的示例性系统的框图。 图6是示出本专利技术的示例性系统的框图,其中接收方正在请求回放语音邮 件的音频文件。图7是示出在其中实现本专利技术的合适的计算系统环境的一个示例的框图。 对应的附图标记指示所有附图中的对应部分。详细描述首先参考图1,框图示出在其中实现本专利技术的一个实施例的系统的示例性 实施例的框图。系统100具有统一消息传达服务器102、组织文法104、语音 到文本模块106、计算机108、邮箱IIO、个人文法112、电话114、媒体播放 器116、外部电话118、远程计算设备120、网络122、第二计算机124、第二 邮箱126、第二个人文法128、第二电话130、第二媒体播放器132、关键元素 列表134以及通用字典136。在一个实施例中,呼叫方(例如,语音邮件的发送方)从第二电话130、 外部计算设备120或者外部电话118向具有作为统一消息传达系统的一部分的邮箱110的接收方(例如,被呼叫方)致电。语音邮件消息作为音频文件被录音和保存。服务器102执行语音到文件模块106,该模块106使用通用词典136 来分辨音频文件中发声的词语、名称、简称和短语以便创建语音邮件的文本转 写本。存在于关键元素列表134中的关键元素在文本转写本中被标识。包含经 标识的关键元素、语音邮件的文本转写本以及语音邮件的音频文件的消息(例 如,电子邮件)被发送到接收方的邮箱110。接收方可在计算机108的屏幕上 或者从远程计算设备120的屏幕上査阅包含在电子邮件中的关键元素或者文本 转写本。接收方还可通过执行计算机108中的媒体播放器116来听取语音邮件 的音频文件。在一个实施例中,除了使用通用字典136之外,还通过使用专用于语音邮 件接收方的个人文法来提高所转写的语音邮件的准确率。从由服务器所执行的 软件处获得包含在个人文法112中的数据,该服务器访问统一消息传达系统的 用户邮箱并从接收方的电子邮件收件箱、语音邮件收件箱、来电记录、电子邮 件通信录、电话通信录、联系人列表、约会日历、组织图表等(以下统称为"邮 箱"、"邮箱110"、"邮箱126"、"接收方的邮箱"以及"语音邮件发送 方的邮箱")中包含的信息中挖掘数据。因此,个人文法包含接收方常用或接 收方接收的文档中经常包含的词语、名称、简称以及短语。由于个人文法112 包含接收方常用的数据,所以当语音到文本模块106正在分辨一个发声时,个 人文法数据比通用字典136更受重视。因此,使用个人文法112可产生比单独 使用通用字典136来转写语音邮件时更准确的语音邮件的转写。被挖掘用来创建诸如个人文法112等定制文法的信息可被结构化,以便用 于其它应用。例如,击中频率以及数据的源被用来开发在统一消息传达系统中 发送和接收电子邮件的人之间的自组(ad-hoc)关系映射。特定用户的单个关 系映射可聚集到组关系映射中。这些关系映射可用于诸如那些社会网络相关的 其它应用程序中。在创建一个定制文法时,从邮箱中挖掘数据的软件应该从文字上区分名 称;将全名存储在定制文法中;确定名称发生的频率;确定数据是否位于消息 的标题行中并确定数据位于哪个标题行;针对该数据是最近的还是旧的,标识 每个数据的年龄索引;确定各项之间的潜在关系链接(例如,哪些名称一起出现?频率如何?可在名称之间建立网络?)。尽管没有特地要求创建一个起作 用的定制文法,但是以上几点可提高定制文法的有用性和多功能性。在一个示例中,服务器102执行创建语音邮件的文本转写本的语音到文本 模块106。服务器102访问通用字典136和个人文法112来分辨音频文件中的 发声。关键元素列表134中所包含的关键元素还在文本转写本中被标识。包含 语音邮件的关键元素和文本转写本以及语音邮件的音频文件附件的电子邮件 被发送到接收方的邮箱110中。接收方可在计算机108的屏幕上或者远程计算 设备120的屏幕上査阅电子邮件中包含的关键元素或文本转写本。接收方还可 通过执行计算机108的媒体播放器116或通过在系统中播放来听取语音邮件的 音频文件附件。关键元素可包含被确定为重要的词语或短语,诸如名称、电话号码、数据、 时间,"您能……","请致电……"、"在……会面"等。关键元素列表134 包含被用来标识出现在语音邮件中的匹配关键元素的词语、短语和数字格式 (例如,可能是电话号码的一系列数字)等。当诸如词语或短语的重要性被组 织确定后,将在语音邮件的文本转写本中被标识的词语和短语可被添加到关键 元素列表134。文本中的关键元素可在邮件中被突出显示以允许接收方预览语音邮件的 主题以便确定其相对的重要性。在一个示例中,关键元素可作为邮件的主题行 或标题行来提供。在另一示例中,可在诸如邮件正文顶部等邮件中的突出位置 提供关键元素以便使接收方能快速标识语音邮件的主题。在一个实施例本文档来自技高网...
【技术保护点】
一种改进在统一消息传达系统中对发送给接收方的语音邮件的音频文件的转写的计算机实现的方法,其中所述统一消息传达系统包括文法和关键元素列表(134),所述方法包括: 通过将所述音频文件的发声与所述文法作比较来将所述音频文件转写成文本文件;以及 将关键元素的标识与所述文本文件一起包括在所述文本文件中,所述关键元素包含在所述关键元素列表中。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:DA豪威尔,S桑德拉拉曼,DT方,F塞德,
申请(专利权)人:微软公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。