当前位置: 首页 > 专利查询>微软公司专利>正文

声纹标识制造技术

技术编号:8456898 阅读:160 留言:0更新日期:2013-03-22 09:42
可提供声纹标识。可记录多个讲话者并将其与身份指示符相关联。可为每个讲话者创建声纹。如果根据身份指示符至少一个讲话者的声纹相对应于已知用户,可创建将用户与该声纹相关联的数据库条目。还可显示与用户相关联的附加信息。

【技术实现步骤摘要】
【国外来华专利技术】声纹标识背景声纹标识是用于创建声纹并根据各种指示符标识讲话者的过程。在一些情况中,这对于业务逻辑过程能够标识讲话者可能很有价值。例如,用户可进入与不熟悉的人的会议或在诸如有话筒的计算机等记录设备的范围内进行对话。在较晚的对关联于会议或对话的笔记的审阅中,知道在记下某些笔记时是谁在讲话或者能够看到示出什么人在什么时候讲话的以颜色编码的语音记录流可能很有价值。这些依赖于能够通过语音或其它手段标识人的系统,但常规系统要求人以某种方式注册他们的声纹。因为用户很忙并且不情愿参与,这些系统面临采用的障碍。概要提供声纹学习。提供本
技术实现思路
以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。此
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征。本
技术实现思路
也不旨在用于限制所要求保护的主题的范围。可提供声纹标识。可记录多个讲话者并将之与身份指示符相关联。可为每个讲话者创建声纹。如果根据身份指示符至少一个讲话者的声纹相对应于已知用户,则可创建将用户与该声纹相关联的数据库条目。还可显示与用户相关联的附加信息。以上概括描述和以下详细描述两者都提供了示例,并且只是说明性的。因此,以上概括描述和以下详细描述不应当被认为是限制性的。此外,除了本文中所阐述的那些特征或变体以外,还可以提供其他特征或变体。例如,实施例可涉及具体实施方式中所描述的各种特征组合和子组合。附图简述合并在本公开中并构成其一部分的附图示出本专利技术的实施例。在附图中图I是操作环境的框图;图2A-2C是在提供声纹标识中使用的不例表;图3是用于提供声纹标识的方法的流程图;以及图4是包括计算设备的系统的框图。具体实施例方式以下详细描述参考各个附图。只要可能,就在附图和以下描述中使用相同的附图标记来指示相同或相似的元件。尽管可能描述了本专利技术的实施例,但修改、改编、以及其他实现是可能的。例如,可对附图中所示的元素进行置换、添加、或修改,并且可通过对所公开的方法置换、重新排序、或添加阶段来修改本文中所描述的方法。因此,以下详细描述并不限制本专利技术。相反,本专利技术的正确范围由所附权利要求书定义。可提供声纹标识。根据专利技术的各实施例,讲话者可被记录并与各种环境指示符相关联。例如,用户可出席会议或在话筒的范围内进行电话呼叫。可为讲话者中的每一个生成声纹并将其与已知声纹的数据库相比较。基于已标识的讲话者,各种业务逻辑模块可提供附加功能,诸如显示来自之前会议的笔记和/或电子邮件、提供出席者的列表、和/或对会议转录本做注释以标识什么用户在什么时间讲话。环境指示符可从环境因素提取,诸如会议位置或设备标识符的在场。例如,用户的蜂窝电话可广播可与所记录的语音相关联并被用于将声纹与用户关联起来的蓝牙标识符。这些指示符和生成的声纹可由各个用户私密地存储和/或在诸如公司员工的多个用户中共享。一般而言,收集和/或共享的指示符越多,声纹和标识的用户之间的相关可变得越快和越准确。例如,主用户可出席与该用户以前没有见过的九个其他用户的会议。主用户的声纹数据库可能不包含与为主用户和/或其他九个用户而生成的声纹相匹配的任何条目。新生成的声纹可被存储并可关联于环境指示符,诸如无线网络标识符、蓝牙标识符、会议位置和/或日历约会。日历约会能够提供会议中的出席者的列表,使得每个声纹可与可能用户的列表相关联。其它指示符可包括主用户相关联于会议而创建的笔记和/或电子邮件。例如,主用户可发送包括来自会议的动作项的电子邮件给出席者中的三位;动作项电子邮件可与这三个出席者中的每一个相关联。随着用户与这其他九个用户的一些和/或全部这些人或这些人的子集有越来越多的会议,那么相关可允许对单个用户的隔离。例如,三个用户中的一个可与主用户进行电话呼叫以讨论动作项电子邮件。可为该其他用户生成声纹且环境指示符(例如,呼叫者ID号)可与声纹相关联。声纹可与在较早的会议期间生成的声纹做比较且可作出进行呼叫的用户之间的相关。可将呼叫者ID号增加到关联于声纹的相关联的环境指示符的列表中。此外,呼叫者ID号可在公司目录中获得并与会议中的已知出席者中的一个相关联。这可允许对与该声纹相关联的用户的肯定标识。初始置信水平可与已标识用户的声纹相关联,该水平可随着附加指示符的收集增加。如果声纹和它们所关联的指示符数据跨一组个体共享,则标识过程可更快地发生。例如,由于任何用户数据都产生肯定标识,组织可将声纹与每个个体相关联。可不要求用户显式地记录他们的语音,但一旦系统将一声纹标识为属于特定个体,可使得所标识的声纹对其他用户可用。然后可用所标识的声纹来帮助标识其它声纹,诸如通过将出席者的列表缩小。如果会议有三个已知出席者,其中两个有已标识的声纹,那么可将第三个用户标识为与该会议期间记录的一个未知声纹相关联。讲话者标识系统可使用语音生物统计来标识和/或验证给定讲话者是他们说他们是的那个人。可通过将一个人的话音档案数字化从而产生存储的模型声纹或模板来使用语音生物统计。生物统计技术可将每个讲出来的词降为由数个称为共振峰的主导频率组成的段。每个段可包括数个可按照数字格式捕捉的音调。这些音调可共同地标识讲话者的独特的声纹。可以类似于存储指纹或其他生物统计数据的方式将声纹存储在数据库中。可使用各种技术来处理和存储声纹,诸如频率估计、隐马尔可夫(Markov)模型、高斯(Gaussian)混合模型、模式匹配算法、神经网络(neural network)、矩阵表示(matrixrepresentation)、矢量量化(Vector Quantization)和 / 或决策树(decision tree)。有些系统还可使用反讲话者技术,诸如竞争者模型(cohort model)和世界模型。图I是用于提供声纹标识的操作环境100的框图。操作环境100可包括事件位置105,该事件位置包括主用户设备110和多个出席者用户设备120 (A)- (C)的。主用户设备110可包括以下参考图4将更详细讨论的计算设备400,并可包括记录设备,诸如话筒和/或用于记录事件中的出席者的语音和/或图像的摄像头。例如,数个同事可在诸如会议室的事件位置105出席会议。主用户设备110可记录会议并可捕捉与出席者相关联的身份指示符,诸如与出席者用户设备120 (A)-(C)相关联的设备ID (例如,蓝牙 和/或无线网络MAC地址)。主用户设备110可用于将记录发送给用于为会议期间记录的每个语音生成声纹的另一个设备,诸如识别服务器140。主用户设备110还可用于自己生成声纹并将它们发送给识别服务器140。识别服务器140可用于创建和/或管理事件在场数据库150、事件出席者数据库155和/或身份指示符数据库160。可将与声纹和/或事件相关联的数据存储在这些数据库中并可周期性地将其与标识与声纹中的每一个相关联的用户相关。根据本专利技术的实施例,可将数据存储在单个数据库中和/或分散在多个数据库和表之上。图2A示出示例事件在场表200。事件在场表200可包括多个行,每行包括与声纹列205、事件列210、主列215和位置列220相关联的数据。声纹列205中的数据可对应于由主用户设备110生成的声纹。事件列210中的数据可与相关联于主用户设备110的主用户所创建的日历事件标识符相关联。主列215中的数据可包括与主用本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:D·J·拉斯姆森
申请(专利权)人:微软公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利