经由社交图谱、语音模型和用户情境识别接近移动装置用户的人制造方法及图纸

技术编号：9798539 阅读：85 留言：0更新日期：2014-03-22 13:31

提供用以使用说话者辨识来改进对人的识别的技术。在一个实施例中，唯一社交图谱可与多个所定义情境中的每一者相关联。所述社交图谱可指示可能存在于特定情境中的说话者。因此，可收集和处理包含语音信号的音频信号。可推断情境，且可识别对应的社交图谱。可基于所述社交图谱确定一组潜在说话者。接着可将所述经处理信号与受限制的一组语音模型进行比较，每一语音模型与一潜在说话者相关联。通过限制所述组潜在说话者，可较准确地识别说话者。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】经由社交图谱、语音模型和用户情境识别接近移动装置用户的人

技术介绍
识别移动装置用户正与之交互的人是情境感知和社交网络领域中待解决的极有价值的问题。迄今为止，所述问题大部分仍未解决。
技术实现思路
本专利技术提供使用说话者辨识来改进对人的识别的技术。在一个实施例中，可产生唯一社交图谱，并使其与多个所界定情境中的每一者相关联。社交图谱可指示在特定情境中可能存在说话者。因此，可收集并处理包含语音信号的音频信号。可推断情境，且可识别对应的社交图谱。可基于社交图谱来确定一组潜在说话者。接着可将经处理的信号与受限的一组语音模型进行比较，每一语音模型与一潜在说话者相关联。通过限制潜在说话者的集合，可较准确地识别说话者。在一些实施例中，提供一种用于识别说话者的方法。所述方法可包含:存取包括语音信号的音频数据，所述音频数据是使用移动装置上的麦克风产生；推断所述移动装置的用户的情境；至少部分地基于所述所推断的情境来识别社交图谱，所述社交图谱包括潜在说话者列表；以及识别被确定为已用声音为所述语音信号做贡献的说话者，所述说话者识别至少部分地基于所述所识别的社交图谱。推断所述用户的所述情境可至少部分地基于所述用户的位置。所述方法可进一步包含至少部分地基于所述移动装置所接收的GPS、WiFi或蜂窝式信号来确定所述用户的所述位置。推断所述用户的所述情境可至少部分地基于所述用户的环境。所述方法可进一步包含至少部分地基于所述移动装置所接收的蓝牙或音频信号来确定所述环境。推断所述用户的所述情境可至少部分地基于所述用户的活动。所述方法可进一步包含至少部分地基于运动传感器数据、光传感...

【技术保护点】
一种用于识别说话者的方法，所述方法包括：存取包括语音信号的音频数据，所述音频数据是使用移动装置上的麦克风产生的；推断所述移动装置的用户的情境；至少部分地基于所述所推断的情境来识别社交图谱，所述社交图谱包括潜在说话者列表；以及识别被确定为已用声音为所述语音信号做贡献的说话者，所述说话者识别至少部分地基于所述所识别的社交图谱。

【技术特征摘要】
【国外来华专利技术】2011.07.01 US 61/504,084;2012.01.06 US 13/344,7261.一种用于识别说话者的方法，所述方法包括: 存取包括语音信号的音频数据，所述音频数据是使用移动装置上的麦克风产生的；推断所述移动装置的用户的情境；至少部分地基于所述所推断的情境来识别社交图谱，所述社交图谱包括潜在说话者列表；以及识别被确定为已用声音为所述语音信号做贡献的说话者，所述说话者识别至少部分地基于所述所识别的社交图谱。2.根据权利要求1所述的方法，其中推断所述用户的所述情境是至少部分地基于所述用户的位置。3.根据权利要求2所述的方法，其进一步包括至少部分地基于所述移动装置所接收的GPS, WiFi或蜂窝式信号来确定所述用户的所述位置。4.根据权利要求1所述的方法，其中推断所述用户的所述情境是至少部分地基于所述用户的环境。5.根据权利要求4所述的方法，其进一步包括至少部分地基于所述移动装置所接收的蓝牙或音频信号来确定所述环境。6.根据权利要求1所述的方法，其中推断所述用户的所述情境是至少部分地基于所述用户的活动。7.根据权利要求6所述的方法，其进一步包括至少部分地基于运动传感器数据、光传感器数据或由所述移动装置上的所述麦克风捕获的音频信号来确定所述活动。8.根据权利要求1所述的方法，其中推断所述用户的所述情境是至少部分地基于与所述移动装置相关联的电子邮件数据、文本消息数据、日历数据、社交网络数据和联系人列表数据中的一者或一者以上。9.根据权利要求1所述的方法，其中推断所述用户的所述情境是至少部分地基于所述移动装置的呼叫状态和/或当前呼叫细节。10.根据权利要求1所述的方法，其中推断所述用户的所述情境是至少部分地基于所述移动装置上正活跃地或非活跃地使用的应用程序。11.根据权利要求1所述的方法，其中推断所述用户的所述情境是至少部分地基于收集所述音频数据时的时刻。12.根据权利要求1所述的方法，其中所述音频数据包含以隐私敏感方式采样的音频部分，使得所说的词语无法从所述音频数据重构。13.根据权利要求1所述的方法，其进一步包括存储多个社交图谱，所述多个社交图谱中的每一者与一不同情境相关联。14.根据权利要求1所述的方法，其进一步包括存储多个语音模型，其中每一语音模型与一潜在说话者相关联。15.根据权利要求1所述的方法，其进一步包括: 存储多个语音模型，其中每一语音模型与一潜在说话者相关联；处理所述所存取的音频数据；以及将所述经处理的音频数据与所述多个语音模型的子集进行比较，所述子集是至少部分地基于所述所识别的社交图谱来确定的。16.根据权利要求1所述的方法，其进一步包括产生一个或一个以上情境的社交图谱，其中所述社交图谱的产生是至少部分地基于以下各项中的一者或一者以上:用户位置数据、日历数据、电子邮件数据和社交网络数据。17.根据权利要求1所述的方法，其中所述所识别的社交图谱包含所述所识别的社交图谱的一个或一个以上边缘的边缘加权。18.根据权利要求17所述的方法，其中每一边缘的所述边缘加权对应于所述用户与和所述边缘相关联的人交互所花费的时间分数。19.根据权利要求1所述的方法，其进一步包括在识别所述社交图谱之前: ...

【专利技术属性】
技术研发人员：里昂纳德·亨利·葛罗科普，维迪亚·纳拉亚南，
申请(专利权)人：高通股份有限公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人