基于语音数据和媒体消费数据识别用户的系统和方法技术方案

技术编号：25233738 阅读：35 留言：0更新日期：2020-08-11 23:20

本文公开了用于基于语音数据和媒体消费数据来识别用户的系统和方法。媒体指南应用可以根据用户的输入生成语音签名，并基于该签名来识别用户的一些人口统计特征(例如，年龄、性别和其它合适的特征)。媒体指南应用可以检索与用户的家庭相关联的用户的用户数据，并尝试识别哪个用户说出了命令。如果基于人口统计特征识别出多个用户，那么媒体指南应用可以使用语音命令的内容(例如，所请求的媒体类型)来识别用户。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于语音数据和媒体消费数据识别用户的系统和方法
技术介绍
在最近几年中，每个家庭中的媒体消费设备的数量急剧增加。随着越来越多的用户从家庭中的各种设备消费媒体，与用户用来消费内容的设备无关地识别每个用户正在消费的内容可能是有用的。当前系统解决该问题的一种方式是通过在用户说出请求内容的语音命令时启用语音识别。一旦接收到语音命令，当前系统将从语音命令中提取的用户声纹与先前存储的声纹进行比较，以获得匹配结果。但是，如果没有存储可以用于比较声纹的声纹，那么这种处理将失败。
技术实现思路
因此，本文公开了用于基于语音数据和媒体消费数据来识别用户的系统和方法。媒体指南应用可以用于基于语音数据和媒体消费数据执行与识别用户相关的操作。媒体指南应用可以根据用户的输入生成语音签名，并基于该签名来识别用户的一些人口统计特征(例如，年龄、性别和其它合适的特征)。媒体指南应用可以检索与用户的家庭相关联的用户的用户数据，并尝试识别哪个用户说出了命令。如果基于人口统计特征识别出多个用户，那么媒体指南应用可以使用命令的内容(例如，所请求的媒体类型)来识别用户。例如，家庭可以包括丈夫、妻子和两个都是男孩的孩子，一个是9岁，另一个是15岁。其中一个男孩可能说出PG-13电影“Avatar”的命令。作为响应，媒体指南应用可以分析孩子的语音并确定孩子是六岁至十六岁之间的男性。媒体指南应用可以获得家庭的用户信息，并基于该信息确定第一个孩子或者第二个孩子说出了命令(例如，因为据推测父母双方年龄都在十六岁以上)。为了确定哪个孩子说出了命令，媒体指南应用可以将“Ava...

【技术保护点】
1.一种用于基于语音数据和媒体消费数据来识别用户的方法，所述方法包括：/n根据从用户接收到的语音命令生成语音签名；/n基于语音签名识别与用户相关联的多个语音特征，其中所述多个语音特征中的每个语音特征对应于与用户相关联的人口统计数据；/n将多个人口统计学特征与在和与家庭相关联的多个用户相关联的多个简档中的每个简档内的人口统计信息进行比较；/n基于所述比较，确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配；/n响应于确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配，基于语音命令的内容从所述两个或更多个简档识别用户的简档；以及/n生成用于显示的指示已经识别出用户的指示。/n

【技术特征摘要】
【国外来华专利技术】1.一种用于基于语音数据和媒体消费数据来识别用户的方法，所述方法包括：
根据从用户接收到的语音命令生成语音签名；
基于语音签名识别与用户相关联的多个语音特征，其中所述多个语音特征中的每个语音特征对应于与用户相关联的人口统计数据；
将多个人口统计学特征与在和与家庭相关联的多个用户相关联的多个简档中的每个简档内的人口统计信息进行比较；
基于所述比较，确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配；
响应于确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配，基于语音命令的内容从所述两个或更多个简档识别用户的简档；以及
生成用于显示的指示已经识别出用户的指示。

2.一种用于基于语音数据和媒体消费数据识别用户的方法，所述方法包括：
根据从用户接收到的语音命令生成语音签名；
从语音签名中确定与用户相关联的多个语音特征，其中所述多个语音特征对应于多个人口统计学特征；
发送对与用户的家庭相关联的用户信息的请求；
接收用户信息，其中用户信息包括家庭内每个用户的相应人口统计信息；
将所述多个人口统计学特征与用户信息内的人口统计信息进行比较；
基于所述比较，确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配；
响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配：
确定语音命令包括对媒体资产的请求；
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较；
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较，确定所述两个或更多个用户中的第一用户构成最佳匹配；以及
响应于确定第一用户是最佳匹配，生成用于显示的用户已经被识别出的指示。

3.如权利要求2所述的方法，其中发送对与用户的家庭相关联的用户信息的请求包括：
确定与接收语音命令的用户装备设备相关联的标识串；
生成针对家庭用户信息的查询，其中查询包括所述标识串；以及
将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。

4.如权利要求3所述的方法，其中接收用户信息还包括将用户信息存储在数据结构中，所述数据结构包括：
多个条目，其中所述多个条目包括家庭内每个用户的条目；以及
用于每个条目的多个字段，其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。

5.如权利要求4所述的方法，其中将所述多个人口统计学特征与用户信息内的人口统计信息进行比较包括：
从所述多个条目中检索第一条目；
将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较；以及
基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较，从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。

6.如权利要求5所述的方法，其中确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征包括：
将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较；以及
基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较，识别具有最高匹配的人口统计信息量的两个或更多个用户。

7.如权利要求2所述的方法，其中将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较包括：
接收多个用户简档，其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户，并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征；
将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较；以及
基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较，为所述两个或更多个用户中的每个用户确定匹配的特征量。

8.如权利要求7所述的方法，其中从所述两个或更多个用户中确定具有最高匹配元数据量的用户包括：
检索与所述多个特征中的每个特征相关联的权重；
使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量；以及
选择具有最高匹配特征量的匹配用户。

9.如权利要求2所述的方法，其中生成用于显示的用户已经被识别出的指示包括：
从存储装置中检索用户的简档；
基于用户的简档，确定用户已选择头像；以及
生成用于显示的覆盖在一部分媒体资产上的头像。

10.如权利要求2所述的方法，还包括将语音签名存储在与用户相关联的所有设备上。

11.如权利要求2所述的方法，还包括：
在用户的语音简档中存储语音签名和媒体资产的指示；
检测后续语音命令；
确定与后续语音命令相关联的后续语音签名与所述语音签名匹配；以及
将后续语音命令的内容存储在用户的语音简档中。

12.一种用于基于语音数据和媒体消费数据识别用户的系统，所述系统包括：
通信电路系统；以及
控制电路系统，被配置为：
根据从用户接收到的语音命令生成语音签名；
从语音签名中确定与用户相关联的多个语音特征，其中所述多个语音特征对应于多个人口统计学特征；
使用通信电路系统发送对与用户的家庭相关联的用户信息的请求；
使用通信电路系统接收用户信息，其中用户信息包括家庭内每个用户的相应人口统计信息；
将所述多个人口统计学特征与用户信息内的人口统计信息进行比较；
基于所述比较，确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配；
响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配：
确定语音命令包括对媒体资产的请求；
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较；
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较，确定所述两个或更多个用户中的第一用户构成最佳匹配；以及
响应于确定第一用户是最佳匹配，生成用于显示的用户已经被识别出的指示。

13.如权利要求12所述的系统，其中所述控制电路系统还被配置为，当发送对与用户的家庭相关联的用户信息的请求时：
确定与接收语音命令的用户装备设备相关联的标识串；
生成针对家庭用户信息的查询，其中查询包括所述标识串；以及
将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。

14.如权利要求13所述的系统，其中所述控制电路系统还被配置为，当接收用户信息时将用户信息存储在数据结构中，所述数据结构包括：
多个条目，其中所述多个条目包括家庭内每个用户的条目；以及
用于每个条目的多个字段，其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。

15.如权利要求14所述的系统，其中所述控制电路系统还被配置为，当将所述多个人口统计学特征与用户信息内的人口统计信息进行比较时：
从所述多个条目中检索第一条目；
将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较；以及
基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较，从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。

16.如权利要求15所述的系统，其中所述控制电路系统还被配置为，当确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征时：
将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较；以及
基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较，识别具有最高匹配的人口统计信息量的两个或更多个用户。

17.如权利要求12所述的系统，其中所述控制电路系统还被配置为：当将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较时：
接收多个用户简档，其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户，并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征；
将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较；以及
基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较，为所述两个或更多个用户中的每个用户确定匹配的特征量。

18.如权利要求17所述的系统，其中所述控制电路系统还被配置为，当从所述两个或更多个用户中确定具有最高匹配元数据量的用户时：
检索与所述多个特征中的每个特征相关联的权重；
使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量；以及
选择具有最高匹配特征量的匹配用户。

19.如权利要求12所述的系统，其中所述控制电路系统还被配置为，当生成用于显示的用户已经被识别出的指示时：
从存储装置中检索用户的简档；
基于用户的简档，确定用户已选择头像；以及
生成用于显示的覆盖在一部分媒体资产上的头像。

20.如权利要求12所述的系统，其中所述控制电路系统还被配置为将语音签名存储在与用户相关联的所有设备上。

21.如权利要求12所述的系统，其中所述控制电路系统还被配置为：
在用户的语音简档中存储语音签名和媒体资产的指示；
检测后续语音命令；
确定与后续语音命令相关联的后续语音签名与所述语音签名匹配；以及
将后续语音命令的内容存储在用户的语音简档中。

22.一种用于基于语音数据和媒体消费数据识别用户的系统，所述系统包括：
用于根据从用户接收到的语音命令生成语音签名的装置；
用于从语音签名中确定与用户相关联的多个语音特征的装置，其中所述多个语音特征对应于多个人口统计学特征；
用于发送对与用户的家庭相关联的用户信息的请求的装置；
用于接收用户信息的装置，其中用户信息包括家庭内每个用户的相应人口统计信息；
用于将所述多个人口统计学特征与用户信息内的人口统计信息进行比较的装置；
用于基于所述比较，确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配的装置；
用于响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配，执行以下操作的装置：
确定语音命令包括对媒体资产的请求；
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较；
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较，确定所述两个或更多个用户中的第一用户构成最佳匹配；以及
用于响应于确定第一用户是最佳匹配，生成用于显示的用户已经被识别出的指示的装置。

23.如权利要求22所述的系统，其中用于发送对与用户的家庭相关联的用户信息的请求的装置包括：
用于确定与接收语音命令的用户装备设备相关联的标识串的装置；
用于生成针对家庭用户信息的查询的装置，其中查询包括所述标识串；以及
用于将查询发送到存储与用户的家庭相关联的用户信息的远程服务器的装置。

24.如权利要求23所述的系统，其中用于接收用户信息的装置还包括用于将用户信息存储在数据结构中的装置，所述数据结构包括：
多个条目，其中所述多个条目包括家庭内每个用户的条目；以及
用于每个条目的多个字段，其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。

25.如权利要求24所述的系统，其中用于将所述多个人口统计学特征与用户信息内的人口统计信息进行比较的装置包括：
用于从所述多个条目中检索第一条目的装置；
用于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较的装置；以及
用于基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多...

【专利技术属性】
技术研发人员：S·马修斯，B·H·莫根，K·B·莱哈特，
申请(专利权)人：乐威指南公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人