基于语音数据和媒体消费数据识别用户的系统和方法技术方案

技术编号:25233738 阅读:35 留言:0更新日期:2020-08-11 23:20
本文公开了用于基于语音数据和媒体消费数据来识别用户的系统和方法。媒体指南应用可以根据用户的输入生成语音签名,并基于该签名来识别用户的一些人口统计特征(例如,年龄、性别和其它合适的特征)。媒体指南应用可以检索与用户的家庭相关联的用户的用户数据,并尝试识别哪个用户说出了命令。如果基于人口统计特征识别出多个用户,那么媒体指南应用可以使用语音命令的内容(例如,所请求的媒体类型)来识别用户。

【技术实现步骤摘要】
【国外来华专利技术】基于语音数据和媒体消费数据识别用户的系统和方法
技术介绍
在最近几年中,每个家庭中的媒体消费设备的数量急剧增加。随着越来越多的用户从家庭中的各种设备消费媒体,与用户用来消费内容的设备无关地识别每个用户正在消费的内容可能是有用的。当前系统解决该问题的一种方式是通过在用户说出请求内容的语音命令时启用语音识别。一旦接收到语音命令,当前系统将从语音命令中提取的用户声纹与先前存储的声纹进行比较,以获得匹配结果。但是,如果没有存储可以用于比较声纹的声纹,那么这种处理将失败。
技术实现思路
因此,本文公开了用于基于语音数据和媒体消费数据来识别用户的系统和方法。媒体指南应用可以用于基于语音数据和媒体消费数据执行与识别用户相关的操作。媒体指南应用可以根据用户的输入生成语音签名,并基于该签名来识别用户的一些人口统计特征(例如,年龄、性别和其它合适的特征)。媒体指南应用可以检索与用户的家庭相关联的用户的用户数据,并尝试识别哪个用户说出了命令。如果基于人口统计特征识别出多个用户,那么媒体指南应用可以使用命令的内容(例如,所请求的媒体类型)来识别用户。例如,家庭可以包括丈夫、妻子和两个都是男孩的孩子,一个是9岁,另一个是15岁。其中一个男孩可能说出PG-13电影“Avatar”的命令。作为响应,媒体指南应用可以分析孩子的语音并确定孩子是六岁至十六岁之间的男性。媒体指南应用可以获得家庭的用户信息,并基于该信息确定第一个孩子或者第二个孩子说出了命令(例如,因为据推测父母双方年龄都在十六岁以上)。为了确定哪个孩子说出了命令,媒体指南应用可以将“Avatar”识别为所请求的媒体资产。媒体指南应用可以将电影“Avatar”的特征与每个孩子的首选媒体特征(例如,从他们各自的简档中获得)进行比较,并基于该信息确定年龄较大的孩子是说出命令的孩子。在一些方面,媒体指南应用可以执行以下动作,以便基于语音数据和媒体消费数据来识别用户。媒体指南应用可以根据从用户接收到的语音命令来生成语音签名。例如,媒体指南应用可以接收语音命令“播放Avatar”。一旦接收到命令,媒体指南应用可以为用户生成语音签名(例如,语音输入中使得能够进行人口统计信息检测的部分)。媒体指南应用可以分析语音签名以识别说话者的人口统计特征。具体而言,媒体指南应用可以从语音签名中确定与用户相关联的多个语音特征,其中多个语音特征对应于多个人口统计学特征。例如,媒体指南应用可以从语音签名中确定说话者年龄在六岁到十四岁之间,并且说话者是男性。媒体指南应用可以尝试获得家庭(例如,接收用户语音输入的设备的家庭)中的用户的用户信息。具体而言,媒体指南应用可以发送对与用户的家庭相关联的用户信息的请求。例如,媒体指南应用可以发送包括用于用户信息的家庭标识符的请求。响应于对用户信息的请求,媒体指南应用可以接收所请求的家庭信息。具体而言,媒体指南应用可以接收用户信息,其中用户信息包括家庭中每个用户的各自的人口统计信息。例如,媒体指南应用可以接收指示家庭包括四个用户的信息。即,可能的用户可以包括四十六岁的男性、四十四岁的女性以及另外两个年龄分别为八岁和十四岁的男性。媒体指南应用可以将从语音签名中提取的人口统计信息与接收到的人口统计学家庭信息进行比较。具体而言,媒体指南应用可以将多个人口统计学特征与用户信息内的人口统计信息进行比较。例如,媒体指南应用可以将语音签名的性别(例如,男性)与可能的用户的性别进行比较,并确定女性不匹配。媒体指南应用可以将用户的年龄与从语音签名中提取的年龄范围进行比较。作为比较的结果,媒体指南应用可以识别可能与语音签名匹配的多个用户。具体而言,媒体指南应用可以基于比较确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配。例如,媒体指南应用可以确定两个男孩是家庭中满足条件的仅有成员。响应于匹配多个身份,媒体指南应用可以使用命令的内容来识别哪个用户是说话者。具体而言,媒体指南应用可以响应于确定与两个或更多个用户相关联的人口统计信息与多个人口统计学特征匹配而执行以下动作。媒体指南应用可以确定语音命令包括对媒体资产(例如,电影“Avatar”)的请求,并将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较。例如,媒体指南应用可以检索每个男孩的简档,并将每个简档中的数据和与电影“Avatar”相关联的元数据进行比较。媒体指南应用可以基于比较来识别最可能的说话者。具体而言,媒体指南应用可以基于将与媒体资产相关联的元数据和与匹配多个人口统计学特征的两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较来确定两个或更多个用户中的第一用户构成最佳匹配。例如,媒体指南应用可以确定年长男孩(14岁)简档中的数据比年长男孩的简档更匹配电影“Avatar”的元数据。媒体指南应用可以生成用于显示的某种类型的指示符,以通知观看者说话者已经被识别。具体而言,媒体指南应用可以响应于确定第一用户是最佳匹配而生成用于显示的用户已经被识别的指示。例如,媒体指南应用可以生成用于显示的用户照片的图标、用户头像(avatar)的图标、用户的名字或其它合适的指示符。在一些实施例中,媒体指南应用可以通过采取以下动作来发送对与用户的家庭相关联的用户信息的请求。媒体指南应用可以检索接收到语音命令的用户设备的标识串。具体而言,媒体指南应用可以确定与其中接收到语音命令的用户装备设备相关联的标识串。例如,媒体指南应用可以检索表示设备序列号的字母数字串。媒体指南应用可以使用标识串来建立对家庭信息的查询。具体而言,媒体指南应用可以生成针对家庭用户信息的查询,其中该查询包括标识串。例如,媒体指南应用可以使用表示设备序列号的字母数字串来生成数据库搜索查询。媒体指南应用可以将生成的查询发送到存储适当信息的服务器。具体而言,媒体指南应用可以将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。例如,与用户的家庭相关联的用户信息可以存储在远程位置处的数据库服务器上。媒体指南应用可以通过互联网发送查询。在一些实施例中,媒体指南应用可以在接收到用户信息时将用户信息存储在数据结构中。数据结构可以包括多个条目,其中多个条目包括针对家庭中每个用户的条目。例如,媒体指南应用可以将数据结构存储为表,其中该表包括针对每个条目的行。媒体指南应用可以为每个条目存储多个字段,其中该多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。例如,表可以包括条目,条目包括用于年龄(例如,十四岁)和性别(例如,男性)的字段。在一些实施例中,媒体指南应用可以在将多个人口统计学特征与用户信息内的人口统计信息进行比较时执行以下动作。媒体指南应用可以从多个条目中检索第一条目。例如,媒体指南应用可以检索上述例示的条目,其中年龄字段的值为14,性别字段的值为男性(male)。媒体指南应用可以将接收到的人口统计信息与从语音命令提取的人口统计学特征进行比较。具体而言,媒体指南应用可以将多个人口统计学特征中的每个人口统计学特征和与两个或本文档来自技高网...

【技术保护点】
1.一种用于基于语音数据和媒体消费数据来识别用户的方法,所述方法包括:/n根据从用户接收到的语音命令生成语音签名;/n基于语音签名识别与用户相关联的多个语音特征,其中所述多个语音特征中的每个语音特征对应于与用户相关联的人口统计数据;/n将多个人口统计学特征与在和与家庭相关联的多个用户相关联的多个简档中的每个简档内的人口统计信息进行比较;/n基于所述比较,确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配;/n响应于确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配,基于语音命令的内容从所述两个或更多个简档识别用户的简档;以及/n生成用于显示的指示已经识别出用户的指示。/n

【技术特征摘要】
【国外来华专利技术】1.一种用于基于语音数据和媒体消费数据来识别用户的方法,所述方法包括:
根据从用户接收到的语音命令生成语音签名;
基于语音签名识别与用户相关联的多个语音特征,其中所述多个语音特征中的每个语音特征对应于与用户相关联的人口统计数据;
将多个人口统计学特征与在和与家庭相关联的多个用户相关联的多个简档中的每个简档内的人口统计信息进行比较;
基于所述比较,确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配;
响应于确定所述多个简档中的两个或更多个简档与所述多个人口统计学特征匹配,基于语音命令的内容从所述两个或更多个简档识别用户的简档;以及
生成用于显示的指示已经识别出用户的指示。


2.一种用于基于语音数据和媒体消费数据识别用户的方法,所述方法包括:
根据从用户接收到的语音命令生成语音签名;
从语音签名中确定与用户相关联的多个语音特征,其中所述多个语音特征对应于多个人口统计学特征;
发送对与用户的家庭相关联的用户信息的请求;
接收用户信息,其中用户信息包括家庭内每个用户的相应人口统计信息;
将所述多个人口统计学特征与用户信息内的人口统计信息进行比较;
基于所述比较,确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配;
响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配:
确定语音命令包括对媒体资产的请求;
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较;
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较,确定所述两个或更多个用户中的第一用户构成最佳匹配;以及
响应于确定第一用户是最佳匹配,生成用于显示的用户已经被识别出的指示。


3.如权利要求2所述的方法,其中发送对与用户的家庭相关联的用户信息的请求包括:
确定与接收语音命令的用户装备设备相关联的标识串;
生成针对家庭用户信息的查询,其中查询包括所述标识串;以及
将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。


4.如权利要求3所述的方法,其中接收用户信息还包括将用户信息存储在数据结构中,所述数据结构包括:
多个条目,其中所述多个条目包括家庭内每个用户的条目;以及
用于每个条目的多个字段,其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。


5.如权利要求4所述的方法,其中将所述多个人口统计学特征与用户信息内的人口统计信息进行比较包括:
从所述多个条目中检索第一条目;
将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较;以及
基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较,从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。


6.如权利要求5所述的方法,其中确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征包括:
将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较;以及
基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较,识别具有最高匹配的人口统计信息量的两个或更多个用户。


7.如权利要求2所述的方法,其中将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较包括:
接收多个用户简档,其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户,并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征;
将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较;以及
基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较,为所述两个或更多个用户中的每个用户确定匹配的特征量。


8.如权利要求7所述的方法,其中从所述两个或更多个用户中确定具有最高匹配元数据量的用户包括:
检索与所述多个特征中的每个特征相关联的权重;
使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量;以及
选择具有最高匹配特征量的匹配用户。


9.如权利要求2所述的方法,其中生成用于显示的用户已经被识别出的指示包括:
从存储装置中检索用户的简档;
基于用户的简档,确定用户已选择头像;以及
生成用于显示的覆盖在一部分媒体资产上的头像。


10.如权利要求2所述的方法,还包括将语音签名存储在与用户相关联的所有设备上。


11.如权利要求2所述的方法,还包括:
在用户的语音简档中存储语音签名和媒体资产的指示;
检测后续语音命令;
确定与后续语音命令相关联的后续语音签名与所述语音签名匹配;以及
将后续语音命令的内容存储在用户的语音简档中。


12.一种用于基于语音数据和媒体消费数据识别用户的系统,所述系统包括:
通信电路系统;以及
控制电路系统,被配置为:
根据从用户接收到的语音命令生成语音签名;
从语音签名中确定与用户相关联的多个语音特征,其中所述多个语音特征对应于多个人口统计学特征;
使用通信电路系统发送对与用户的家庭相关联的用户信息的请求;
使用通信电路系统接收用户信息,其中用户信息包括家庭内每个用户的相应人口统计信息;
将所述多个人口统计学特征与用户信息内的人口统计信息进行比较;
基于所述比较,确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配;
响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配:
确定语音命令包括对媒体资产的请求;
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较;
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较,确定所述两个或更多个用户中的第一用户构成最佳匹配;以及
响应于确定第一用户是最佳匹配,生成用于显示的用户已经被识别出的指示。


13.如权利要求12所述的系统,其中所述控制电路系统还被配置为,当发送对与用户的家庭相关联的用户信息的请求时:
确定与接收语音命令的用户装备设备相关联的标识串;
生成针对家庭用户信息的查询,其中查询包括所述标识串;以及
将查询发送到存储与用户的家庭相关联的用户信息的远程服务器。


14.如权利要求13所述的系统,其中所述控制电路系统还被配置为,当接收用户信息时将用户信息存储在数据结构中,所述数据结构包括:
多个条目,其中所述多个条目包括家庭内每个用户的条目;以及
用于每个条目的多个字段,其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。


15.如权利要求14所述的系统,其中所述控制电路系统还被配置为,当将所述多个人口统计学特征与用户信息内的人口统计信息进行比较时:
从所述多个条目中检索第一条目;
将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较;以及
基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较,从所述多个人口统计学特征中生成匹配与第一用户相关联的人口统计学特征的人口统计信息集合。


16.如权利要求15所述的系统,其中所述控制电路系统还被配置为,当确定与所述两个或更多个用户相关联的人口统计信息匹配所述多个人口统计学特征时:
将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较;以及
基于将与第一用户相关联的匹配所述多个人口统计学特征的人口统计信息量和与其它用户相关联的匹配所述多个人口统计学特征的人口统计信息量进行比较,识别具有最高匹配的人口统计信息量的两个或更多个用户。


17.如权利要求12所述的系统,其中所述控制电路系统还被配置为:当将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较时:
接收多个用户简档,其中所述多个用户简档中的每个用户简档对应于所述两个或更多个用户中的一个用户,并且其中每个用户简档包括与所述两个或更多个用户中的相应用户偏好的媒体资产对应的多个特征;
将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较;以及
基于将与媒体资产相关联的元数据与对应用户偏好的媒体资产的特征进行比较,为所述两个或更多个用户中的每个用户确定匹配的特征量。


18.如权利要求17所述的系统,其中所述控制电路系统还被配置为,当从所述两个或更多个用户中确定具有最高匹配元数据量的用户时:
检索与所述多个特征中的每个特征相关联的权重;
使用每个特征的相应权重为所述两个或更多个用户中的每个用户计算匹配的特征量;以及
选择具有最高匹配特征量的匹配用户。


19.如权利要求12所述的系统,其中所述控制电路系统还被配置为,当生成用于显示的用户已经被识别出的指示时:
从存储装置中检索用户的简档;
基于用户的简档,确定用户已选择头像;以及
生成用于显示的覆盖在一部分媒体资产上的头像。


20.如权利要求12所述的系统,其中所述控制电路系统还被配置为将语音签名存储在与用户相关联的所有设备上。


21.如权利要求12所述的系统,其中所述控制电路系统还被配置为:
在用户的语音简档中存储语音签名和媒体资产的指示;
检测后续语音命令;
确定与后续语音命令相关联的后续语音签名与所述语音签名匹配;以及
将后续语音命令的内容存储在用户的语音简档中。


22.一种用于基于语音数据和媒体消费数据识别用户的系统,所述系统包括:
用于根据从用户接收到的语音命令生成语音签名的装置;
用于从语音签名中确定与用户相关联的多个语音特征的装置,其中所述多个语音特征对应于多个人口统计学特征;
用于发送对与用户的家庭相关联的用户信息的请求的装置;
用于接收用户信息的装置,其中用户信息包括家庭内每个用户的相应人口统计信息;
用于将所述多个人口统计学特征与用户信息内的人口统计信息进行比较的装置;
用于基于所述比较,确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配的装置;
用于响应于确定与两个或更多个用户相关联的人口统计信息与所述多个人口统计学特征匹配,执行以下操作的装置:
确定语音命令包括对媒体资产的请求;
将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较;
基于将与媒体资产相关联的元数据和与匹配所述多个人口统计学特征的所述两个或更多个用户中的每个用户感兴趣的媒体资产相关联的元数据进行比较,确定所述两个或更多个用户中的第一用户构成最佳匹配;以及
用于响应于确定第一用户是最佳匹配,生成用于显示的用户已经被识别出的指示的装置。


23.如权利要求22所述的系统,其中用于发送对与用户的家庭相关联的用户信息的请求的装置包括:
用于确定与接收语音命令的用户装备设备相关联的标识串的装置;
用于生成针对家庭用户信息的查询的装置,其中查询包括所述标识串;以及
用于将查询发送到存储与用户的家庭相关联的用户信息的远程服务器的装置。


24.如权利要求23所述的系统,其中用于接收用户信息的装置还包括用于将用户信息存储在数据结构中的装置,所述数据结构包括:
多个条目,其中所述多个条目包括家庭内每个用户的条目;以及
用于每个条目的多个字段,其中所述多个字段包括用于与相应用户相关联的每个人口统计信息项的字段。


25.如权利要求24所述的系统,其中用于将所述多个人口统计学特征与用户信息内的人口统计信息进行比较的装置包括:
用于从所述多个条目中检索第一条目的装置;
用于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多个用户中的第一用户的对应人口统计学特征相关联的字段的内容进行比较的装置;以及
用于基于将所述多个人口统计学特征中的每个人口统计学特征和与所述两个或更多...

【专利技术属性】
技术研发人员:S·马修斯B·H·莫根K·B·莱哈特
申请(专利权)人:乐威指南公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1