基于声纹识别的视频参数调整方法、装置及读存储介质制造方法及图纸

技术编号：20548138 阅读：20 留言：0更新日期：2019-03-09 20:44

本发明专利技术公开了一种基于声纹识别的视频参数调整方法，包括：在智能终端播放视频节目时，接收声纹数据采集模块采集的音频信息；在声纹特征库中存在音频信息对应的目标预设音频信息时，基于目标预设音频信息，确定音频信息对应的用户身份信息以及用户心情信息；获取用户心情信息对应的参数调整模式的调整参数，以及基于用户身份信息获取参数调整模式对应的调整比例；基于调整参数以及调整比例调整智能终端的视频播放参数。本发明专利技术还公开了一种基于声纹识别的视频参数调整装置及可读存储介质。本发明专利技术能够根据音频信息对应的用户身份信息以及用户心情信息自动调节智能终端的视频播放参数，进而实现智能终端的视频播放参数的智能调节，提高了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于声纹识别的视频参数调整方法、装置及读存储介质
本专利技术涉及是数据处理
，尤其涉及一种基于声纹识别的视频参数调整方法、装置及可读存储介质。
技术介绍
随着智能技术的飞速发展，智能电视等智能终端已经进入千家万户。由于每个用户的喜好不一样，而且每个用户在不同时刻心情也可能不一样，不同心情对应的喜好也不一样，所以人们对智能终端的个性化需求越来越强烈。目前，智能终端的图像模式和声音模式等播放参数的调整大都还是通过用户手动调整。当用户心情愉悦时，用户可能将智能终端的画面调整的比较亮，声音也比较大；当用户心情低落的时候，用户可能将智能终端的画面调整的比较暗，声音也可能比较小。并且，对于老人、大人、小孩子等不同年龄的用户，在相同心情下，对图像模式和声音模式等播放参数的需求也不一样。但是，在用户的心情不同时，智能终端的播放参数只能通过用户进行手动调整，而不能根据用户的身份以及心情进行自动调节，导致播放参数的调整过程不够智能，缺乏人性化，影响用户体验。上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种基于声纹识别的视频参数调整方法、装置及可读存储介质，旨在解决智能终端的播放参数不能根据用户的身份以及心情进行自动调节的技术问题。为实现上述目的，本专利技术提供一种基于声纹识别的视频参数调整方法，所述基于声纹识别的视频参数调整方法包括以下步骤：在智能终端播放视频节目时，接收声纹数据采集模块采集的音频信息；在声纹特征库中存在所述音频信息对应的目标预设音频信息时，基于所述目标预设音频信息，确定所述音频信息...

【技术保护点】
1.一种基于声纹识别的视频参数调整方法，其特征在于，所述基于声纹识别的视频参数调整方法包括以下步骤：在智能终端播放视频节目时，接收声纹数据采集模块采集的音频信息；在声纹特征库中存在所述音频信息对应的目标预设音频信息时，基于所述目标预设音频信息，确定所述音频信息对应的用户身份信息以及用户心情信息；获取所述用户心情信息对应的参数调整模式的调整参数，以及基于所述用户身份信息获取所述参数调整模式对应的调整比例；基于所述调整参数以及调整比例调整所述智能终端的视频播放参数。

【技术特征摘要】
1.一种基于声纹识别的视频参数调整方法，其特征在于，所述基于声纹识别的视频参数调整方法包括以下步骤：在智能终端播放视频节目时，接收声纹数据采集模块采集的音频信息；在声纹特征库中存在所述音频信息对应的目标预设音频信息时，基于所述目标预设音频信息，确定所述音频信息对应的用户身份信息以及用户心情信息；获取所述用户心情信息对应的参数调整模式的调整参数，以及基于所述用户身份信息获取所述参数调整模式对应的调整比例；基于所述调整参数以及调整比例调整所述智能终端的视频播放参数。2.如权利要求1所述的基于声纹识别的视频参数调整方法，其特征在于，所述在声纹特征库中存在所述音频信息对应的目标预设音频信息时，基于所述目标预设音频信息，确定所述音频信息对应的用户身份信息以及用户心情信息的步骤包括：确定所述音频信息对应的声纹特征向量；确定声纹特征库的预设音频信息对应的预设特征向量中，是否存在与所述声纹特征向量匹配的目标特征向量；若存在，则基于目标特征向量对应的目标预设音频信息，确定所述音频信息对应的用户身份信息以及用户心情信息。3.如权利要求2所述的基于声纹识别的视频参数调整方法，其特征在于，所述确定声纹特征库的预设音频信息对应的预设特征向量中，是否存在与所述声纹特征向量匹配的目标特征向量的步骤包括：计算所述声纹特征库中各个预设音频信息对应的预设特征向量，与所述声纹特征向量之间的第一相似度；确定所述第一相似度中的最大相似度是否大于第一预设相似度，其中，在所述第一相似度中的最大相似度大于第一预设相似度时，确定声纹特征库中存在与所述声纹特征向量匹配的目标特征向量，所述第一相似度中的最大相似度所对应的预设声纹特征向量为所述目标特征向量。4.如权利要求2所述的基于声纹识别的视频参数调整方法，其特征在于，所述确定所述音频信息对应的声纹特征向量的步骤包括：基于预设时间窗，按照预设频率对所述音频信息进行采样，以获得采样数据；根据所述采样数据生成所述声纹特征向量。5.如权利要求2所述的基于声纹识别的视频参数调整方法，其特征在于，所述声纹特征向量包括音调特征向量、响度特征向量和音色特征向量，所述确定声纹特征库的预设音频信息对应的预设特征向量中，是否存在与所述声纹特征向量匹配的目标特征向量的步骤包括：计算各个所述预设特征向量中的预设音色特征向量，与所述音色特征向量之间的第二相似度；在所述第二相似度中的最大相似度大于第二预设相似度时，确定所述第二相似度中的最大相似度的预设音色特征向量所对应的用户身份信息，并基于所述用户身份信息获取参数调整模式对应的预设音调...

【专利技术属性】
技术研发人员：付华东，
申请(专利权)人：深圳创维RGB电子有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人