基于声纹识别的视频参数调整方法、装置及读存储介质制造方法及图纸

技术编号:20548138 阅读:20 留言:0更新日期:2019-03-09 20:44
本发明专利技术公开了一种基于声纹识别的视频参数调整方法,包括:在智能终端播放视频节目时,接收声纹数据采集模块采集的音频信息;在声纹特征库中存在音频信息对应的目标预设音频信息时,基于目标预设音频信息,确定音频信息对应的用户身份信息以及用户心情信息;获取用户心情信息对应的参数调整模式的调整参数,以及基于用户身份信息获取参数调整模式对应的调整比例;基于调整参数以及调整比例调整智能终端的视频播放参数。本发明专利技术还公开了一种基于声纹识别的视频参数调整装置及可读存储介质。本发明专利技术能够根据音频信息对应的用户身份信息以及用户心情信息自动调节智能终端的视频播放参数,进而实现智能终端的视频播放参数的智能调节,提高了用户体验。

【技术实现步骤摘要】
基于声纹识别的视频参数调整方法、装置及读存储介质
本专利技术涉及是数据处理
,尤其涉及一种基于声纹识别的视频参数调整方法、装置及可读存储介质。
技术介绍
随着智能技术的飞速发展,智能电视等智能终端已经进入千家万户。由于每个用户的喜好不一样,而且每个用户在不同时刻心情也可能不一样,不同心情对应的喜好也不一样,所以人们对智能终端的个性化需求越来越强烈。目前,智能终端的图像模式和声音模式等播放参数的调整大都还是通过用户手动调整。当用户心情愉悦时,用户可能将智能终端的画面调整的比较亮,声音也比较大;当用户心情低落的时候,用户可能将智能终端的画面调整的比较暗,声音也可能比较小。并且,对于老人、大人、小孩子等不同年龄的用户,在相同心情下,对图像模式和声音模式等播放参数的需求也不一样。但是,在用户的心情不同时,智能终端的播放参数只能通过用户进行手动调整,而不能根据用户的身份以及心情进行自动调节,导致播放参数的调整过程不够智能,缺乏人性化,影响用户体验。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种基于声纹识别的视频参数调整方法、装置及可读存储介质,旨在解决智能终端的播放参数不能根据用户的身份以及心情进行自动调节的技术问题。为实现上述目的,本专利技术提供一种基于声纹识别的视频参数调整方法,所述基于声纹识别的视频参数调整方法包括以下步骤:在智能终端播放视频节目时,接收声纹数据采集模块采集的音频信息;在声纹特征库中存在所述音频信息对应的目标预设音频信息时,基于所述目标预设音频信息,确定所述音频信息对应的用户身份信息以及用户心情信息;获取所述用户心情信息对应的参数调整模式的调整参数,以及基于所述用户身份信息获取所述参数调整模式对应的调整比例;基于所述调整参数以及调整比例调整所述智能终端的视频播放参数。进一步地,所述在声纹特征库中存在所述音频信息对应的目标预设音频信息时,基于所述目标预设音频信息,确定所述音频信息对应的用户身份信息以及用户心情信息的步骤包括:确定所述音频信息对应的声纹特征向量;确定声纹特征库的预设音频信息对应的预设特征向量中,是否存在与所述声纹特征向量匹配的目标特征向量;若存在,则基于目标特征向量对应的目标预设音频信息,确定所述音频信息对应的用户心情信息。进一步地,所述确定声纹特征库的预设音频信息对应的预设特征向量中,是否存在与所述声纹特征向量匹配的目标特征向量的步骤包括:计算所述声纹特征库中各个预设音频信息对应的预设特征向量,与所述声纹特征向量之间的第一相似度;确定所述第一相似度中的最大相似度是否大于第一预设相似度,其中,在所述第一相似度中的最大相似度大于第一预设相似度时,确定声纹特征库中存在与所述声纹特征向量匹配的目标特征向量,所述第一相似度中的最大相似度所对应的预设声纹特征向量为所述目标特征向量。进一步地,所述确定所述音频信息对应的声纹特征向量的步骤包括:基于预设时间窗,按照预设频率对所述音频信息进行采样,以获得采样数据;根据所述采样数据生成所述声纹特征向量。进一步地,所述声纹特征向量包括音调特征向量、响度特征向量和音色特征向量,所述确定声纹特征库的预设音频信息对应的预设特征向量中,是否存在与所述声纹特征向量匹配的目标特征向量的步骤包括:计算各个所述预设特征向量中的预设音色特征向量,与所述音色特征向量之间的第二相似度;在所述第二相似度中的最大相似度大于第二预设相似度时,确定所述第二相似度中的最大相似度的预设音色特征向量所对应的用户身份信息,并基于所述用户身份信息获取参数调整模式对应的预设音调特征向量以及预设响度特征向量,其中,所述参数调整模式包括增强模式、中间模式以及减弱模式;计算所述音调特征向量与所述预设音调特征向量之间的第三相似度,以及计算所述响度特征向量与所述预设响度特征向量之间的第四相似度;基于所述第三相似度以及所述第四相似度,确定预设特征向量中,是否存在与所述声纹特征向量匹配的目标特征向量。进一步地,所述基于所述第三相似度以及所述第四相似度,确定预设特征向量中,是否存在与所述声纹特征向量匹配的目标特征向量的步骤包括:基于所述第三相似度以及所述第四相似度,计算各个所述参数调整模式对应的第五相似度;确定所述第五相似度中的最大相似度是否大于第三预设相似度,其中,在所述第五相似度中的最大相似度大于第三预设相似度时,确定预设特征向量中存在与所述声纹特征向量匹配的目标特征向量,所述第五相似度中的最大相似度对应的预设特征向量为所述目标特征向量。进一步地,所述在存在所述音频信息对应的目标预设音频信息时,基于所述目标预设音频信息,确定所述音频信息对应的用户心情信息的步骤包括:发送所述音频信息至云服务器,以供所述云服务器确定所述音频信息对应的声纹特征信息,查找并反馈与所述声纹特征信息匹配的目标预设声纹特征所对应的用户身份信息以及用户心情信息;接收所述云服务器反馈的所述用户身份信息以及用户心情信息。进一步地,所述接收声纹数据采集模块采集的音频信息步骤之后,所述基于声纹识别的视频参数调整方法还包括:在声纹特征库中不存在所述音频信息对应的目标预设音频信息时,对所述音频信息进行语音识别以获得所述音频信息对应的用户身份信息以及用户心情信息;将所述音频信息作为预设音频信息,并与所述用户身份信息以及用户心情信息关联存储至所述声纹特征库。此外,为实现上述目的,本专利技术还提供一种基于声纹识别的视频参数调整装置,所述基于声纹识别的视频参数调整装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于声纹识别的视频参数调整程序,所述基于声纹识别的视频参数调整程序被所述处理器执行时实现前述的基于声纹识别的视频参数调整方法的步骤。此外,为实现上述目的,本专利技术还提供一种可读存储介质,所述可读存储介质上存储有基于声纹识别的视频参数调整程序,所述基于声纹识别的视频参数调整程序被处理器执行时实现前述的基于声纹识别的视频参数调整方法的步骤。本专利技术通过在智能终端播放视频节目时,接收声纹数据采集模块采集的音频信息,接着在声纹特征库中存在所述音频信息对应的目标预设音频信息时,基于所述目标预设音频信息,确定所述音频信息对应的用户身份信息以及用户心情信息,而后获取所述用户心情信息对应的参数调整模式的调整参数,以及基于所述用户身份信息获取所述参数调整模式对应的调整比例,然后基于所述调整参数以及调整比例调整所述智能终端的视频播放参数,能够根据音频信息对应的用户身份信息以及用户心情信息自动调节智能终端的视频播放参数,进而实现智能终端的视频播放参数的智能调节,提高了用户体验。附图说明图1是本专利技术实施例方案涉及的硬件运行环境中基于声纹识别的视频参数调整装置的结构示意图;图2为本专利技术基于声纹识别的视频参数调整方法第一实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境中基于声纹识别的视频参数调整装置的结构示意图。本专利技术实施例基于声纹识别的视频参数调整装置可以是智能电视,也可以是PC、智能手机、平板电脑、电子书阅读本文档来自技高网...

【技术保护点】
1.一种基于声纹识别的视频参数调整方法,其特征在于,所述基于声纹识别的视频参数调整方法包括以下步骤:在智能终端播放视频节目时,接收声纹数据采集模块采集的音频信息;在声纹特征库中存在所述音频信息对应的目标预设音频信息时,基于所述目标预设音频信息,确定所述音频信息对应的用户身份信息以及用户心情信息;获取所述用户心情信息对应的参数调整模式的调整参数,以及基于所述用户身份信息获取所述参数调整模式对应的调整比例;基于所述调整参数以及调整比例调整所述智能终端的视频播放参数。

【技术特征摘要】
1.一种基于声纹识别的视频参数调整方法,其特征在于,所述基于声纹识别的视频参数调整方法包括以下步骤:在智能终端播放视频节目时,接收声纹数据采集模块采集的音频信息;在声纹特征库中存在所述音频信息对应的目标预设音频信息时,基于所述目标预设音频信息,确定所述音频信息对应的用户身份信息以及用户心情信息;获取所述用户心情信息对应的参数调整模式的调整参数,以及基于所述用户身份信息获取所述参数调整模式对应的调整比例;基于所述调整参数以及调整比例调整所述智能终端的视频播放参数。2.如权利要求1所述的基于声纹识别的视频参数调整方法,其特征在于,所述在声纹特征库中存在所述音频信息对应的目标预设音频信息时,基于所述目标预设音频信息,确定所述音频信息对应的用户身份信息以及用户心情信息的步骤包括:确定所述音频信息对应的声纹特征向量;确定声纹特征库的预设音频信息对应的预设特征向量中,是否存在与所述声纹特征向量匹配的目标特征向量;若存在,则基于目标特征向量对应的目标预设音频信息,确定所述音频信息对应的用户身份信息以及用户心情信息。3.如权利要求2所述的基于声纹识别的视频参数调整方法,其特征在于,所述确定声纹特征库的预设音频信息对应的预设特征向量中,是否存在与所述声纹特征向量匹配的目标特征向量的步骤包括:计算所述声纹特征库中各个预设音频信息对应的预设特征向量,与所述声纹特征向量之间的第一相似度;确定所述第一相似度中的最大相似度是否大于第一预设相似度,其中,在所述第一相似度中的最大相似度大于第一预设相似度时,确定声纹特征库中存在与所述声纹特征向量匹配的目标特征向量,所述第一相似度中的最大相似度所对应的预设声纹特征向量为所述目标特征向量。4.如权利要求2所述的基于声纹识别的视频参数调整方法,其特征在于,所述确定所述音频信息对应的声纹特征向量的步骤包括:基于预设时间窗,按照预设频率对所述音频信息进行采样,以获得采样数据;根据所述采样数据生成所述声纹特征向量。5.如权利要求2所述的基于声纹识别的视频参数调整方法,其特征在于,所述声纹特征向量包括音调特征向量、响度特征向量和音色特征向量,所述确定声纹特征库的预设音频信息对应的预设特征向量中,是否存在与所述声纹特征向量匹配的目标特征向量的步骤包括:计算各个所述预设特征向量中的预设音色特征向量,与所述音色特征向量之间的第二相似度;在所述第二相似度中的最大相似度大于第二预设相似度时,确定所述第二相似度中的最大相似度的预设音色特征向量所对应的用户身份信息,并基于所述用户身份信息获取参数调整模式对应的预设音调...

【专利技术属性】
技术研发人员:付华东
申请(专利权)人:深圳创维RGB电子有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1