一种基于语言处理的鉴伪方法技术

技术编号:39051679 阅读:12 留言:0更新日期:2023-10-12 19:44
本发明专利技术公开了一种基于语言处理的鉴伪方法,涉及音频鉴伪技术领域,具体步骤为,对样本音频进行预处理,提取样本音频数据;构建语言分析模型,对发声人信息数据和语言数据进行分析处理,根据分析结果生成第一匹配目标;通过互联网分析模型进行发声人工作信息数据的调取,并根据发声人工作信息数据的调取进行信息匹配,根据匹配结果进行分析生成第二匹配标识;将第一匹配目标和第二匹配目标进行组合处理,生成第一分析标识;对音频基础数据进行分析处理,生成第一数据处理目标、第二数据处理目标和第三数据处理目标;对所述第一数据处理目标、第二数据处理目标和第三数据处理目标进行整合分析,生成第二分析标识。生成第二分析标识。生成第二分析标识。

【技术实现步骤摘要】
一种基于语言处理的鉴伪方法


[0001]本专利技术涉及音频鉴伪
,具体涉及一种基于语言处理的鉴伪方法。

技术介绍

[0002]随着鉴定手段的不断提升,音频的伪造手段也在不断提升,缝合、拼接以及ai合成的技术也不断运用于音频伪造中。
[0003]经检索,公开号为CN110164454A的对比文件中提出了一种基于共振峰偏差的音频同一性判别方法及装置,该专利技术通过将共振峰频率偏差值作为同一性判别依据来得到客观的数据,而不是通过人为观测共振峰位置、走势等宏观特性判断同一性,从而对数据做出更加准确的对比和客观的判定;另一方面通过迭代的方法,不断迭代的去除共振峰频率偏差大的音素样本,从而准确地确定音素样本是否满足同一性,解决了现有技术中需要人为通过观测共振峰位置、走势等宏观特性作为判定依据,对鉴定人经验技术要求高,可靠性低的问题。
[0004]参考对比文件,发现现有技术仍存在以下不足:
[0005]1.在原本基础的音频制作上,可以通过学习外地的方言口音进行人声声色的掩盖,从而对音频鉴定造成一定的人声识别影响;
[0006]2.在音频鉴定的过程中,大多采用同类数据进行细化分析来得出最终的鉴定结果,但基础数据的可修改性,随着音频修改者的修改意识上升,鉴定难度也在不断提升,常规的音频鉴定手段仅能作为初步筛选的方式。
[0007]为解决上述所提及的问题,提出了一种基于语言处理的鉴伪方法。

技术实现思路

[0008]本专利技术的目的是提供一种基于语言处理的鉴伪方法,以解决背景技术中不足。
[0009]为了实现上述目的,本专利技术提供如下技术方案:
[0010]所述一种基于语言处理的鉴伪方法包括以下步骤:
[0011]对样本音频进行预处理,提取样本音频数据,所述样本音频数据包括语言数据、发声人信息数据和音频基础数据;
[0012]构建语言分析模型,对发声人信息数据和语言数据进行分析处理,根据分析结果生成第一匹配目标;
[0013]通过互联网分析模型进行发声人工作信息数据的调取,并根据发声人工作信息数据的调取进行信息匹配,根据匹配结果进行分析生成第二匹配标识;
[0014]将第一匹配目标和第二匹配目标进行组合处理,生成第一分析标识;
[0015]对音频基础数据进行分析处理,生成第一数据处理目标、第二数据处理目标和第三数据处理目标;
[0016]对所述第一数据处理目标、第二数据处理目标和第三数据处理目标进行整合分析,生成第二分析标识;
[0017]将样本音频中的第一分析标识与第二分析标识进行整合分析,根据分析结果对样本音频进行音频鉴定结果的生成。
[0018]在一个优选的实施方式中,所述语言数据为音频中人声体现出来的发音特色和语言风格,可以根据该信息进行人声户籍的信息匹配;
[0019]所述发声人信息数据为发声人实际户籍所在地数据;
[0020]所述音频基础数据包括音调变化数值,音高与语速,所述音调变化数值是指音频中语音的音调在一段时间内发生的变化的数值表示;所述音高是指音频中声音的音调高低,表示声音振动的频率,音高越高,频率越高,声音越高音,音调变化数值可以用来分析说话者在说话过程中声音的音高变化情况;所述语速是指音频中说话者说话的速度,通常用音节数或每分钟的单词数量来表示,所述语速可以用来了解说话者的说话节奏、语言流畅性等特征。
[0021]在一个优选的实施方式中,所述第一匹配目标包括第一真实匹配目标和第一伪造匹配目标,生成第一匹配目标的步骤为:
[0022]所述发声人信息数据具体为实际户籍所在地N;
[0023]构建语言分析模型,输入实际户籍所在地信息N,并对获取的语言数据进行分析处理,设语言数据特征提取出实际口音n,通过语言分析模型对实际口音n进行户籍匹配输出为匹配户籍所在地n,将匹配户籍所在地n与实际户籍所在地N进行联合分析;
[0024]若匹配户籍所在地n与实际户籍所在地N相符,对该样本音频生成第一真实匹配目标;
[0025]若匹配户籍所在地n与实际户籍所在地N不符,对该样本音频生成第一伪造匹配目标;
[0026]所述语言分析模型的构建步骤为:
[0027]数据采集:收集大量音频样本,包括实际口音1、实际口音2、实际口音3......实际口音n以及匹配户籍1、匹配户籍2、匹配户籍3......匹配户籍n的音频数据;
[0028]特征提取:从每个音频中提取口音和声色数据的特征,并将其转换为特征向量。技术手段:音频信号处理算法、声学特征提取算法;
[0029]建立特征库:将实际口音和匹配户籍的特征向量分别存储在特征库中;
[0030]户籍匹配:对于样本音频,提取其口音和声色特征,然后将其与特征库中的数据进行匹配,通过计算样本音频特征向量与特征库中特征向量的相似度,找出最相似的几个特征向量;
[0031]分析结果:根据匹配的结果,得到样本音频与哪些匹配户籍的口音和声色数据最相似,从而推断出可能的户籍信息;
[0032]验证和优化:对模型进行验证,检查模型的准确性和可靠性,根据实际情况,可能需要对模型进行优化,调整特征提取方法、匹配算法等,以提高模型的性能;
[0033]应用:将优化后的模型应用于实际音频数据,进行户籍匹配和分析,根据模型输出的结果,可以对音频的真伪和来源进行进一步判断和分析。
[0034]在一个优选的实施方式中,所述第二匹配目标包括第二真实匹配目标和第二伪造匹配目标,生成第二匹配目标的步骤为:
[0035]所述发声人工作数据包括工作档案和缴纳社保单位,互联网分析模型调取发声人
工作信息参数并进行数据匹配,进行工作所在地的分析和匹配,互联网分析模型根据这些参数,对发声人的工作信息进行特征提取和匹配分析,从特征库中找出与之相似的工作所在地信息,根据匹配的结果,得出工作所在地m;
[0036]将工作所在地m与上述匹配户籍所在地n进行组合分析;
[0037]若工作所在地m与上述匹配户籍所在地n相符,则生成第二真实匹配目标;
[0038]若工作所在地m与上述匹配户籍所在地n不符,则生成第二伪造匹配目标。
[0039]构建所述互联网分析模型的具体步骤为:
[0040]数据采集:从互联网平台和相关数据源获取发声人的工作信息数据,包括缴纳社保单位和工作档案等;
[0041]数据预处理:对采集到的数据进行清洗和整理,确保数据的准确性和一致性;
[0042]特征提取:从发声人的工作信息数据中提取特征,例如工作所在地信息,将其转换为特征向量;
[0043]建立特征库:将提取到的特征向量存储在特征库中,与每个发声人的身份信息关联;
[0044]匹配分析:对于待检测的发声人工作信息数据,提取其特征向量,然后将其与特征库中的数据进行匹配分析。通过计算待检测数据特征向量与特征库中特征向量的相似度,找出最相似的几个特征向量,即与工作所在地1、工作所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语言处理的鉴伪方法,其特征在于,所述方法包括以下步骤:对样本音频进行预处理,提取样本音频数据,所述样本音频数据包括语言数据、发声人信息数据和音频基础数据;构建语言分析模型,对发声人信息数据和语言数据进行分析处理,根据分析结果生成第一匹配目标;通过互联网分析模型进行发声人工作信息数据的调取,并根据发声人工作信息数据的调取进行信息匹配,根据匹配结果进行分析生成第二匹配标识;将第一匹配目标和第二匹配目标进行组合处理,生成第一分析标识;对音频基础数据进行分析处理,生成第一数据处理目标、第二数据处理目标和第三数据处理目标;对所述第一数据处理目标、第二数据处理目标和第三数据处理目标进行整合分析,生成第二分析标识;将样本音频中的第一分析标识与第二分析标识进行整合分析,根据分析结果对样本音频进行音频鉴定结果的生成。2.根据权利要求1所述的一种基于语言处理的鉴伪方法,其特征在于,所述语言数据为音频中人声体现出来的发音特色和语言风格,可以根据该信息进行人声户籍的信息匹配;所述发声人信息数据为发声人实际户籍所在地数据;所述音频基础数据包括音调变化数值,音高与语速,所述音调变化数值是指音频中语音的音调在一段时间内发生的变化的数值表示;所述音高是指音频中声音的音调高低,表示声音振动的频率,音高越高,频率越高,声音越高音,音调变化数值可以用来分析说话者在说话过程中声音的音高变化情况;所述语速是指音频中说话者说话的速度,通常用音节数或每分钟的单词数量来表示,所述语速可以用来了解说话者的说话节奏、语言流畅性等特征。3.根据权利要求2所述的一种基于语言处理的鉴伪方法,其特征在于,所述第一匹配目标包括第一真实匹配目标和第一伪造匹配目标,生成第一匹配目标的步骤为:所述发声人信息数据具体为实际户籍所在地N;构建语言分析模型,输入实际户籍所在地信息N,并对获取的语言数据进行分析处理,设语言数据特征提取出实际口音n,通过语言分析模型对实际口音n进行户籍匹配输出为匹配户籍所在地n,将匹配户籍所在地n与实际户籍所在地N进行联合分析;若匹配户籍所在地n与实际户籍所在地N相符,对该样本音频生成第一真实匹配目标;若匹配户籍所在地n与实际户籍所在地N不符,对该样本音频生成第一伪造匹配目标;所述语言分析模型的构建步骤为:数据采集:收集大量音频样本,包括实际口音1、实际口音2、实际口音3......实际口音n以及匹配户籍1、匹配户籍2、匹配户籍3......匹配户籍n的音频数据;特征提取:从每个音频中提取口音和声色数据的特征,并将其转换为特征向量。技术手段:音频信号处理算法、声学特征提取算法;建立特征库:将实际口音和匹配户籍的特征向量分别存储在特征库中;户籍匹配:对于样本音频,提取其口音和声色特征,然后将其与特征库中的数据进行匹配,通过计算样本音频特征向量与特征库中特征向量的相似度,找出最相似的几个特征向
量;分析结果:根据匹配的结果,得到样本音频与哪些匹配户籍的口音和声色数据最相似,从而推断出可能的户籍信息;验证和优化:对模型进行验证,检查模型的准确性和可靠性,根据实际情况,可能需要对模型进行优化,调整特征提取方法、匹配算法等,以提高模型的性能;应用:将优化后的模型应用于实际音频数据,进行户籍匹配和分析,根据模型输出的结果,可以对音频的真伪和来源进行进一步判断和分析。4.根据权利要求3所述的一种基于语言处理的鉴伪方法,其特征在于,所述第二匹配目标包括第二真实匹配目标和第二伪造匹配目标,生成第二匹配目标的步骤为:所述发声人工作数据包括工作档案和缴纳社保单位,互联网分析模型调取发声人工作信息参数并进行数据匹配,进行工作所在地的分析和匹配,互联网分析模型根据这些参数,对发声人的工作信息进行特征提取和匹配分析,从特征库中找出与之相似的工作所在地信息,根据匹配的结果,得出工作所在地m;将工作所在地m与上述匹配户籍所在地n进行组合分析;若工作所在地m与上述匹配户籍所在地n相符,则生成第二真实匹配目标;若工作所在地m与上述匹配户籍所在地n不符,则生成第二伪造匹配目标。构建所述互联网分析模型的具体步骤为:数据采集:从互联网平台和相关数据源获取发声人的工作信息数据,包括缴纳社保单位和工作档案等;数据预处理:对采集到的数据进行清洗和整理,确保数据的准确性和一致性;特征提取:从发声人的工作信息数据中提取特征,例如工作所在地信息,将其转换为特征向量;建立特征库:将提取...

【专利技术属性】
技术研发人员:郑威云剑凌霞郑晓玲周凡棣海涵辛鑫刘澎
申请(专利权)人:中国信息通信研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1