【技术实现步骤摘要】
基于语音分析的敏感内容识别方法、装置、终端及介质
本专利技术涉及人工智能
,尤其涉及一种基于语音分析的敏感内容识别方法、装置、终端及介质。
技术介绍
人工智能,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等,而语音识别技术在人工智能中尤为重要。目前,敏感词的语音识别技术主要基于建立的语音敏感词语语料库,用匹配分析的方式对敏感词进行识别,由于敏感词单一,缺乏根据不同的应用场景,搭建对应的敏感词模型,敏感内容识别不够准确。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供了一种基于语音分析的敏感内容识别方法、装置、终端及介质,旨在解决现有技术对敏感内容识别不够准确的技术问题。为实现上述目的,本专利技术提供了一种基于语音分析的敏感内容识别方法,包括:终端获取待测音频片段和当前语音场 ...
【技术保护点】
1.一种基于语音分析的敏感内容识别方法,其特征在于,包括:终端获取待测音频片段和当前语音场景,并获得所述待测音频片段中的每个语音帧的语音特征向量;根据预先建立的前馈型序列记忆网络模型,将所述语音特征向量作为输入,获得与所述语音特征向量对应的语义文本;确定与所述当前语音场景对应的敏感信息库;根据预先建立的双向神经网络模型以及确定的所述敏感信息库,确定所述语义文本的敏感指数;在所述敏感指数大于预设敏感阀值时,将所述待测音频片段标记为敏感内容。
【技术特征摘要】
1.一种基于语音分析的敏感内容识别方法,其特征在于,包括:终端获取待测音频片段和当前语音场景,并获得所述待测音频片段中的每个语音帧的语音特征向量;根据预先建立的前馈型序列记忆网络模型,将所述语音特征向量作为输入,获得与所述语音特征向量对应的语义文本;确定与所述当前语音场景对应的敏感信息库;根据预先建立的双向神经网络模型以及确定的所述敏感信息库,确定所述语义文本的敏感指数;在所述敏感指数大于预设敏感阀值时,将所述待测音频片段标记为敏感内容。2.如权利要求1所述的基于语音分析的敏感内容识别方法,其特征在于,所述获取待测音频片段和当前语音场景,并获得所述待测音频片段中的每个语音帧的语音特征向量的步骤之前,还包括:建立前馈型序列记忆网络模型,所述前馈型序列记忆网络模型的隐层连接有反馈连接块,以存储历史信息和未来信息。3.如权利要求2所述的基于语音分析的敏感内容识别方法,其特征在于,所述根据预先建立的前馈型序列记忆网络模型,将所述语音特征向量作为输入,获得与所述语音特征向量对应的语义文本的步骤,具体为:根据预先建立的前馈型序列记忆网络模型,将所述语音特征向量采用拼接帧作为输入,获得与所述语音特征向量对应的语义文本。4.如权利要求1所述的基于语音分析的敏感内容识别方法,其特征在于,所述根据预先建立的双向神经网络模型以及确定的敏感信息库,确定所述语义文本的敏感指数的步骤,具体包括:将所述语义文本作为第一输入语句、所述敏感信息库中的一条敏感语句作为第二输入语句,对所述第一输入语句和第二输入语句进行预处理;将预处理后的第一输入语句和第二输入语句分别作为双向神经网络模型的输入,分别得到第一输出和第二输出;比对第一输出和第二输出的相似度,以得到所述语义文本与所述敏感语句的相似度值;确定所述敏感信息库中与所述语义文本相似度值最高的敏感语句,将最高的所述相似度值作为敏感指数。5.如权利要求1所述的基于语音分析的敏感内容识别方法,其特征在于,所述获取待测音频片段和当前语音场景,并获得所述待测音频片段中的每个语音帧的语音特征...
【专利技术属性】
技术研发人员:刘轲,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。