语音内容实际语义识别方法、装置、设备及介质制造方法及图纸

技术编号:46590140 阅读:1 留言:0更新日期:2025-10-10 21:24
本发明专利技术涉及智能决策技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种语音内容实际语义识别方法、装置、设备及介质,方法包括:获取目标交互语音,对目标交互语音进行谐波噪声比增强,得到增强目标交互语音;对增强目标交互语音进行分帧处理,得到语音帧序列,提取语音帧序列对应的频谱熵序列;对频谱熵序列进行注意力加权计算,得到目标交互语音的声纹特征,根据声纹特征计算声纹实际语义;识别目标交互语音中的语义关键词,根据语义关键词计算逻辑实际语义;对声纹实际语义以及逻辑实际语义进行实际语义融合,得到目标交互语音的内容实际语义。本发明专利技术提高了语音内容实际语义识别的准确度以及及时性。

【技术实现步骤摘要】

本专利技术涉及智能决策,尤其涉及一种语音内容实际语义识别方法、装置、设备及介质


技术介绍

1、语音内容识别(voice content recognition,vcr)是指利用自动语音识别技术,把人类语音实时或离线地转化为文字的过程,通过识别的语音内容可以对语音信号中的实际语义进行分析、判断。

2、在医疗健康领域中,通过识别语音内容的实际语义,可以分析远程医疗中,医生与患者的语音沟通(如电话问诊、视频问诊的语音片段)是否符合诊疗规范,从而识别违规行为;在金融领域中可以用于监测可疑交易相关沟通,辅助识别洗钱、欺诈融资等风险,识别交易背后的主观意图。

3、现有的语义识别只通过匹配语音转文本后的关键词或设定固定数值标准判断语音内容的实际语义,而忽略了声学特征中的异常模式(如刻意放缓语速、异常停顿),且语音中的声学特征仅用于身份认证,未与具体的语音内容关联。导致现有技术仅聚焦文本关键词或基础声学参数(如音量、语速),特征捕捉不全面;同时静态规则无法识别话术的动态模式,同时现有技术多依赖 “云端集中处理”模式(语音数据上传至云端→文本识别→本文档来自技高网...

【技术保护点】

1.一种语音内容实际语义识别方法,其特征在于,所述方法包括:

2.如权利要求1所述的语音内容实际语义识别方法,其特征在于,所述对所述目标交互语音进行谐波噪声比增强,得到增强目标交互语音,包括:

3.如权利要求1所述的语音内容实际语义识别方法,其特征在于,所述提取所述语音帧序列对应的频谱熵序列,包括:

4.如权利要求1所述的语音内容实际语义识别方法,其特征在于,所述对所述频谱熵序列进行注意力加权计算,得到所述目标交互语音的声纹特征,包括:

5.如权利要求1所述的语音内容实际语义识别方法,其特征在于,所述识别所述目标交互语音中的语义关键词,包括...

【技术特征摘要】

1.一种语音内容实际语义识别方法,其特征在于,所述方法包括:

2.如权利要求1所述的语音内容实际语义识别方法,其特征在于,所述对所述目标交互语音进行谐波噪声比增强,得到增强目标交互语音,包括:

3.如权利要求1所述的语音内容实际语义识别方法,其特征在于,所述提取所述语音帧序列对应的频谱熵序列,包括:

4.如权利要求1所述的语音内容实际语义识别方法,其特征在于,所述对所述频谱熵序列进行注意力加权计算,得到所述目标交互语音的声纹特征,包括:

5.如权利要求1所述的语音内容实际语义识别方法,其特征在于,所述识别所述目标交互语音中的语义关键词,包括:

<...

【专利技术属性】
技术研发人员:刘源彭俊清
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1