一种基于人工智能的自动化本地消防语音识别方法及装置制造方法及图纸

技术编号:39791306 阅读:9 留言:0更新日期:2023-12-22 02:28
本发明专利技术涉及人工智能那个技术领域,为一种基于人工智能的自动化本地消防语音识别方法及装置

【技术实现步骤摘要】
一种基于人工智能的自动化本地消防语音识别方法及装置


[0001]本专利技术涉及人工智能那个
,为一种基于人工智能的自动化本地消防语音识别方法及装置


技术介绍

[0002]为了适应当前信息化

智能化时代下的接处警需求,消防智能接处警系统中运用自然语言处理技术,根据接处警数据,实现对警情信息中的关键信息,包括:警情来源

警情地址

警情类型

警情类别

警情描述

燃烧对象

建筑结构

楼层层数

燃烧层数

人员被困数量

警情位置

报警电话等要素

与信息检索技术

大数据等技术相结合,有利于消防人员快速定位有用案情,提升消防部门快速响应能力与作战能力

提升应急管理基础能力和水平以增强城市韧性,是新时期城市安全的重大需求

[0003]在现有技术中针对于自动化接警系统中存在以下不足:
(1) 现有接处警系统警情信息录入

调度资源分配不合理

救援资源利用不充分

力量调派效率偏低,目前仅能手动录入

人工选择力量,消防接警员可能在高强度接警压力下容易忽视部分警情要素,出现调度失误的情况;
(2) 警情定位信息缺失,受当时技术条件

支撑环境的影响,定位手段单一,部分位置信息仍是系统默认值或与实际位置偏差大,无法保证位置信息的有效

准确,影响处置效率

[0004](3) 接处警人员在高强度作业下,可能会出现关键信息未询问,某些可辅助决策的信息未记录,可调派单位错选等问题,造成救援不及时和救援资源浪费的情况


技术实现思路

[0005]为了解决以上的问题,本申请提供一种基于人工智能的自动化本地消防语音识别方法及装置,采用自然语言处理技术

机器学习等技术运用到消防接处警系统中进行警情信息提取,以提高消防接警人员的工作效率,减小接警人员的工作压力

[0006]为了达到上述目的,本申请实施例采用的技术方案如下:第一方面,提供一种基于人工智能的自动化本地消防语音识别方法,应用于服务器,所述方法包括:将实时获取的报警语音信息输入至语音识别模型,所述语音识别模型对所述报警语音信息进行语音特征处理得到以帧为单位的语音序列,并将所述语音序列进行编解码处理,得到与所述语音序列呈映射关系的文本序列,所述文本序列为待处理的文本信息;将所述文本信息输入至警情识别模型,对所述文本信息中的警情要素进行提取,得到警情的多个实体信息,将多个所述实体信息进行组合得到目标报警信息

[0007]进一步的,所述语音识别模型包括前置处理模块

编解码器和混合注意力模块;所述前置处理模块包括声学前置子模块和文本前置子模块,所述声学前置子模块用于将所述报警语音信息进行语音特征处理得到以帧为单位的语音序列,所述语音序列由多个语音特征组成,所述文本前置子模块用于将所述语音序列进行文本转换得到基于语音序列为尺度
的初始文本序列;所述编解码器包括编码器和解码器,所述编码器用于将所述语音序列中的多个语音特征进行映射处理,所述解码器用于将所述初始文本序列联合经过注意力调节的隐藏状态解码生成目标文本特征,并基于序列为尺度生成目标文本序列

[0008]进一步的,所述声学前置子模块包括多个二维卷积模块和位置编码器模块,所述卷积模块中包含一个二维卷积层,一个
ReLU
激活层;所述二维卷积模块用于提取声学特征,所述位置编码器用于获取所述声学特征的绝对位置信息

[0009]进一步的,所述文本前置子模块包括多个时间卷积网络

位置编码器模块和嵌入层,所述时间卷积网络中包括一个一维卷积层,一个
ReLU
激活层

[0010]进一步的,所述编码器和所述解码器由相同的模块堆叠组成,每个模块包括两个子层结构,所述子层结构分别为多头注意力层和前馈网络层,在每个所述子层结构后都使用残差网络连接和层归一化

[0011]进一步的,所述解码器中的多头注意力层包括第一多头注意力层和第二多头注意力层,所述第一多头注意力层基于多头注意力机制构建,所述第二多头注意力层基于跨越注意力机制构建

[0012]进一步的,所述警情识别模型包括特征提取层

语义编码层和解码层,所述特征提取层将所述文本序列进行处理得到对应的融合通用领域内的语义信息后的词表征向量表示,所述语义编码层基于所述词表征向量表示进行编码得到句子语义编码,所述解码层用于对所述句子语义编码进行解码并依据标签之间的合理性关系得到最优的标记序列

[0013]进一步的,所述特征提取层为
ALBERT
模型

[0014]进一步的,所述语义编码层包括多个相互连接的
Bi

LSTM
模块,所述
Bi

LSTM
模块包括前向
LSTM
层和后向
LSTM
层,所述前向
LSTM
层和后向
LSTM
层隐含层都连接到同一个输出层,通过前向
LSTM
层和后向
LSTM
层得到拼接后的字向量;所述解码层为
CRF
层,用于获取所述字向量的最优标签序列

[0015]第二方面,提供一种基于人工智能的自动化本地消防语音识别装置,所述装置包括:文本信息获取模块,用于将实时获取的报警语音信息输入至语音识别模型中进行文本转换得到文本信息;报警信息获取模块,用于将所述文本信息输入至警情识别模型对所述文本信息中的警情要素进行提取,得到警情的多个实体信息,将多个所述实体信息进行组合得到目标报警信息

[0016]第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法

[0017]本申请实施例提供的技术方案中,通过对实时报警语音信息流进行端对端的语音转换得到文本信息,并针对文本信息中的警情要素进行提取并组合得到最终的报警信息

附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于人工智能的自动化本地消防语音识别方法,其特征在于,应用于服务器,所述方法包括:将实时获取的报警语音信息输入至语音识别模型,所述语音识别模型对所述报警语音信息进行语音特征处理得到以帧为单位的语音序列,并将所述语音序列进行编解码处理,得到与所述语音序列呈映射关系的文本序列,所述文本序列为待处理的文本信息;将所述文本信息输入至警情识别模型,对所述文本信息中的警情要素进行提取,得到警情的多个实体信息,将多个所述实体信息进行组合得到目标报警信息
。2.
根据权利要求1所述的基于人工智能的自动化本地消防语音识别方法,其特征在于,所述语音识别模型包括前置处理模块

编解码器和混合注意力模块;所述前置处理模块包括声学前置子模块和文本前置子模块,所述声学前置子模块用于将所述报警语音信息进行语音特征处理得到以帧为单位的语音序列,所述语音序列由多个语音特征组成,所述文本前置子模块用于将所述语音序列进行文本转换得到基于语音序列为尺度的初始文本序列;所述编解码器包括编码器和解码器,所述编码器用于将所述语音序列中的多个语音特征进行映射处理,所述解码器用于将所述初始文本序列联合经过注意力调节的隐藏状态解码生成目标文本特征,并基于序列为尺度生成目标文本序列
。3.
根据权利要求2所述的基于人工智能的自动化本地消防语音识别方法,其特征在于,所述声学前置子模块包括多个二维卷积模块和位置编码器模块,所述卷积模块中包含一个二维卷积层,一个
ReLU
激活层;所述二维卷积模块用于提取声学特征,所述位置编码器用于获取所述声学特征的绝对位置信息
。4.
根据权利要求3所述的基于人工智能的自动化本地消防语音识别方法,其特征在于,所述文本前置子模块包括多个时间卷积网络

位置编码器模块和嵌入层,所述时间卷积网络中包括一个一维卷积层,一个
ReLU
激活层
。5.
根据权利要求2所述的基于人工智能的自动化本地消防语音识别方法,其特征在于,所述编码器和所述解码器由相同的模块堆叠组成,每个模块包括两个子层结构,所述子层结构分别为多头注意力层和前馈网络层,在每个所述子层结构后都...

【专利技术属性】
技术研发人员:钟波蓝聪曹冰兵郑建波李成富周育玺薛俊张良
申请(专利权)人:成都大成均图科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1