一种电力业扩工程处理方法及装置制造方法及图纸

技术编号:33090357 阅读:63 留言:0更新日期:2022-04-15 11:02
本发明专利技术提供一种电力业扩工程处理方法及装置,该方法包括:获取待处理语音,并将所述待处理语音输入声学模型,输出所述目标语音对应的预识别文本;基于连续词袋模型对所述预识别文本进行上下文关联分析,得到目标文本;基于所述目标文本,执行电力业扩工程业务。通过声学模型有效识别待处理语音,采用采用语言识别输入替代手工信息录入,然后通过对识别的文本进行上下文关联分析,消除单个语言片段识别错误,形成机器能理解的语言文本,并将文本信息自动录入电力业扩移动应用,从而执行电力业扩工程业务。工程业务。工程业务。

【技术实现步骤摘要】
一种电力业扩工程处理方法及装置


[0001]本专利技术涉及信息处理
,尤其涉及一种电力业扩工程处理方法及装置。

技术介绍

[0002]随着技术的不断发展,在电力业扩工程中已经可以通过电子设备进行手动输入,从而实现工程作业内容。
[0003]但是通过手动输入大量的现场勘查信息等内容,输入效率很低,且在户外作业时,经常不能很方便的通过手动输入内容。
[0004]因此如何更好的实现电力业扩工程处理,已经成为业界亟待解决的问题。

技术实现思路

[0005]本专利技术提供一种电力业扩工程处理方法及装置,用以解决现有技术中更好的实现电力业扩工程处理的问题。
[0006]本专利技术提供一种电力业扩工程处理方法,包括:
[0007]获取待处理语音,并将所述待处理语音输入声学模型,输出所述目标语音对应的预识别文本;
[0008]基于连续词袋模型对所述预识别文本进行上下文关联分析,得到目标文本;
[0009]基于所述目标文本,执行电力业扩工程业务。
[0010]根据本专利技术提供的一种电力业扩工程处理方法,所述基于连续词袋模型对所述预识别文本进行上下文关联分析,得到目标文本,包括:
[0011]将所述预识别文本输入所述连续词袋模型,得到所述待识别文本的中心词;
[0012]基于所述中心词,消除所述待识别文本中的单个语言片段识别错误,得到目标文本。
[0013]根据本专利技术提供的一种电力业扩工程处理方法,在所述获取待处理语音,并将所述待处理语音输入声学模型,输出所述目标语音对应的预识别文本之前,还包括:
[0014]获取多个语音样本和每个所述语音样本的文本标签;
[0015]将每个所述语音样本和所述语音样本对应的文本标签作为一组训练样本,获取多个训练样本;
[0016]利用多个训练样本对预设神经网络进行训练。
[0017]根据本专利技术提供的一种电力业扩工程处理方法,所述利用多个训练样本对预设神经网络进行训练,包括:
[0018]对于任意一个训练样本,将所述训练样本输入至预设神经网络,输入所述训练样本对应的文本识别结果;
[0019]利用预设损失函数,根据所述训练样本对应的文本标签和所述文本识别结果计算损失值;
[0020]若所述损失值小于预设阈值,则所述预设神经网络训练完成,得到所述声学模型;
[0021]所述预设神经网络为DNN

HMM声学模型;
[0022]其中,所述DNN

HMM声学模型包括一个输入层和四个隐藏层,所述DNN

HMM声学模型中相同层的节点之间不连接,相邻层的界面的节点之间均连接。
[0023]根据本专利技术提供的一种电力业扩工程处理方法,所述基于所述目标文本,执行电力业扩工程业务,包括:
[0024]将所述目标文本录入电力业扩移动应用系统,得到目标文本对应的目标指令;
[0025]执行所述目标指令。
[0026]本专利技术还提供一种电力业扩工程处理装置,包括:
[0027]输出模块,用于获取待处理语音,并将所述待处理语音输入声学模型,输出所述目标语音对应的预识别文本;
[0028]分析模块,用于基于连续词袋模型对所述预识别文本进行上下文关联分析,得到目标文本;
[0029]执行模块,用于基于所述目标文本,执行电力业扩工程业务。
[0030]根据本专利技术提供的一种电力业扩工程处理装置,所述分析模块,具体用于:
[0031]将所述预识别文本输入所述连续词袋模型,得到所述待识别文本的中心词;
[0032]基于所述中心词,消除所述待识别文本中的单个语言片段识别错误,得到目标文本。
[0033]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述电力业扩工程处理方法的步骤。
[0034]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述电力业扩工程处理方法的步骤。
[0035]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述电力业扩工程处理方法的步骤。
[0036]本专利技术提供的一种电力业扩工程处理方法及装置,通过声学模型有效识别待处理语音,采用采用语言识别输入替代手工信息录入,然后通过对识别的文本进行上下文关联分析,消除单个语言片段识别错误,形成机器能理解的语言文本,并将文本信息自动录入电力业扩移动应用,从而执行电力业扩工程业务。
附图说明
[0037]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1是本专利技术实施例提供的电力业扩工程处理方法流程示意图;
[0039]图2为本申请实施例提供的模型结构示意图;
[0040]图3为本申请实施例提供的处理电力业扩工程应用的流程图;
[0041]图4为本申请实施例提供的电力业扩工程处理装置结构示意图;
[0042]图5示例了一种电子设备的实体结构示意图。
具体实施方式
[0043]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0044]图1是本专利技术实施例提供的电力业扩工程处理方法流程示意图,如图1所示,包括:
[0045]步骤110,获取待处理语音,并将所述待处理语音输入声学模型,输出所述目标语音对应的预识别文本;
[0046]具体地,本申请实施例中所描述的待处理语音具体可是指勘察人员指示的关于电力业扩工程的语音。
[0047]本专利技术实施例中,在获取待处理语音后,会对待处理语音进行预处理,降低语言文件识别难度,再进行语音识别,将待处理语音输入声学模型,输出目标语音对应的预识别文本。
[0048]本申请实施例中所描述的声学模型具体可以是预先经过训练的DNN

HMM声学模型,该模型能够很好的描述语音信号的短时平稳特性。
[0049]步骤120,基于连续词袋模型对所述预识别文本进行上下文关联分析,得到目标文本;
[0050]具体地,本申请实施例中所描述的连续词袋模型利用上下文或周围的单词来预测中心词。其输入为某一个特征词的上下文相关对应的词向量(单词的one

hot编码);输出为这特定的一个词的词向量(单词的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力业扩工程处理方法,其特征在于,包括:获取待处理语音,并将所述待处理语音输入声学模型,输出所述目标语音对应的预识别文本;基于连续词袋模型对所述预识别文本进行上下文关联分析,得到目标文本;基于所述目标文本,执行电力业扩工程业务。2.根据权利要求1所述的电力业扩工程处理方法,其特征在于,所述基于连续词袋模型对所述预识别文本进行上下文关联分析,得到目标文本,包括:将所述预识别文本输入所述连续词袋模型,得到所述待识别文本的中心词;基于所述中心词,消除所述待识别文本中的单个语言片段识别错误,得到目标文本。3.根据权利要求2所述的电力业扩工程处理方法,其特征在于,在所述获取待处理语音,并将所述待处理语音输入声学模型,输出所述目标语音对应的预识别文本之前,还包括:获取多个语音样本和每个所述语音样本的文本标签;将每个所述语音样本和所述语音样本对应的文本标签作为一组训练样本,获取多个训练样本;利用多个训练样本对预设神经网络进行训练。4.根据权利要求3所述的电力业扩工程处理方法,其特征在于,所述利用多个训练样本对预设神经网络进行训练,包括:对于任意一个训练样本,将所述训练样本输入至预设神经网络,输入所述训练样本对应的文本识别结果;利用预设损失函数,根据所述训练样本对应的文本标签和所述文本识别结果计算损失值;若所述损失值小于预设阈值,则所述预设神经网络训练完成,得到所述声学模型;所述预设神经网络为DNN

HMM声学模型;其中,所述DNN

HMM声学模型包括一个输入...

【专利技术属性】
技术研发人员:张靖巩舒赵永红由媛媛周明周永刚蒋志刚徐军
申请(专利权)人:国网安徽省电力有限公司安徽明生恒卓科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1