一种基于电力领域本体知识的语音识别系统技术方案

技术编号:37352599 阅读:21 留言:0更新日期:2023-04-27 07:03
本发明专利技术公开了一种基于电力领域本体知识的语音识别系统,包括:语音采集模块、电力领域本体知识仓库、语音识别模块、识别结果校验模块、电力领域应用模块、训练集补充模块,其中语音采集模块用于采集来自用户端的音频数据,对所述音频数据进行校验、矫正,输出待识别音频数据,语音识别模块获取待识别音频数据,通过语音识别纠错模型进行语音识别处理,输出识别结果。根据上述技术方案,可以将现有电力系统的基本积累与机器学习紧密结合,使用现场生产环境的数据对训练模型不断优化,提高语音识别系统的准确度,打造更加高效、便捷的客户服务管理体系。管理体系。管理体系。

【技术实现步骤摘要】
一种基于电力领域本体知识的语音识别系统


[0001]本专利技术涉及语音识别
,具体而言,涉及一种基于电力领域本体知识的语音识别系统。

技术介绍

[0002]在电力领域,各省电网系统主要的客户诉求途径仍以人工话务为主,即用户通过拨打特服号,通过固定按键流程或者提交语音需求以咨询用电业务信息或申报用电诉求。采用固定按键流程的方式,受业务按键层级深度、引导语播放时间等因素影响,导致处理过程时间长、用户感受差;而在对语音需求的处理中,受部分用户的口语化、本地化发音等因素影响,机器人的语音识别会受到一定限制,导致对用户诉求识别错误,既未解决用户问题,也占用了系统的资源;因此,诸多客户会跳过前期分流引导,直接选择进入人工接听流程,给客服人员、系统资源增加了额外的压力;特别在诉求高峰期、雨雪冰灾、大面积停电等特殊情况,可能引起用户通话拥塞、话务资源严重不足,而使用户长时间的接听等待,严重时给电网公司带来重大风险甚至巨大损失。
[0003]因此,需要一种语音识别方案应用于电力领域的应用系统,可以基于现有电力系统的基础设施,对现有资源进行升级和改造,以克服常用语音识别中的一词多义、口音化、识别准确的问题,实现快速准确定位用户需求的目标,提高电力系统资源的应用效率,降低电网的管理风险。

技术实现思路

[0004]本专利技术的主要目的在于公开一种基于电力领域本体知识的语音识别系统,包括:
[0005]语音采集模块:用于采集来自用户端的音频数据,对音频数据进行校验、矫正,输出待识别音频数据;
[0006]电力领域本体知识仓库:用于提供电力领域专有词汇信息,专有词汇内30容包括特征单字、特征短词、特征长词、常用词;专有词汇信息的属性包括:
[0007]文本特征、需求特征;专有词汇信息通过专有词汇特征关联模型存储内容和属性,并建立相互关联;
[0008]进一步的,专有词汇特征关联模型支持的专有词汇内容还包括:连接词、常用词。
[0009]专有词汇特征关联模型支持的专有词汇关联方式包括:字词延伸关系、词义延伸关系、语法延伸关系,还支持自定义词汇关联方式。
[0010]语音识别模块:用于获取待识别音频数据,通过语音识别纠错模型进行语音识别处理,输出识别结果,并优化语音识别纠错模型;
[0011]识别结果校验模块:用于结合电力领域本体知识仓库,校验识别结果是40否符合电力领域应用要求,并输出校验结果;校验结果包括样本补充训练请求;
[0012][0013]电力领域应用模块:用于根据识别结果,实现用户需求,获取用户需求
[0014]处理结果;
[0015]训练集补充模块:获取补充训练请求,进行训练集补充处理。
[0016]其中,语音识别模块采用Baum

Welch算法进行语音识别纠错模型改进,
[0017]采用音素评分子模块生成音素评分结果,作为纠错判断标准。
[0018]其中,语音识别模块通过所述音素评分结果,比较待识别音频数据的语音和标准语音的差异程度,用于计算整句识别的准确概率值。
[0019]进一步的,语音采集模块采用MFCC特征从音频数据提取用户语音特征,50设置三角滤波器对音频信号幅度加权运算,生成待识别音频数据。
[0020]进一步的,识别校验模块根据专有词汇特征关联模型进行校验的顺序为:
[0021]整句校验、长词校验、短词校验、单字校验。
[0022]进一步的,训练集补充模块获取来自识别校验模块的样本补充训练请求,生成训练集,向语音识别模块发送语音识别训练样本。
[0023]训练集补充模块还获取来自电力领域应用模块发送的补充训练请求;其
[0024]中,电力领域应用模块根据用户需求处理结果判断获取的识别结果是否与电力领域应用匹配,如果不匹配,生成所述补充训练请求。
[0025]根据本专利技术,可以将现有电力系统的基本积累与机器学习紧密结合,使
[0026]用现场生产环境的数据对训练模型不断优化,提高语音识别系统的准确度,60打造更加高效、便捷的客户服务管理体系,实现客户信息、客户需求的精准
[0027]掌握,提升用户感受,推动客户服务向智能化方向发展。
附图说明
[0028]图1是根据本专利技术实施例提供的语音识别系统结构图;
[0029]图2是根据本专利技术实施例提供的语音识别系统功能实现示意图;
[0030]图3是根据本专利技术实施例提供的专有词汇特征关联模型示意图。
具体实施方式
[0031]本专利技术的应用环境主要为电力领域应用系统,例如客服系统,通过本70专利技术的方案,采集来自用户终端的语音信息需求,结合对电力领域本体知
[0032]识的积累,对语音需求信息进行加工、分析,最终有效获取用户的实际需求;同时,对系统使用过程中产生的数据进行分析,提取有训练价值的语音数据进行训练样本的补充,不断完善和优化语音识别的训练模型,在生产环境中不断提升识别系统的准确性。
[0033]下面结合说明书附图对本专利技术的具体实现方式做详细描述:
[0034]图1是本专利技术实施例提供的语音识别系统结构图,图2提供了在本专利技术实施例中的功能实现过程。
[0035]如图1所示,本申请的系统包括以下结构模块:
[0036]P100语音采集模块:用于采集来自用户端的音频数据,对音频数据进行80校验、矫正,输出待识别音频数据;
[0037]语音采集模块对音频数据进行矫正采用了MFCC算法,从音频数据提取用户语音特征,在语音范围内设置若干个三角滤波器,三角滤波器相互交迭,取每个三角滤波器中所有
频率信号幅度加权运算,形成语音输出。
[0038]在图2中可见,执行语音采集后,即可以进入下一步语音识别的处理。85而电力领域语音识别的处理,需要电力领域本体知识仓库提供支撑。
[0039]P110电力领域本体知识仓库:用于存储电力领域专有词汇信息。
[0040]专有词汇内容包括特征单字、特征短词、特征长词、常用词;
[0041]专有词汇信息的属性包括:专有词汇的文本特征、需求特征;
[0042]本申请的应用场景为电力领域的语音系统,用户的需求通过语音方式进90行传递,因此本申请中,对语音信息入库时,可直接定义需要系统处理的需
[0043]求,针对这一特点,本申请中对专有词汇信息定义的属性至少包括两部分:
[0044]文本特征:即文本内容;
[0045]需求特征:该文本内容对应的处理需求的操作编码。
[0046]操作编码是电力领域应用模块为识别需求、响应需求、确定处理方式而95定义的协议,例如,为“查询用户数据”、“查询资讯”、“转人工服务”[0047]定义不同的操作编码,当电力领域应用模块识别出符合规范的编码时,执行相应的处理。
[0048]例如:“查询资讯”对应的操作编码为“MSG”,“电价改革”对应的操作编码可定义为“INFO0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于电力领域本体知识的语音识别系统,其特征在于,包括:语音采集模块:用于采集来自用户端的音频数据,对所述音频数据进行校验、矫正,输出待识别音频数据;电力领域本体知识仓库:用于提供电力领域专有词汇信息,所述专有词汇内容包括特征单字、特征短词、特征长词、常用词;所述专有词汇信息的属性包括:文本特征、需求特征;所述专有词汇信息通过专有词汇特征关联模型存储内容和属性,并建立相互关联;语音识别模块:用于获取所述待识别音频数据,通过语音识别纠错模型进行语音识别处理,输出识别结果,并优化语音识别纠错模型;识别结果校验模块:用于结合所述电力领域本体知识仓库,校验所述识别结果是否符合电力领域应用要求,输出校验结果,所述校验结果包括样本补充训练请求;电力领域应用模块:用于根据识别结果,实现用户需求,获取用户需求处理结果;训练集补充模块:获取补充训练请求,进行训练集补充处理。2.根据权利要求1所述的语音识别系统,其特征在于,所述语音识别模块采用Baum

Welch算法进行语音识别纠错模型改进,采用音素评分子模块生成音素评分结果,作为纠错判断标准。3.根据权利要求2所述的语音识别系统,其特征在于,所述语音识别模块通过所述音素评分结果,比较所述待识别音频数据的语音和标准语音的差异程度,...

【专利技术属性】
技术研发人员:农惠清王凯申双喜杨倩黄蔚吴婷袁小惠宁立声江洁谢佩吴伟伟郑毅李金灿陶镇威李娟娟
申请(专利权)人:广西电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1