基于方言背景的语音识别方法及相关设备技术

技术编号:22645727 阅读:38 留言:0更新日期:2019-11-26 17:06
本申请涉及人工智能领域,尤其涉及一种基于方言背景的语音识别方法及相关设备,基于方言背景的语音识别方法包括:采集若干地方的方言信息数据,并按照地域进行分类存储,生成方言信息数据库;获取目标对象的音频数据和方言信息数据库中的方言信息数据,根据目标对象的音频数据和方言信息数据,分析目标对象语音中的方言地理特征;根据目标对象语音中的方言地理特征的分析结果和目标对象提供的籍贯信息以及居住地信息,判断目标对象是否涉嫌籍贯信息和居住地信息的欺诈。本申请有效的对用户的语音进行识别,识别出用户语音中的方言地理特征,从而起到核实用户身份的作用,扩大了欺诈信息的获取维度和分析维度。

Speech recognition method and related equipment based on dialect background

The application relates to the field of artificial intelligence, in particular to a speech recognition method and related equipment based on dialect background. The speech recognition method based on dialect background includes: collecting dialect information data of several places, classifying and storing according to the region, generating dialect information database; acquiring the audio data of the target object and dialect information data in the dialect information database According to the target object's audio data and dialect information data, analyze the dialect geographical features in the target object's voice; according to the analysis results of the dialect geographical features in the target object's voice, the native place information and residence information provided by the target object, judge whether the target object is suspected of fraud in the native place information and residence information. The application effectively recognizes the user's voice, recognizes the dialect geographical features in the user's voice, thus plays the role of verifying the user's identity, and expands the acquisition dimension and analysis dimension of fraud information.

【技术实现步骤摘要】
基于方言背景的语音识别方法及相关设备
本申请涉及人工智能
,尤其涉及一种基于方言背景的语音识别方法及相关设备。
技术介绍
贷款是银行或其他金融机构按一定利率和必须归还等条件出借货币资金的一种信用活动形式。广义的贷款指贷款、贴现、透支等出贷资金的总称。银行通过贷款的方式将所集中的货币和货币资金投放出去,可以满足社会扩大再生产对补充资金的需要,促进经济的发展,同时,银行也可以由此取得贷款利息收入,增加银行自身的积累。然而,贷款安全问题是商业银行面临的首要问题。对于贷款安全问题,目前各个银行普遍开始采用语音识别的方式对贷款人的身份进行核实,以防止贷款过程中的欺诈行为。但是基于方言背景的语音分析还不成熟。由于我国幅员辽阔,各地的方言存在着很大的差异,在进行语音识别时,无法准确的根据用户的语音分析出其方言特征,从而无法对用户的身份进行有效识别。
技术实现思路
有鉴于此,有必要针对各地的方言存在着很大的差异,在进行语音识别时,无法准确的根据用户的语音对用户的身份进行有效识别的问题,提供一种基于方言背景的语音识别方法及相关设备。一种基于方言背景的语音识别方法,包括:采集若干地方的方言信息数据,对所述方言信息数据按照地域进行分类存储,生成方言信息数据库;获取目标对象的音频数据,从所述音频数据中提取多个特征词语的实际发音,将每一所述特征词语的实际发音的声波进行矢量化处理,生成矢量集A;从所述方言信息数据库中提取n个不同地域的方言信息数据,分别从每一地域的方言信息数据中提取与所述特征词语字形相同的词语对应的方言发音,将各所述方言发音矢量化,得到各所述方言发音对应的矢量值,将各所述方言发音对应的矢量值分别进行汇总,生成n个方言矢量集;将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较,得到所述目标对象语音中的方言地理特征,其中,所述方言地理特征包括第一籍贯信息和第一居住地信息;获取所述目标对象提供的户籍信息,所述户籍信息包括第二籍贯信息和第二居住地信息,判断所述方言地理特征和所述户籍信息是否一致。在其中一个可能的实施例中,所述采集若干地方的方言信息数据,对所述方言信息数据按照地域进行分类存储,生成方言信息数据库,包括:通过网络爬虫的方式从现有各网络平台中获取若干地方的所述方言信息数据;将所述方言信息数据按照地域进行分类并打包,生成多个地域的方言信息数据包,对各地域的所述方言信息数据包使用不同的标记符号进行标记;将标记好的所述方言信息数据包存储于不同的位置,生成方言信息数据库。在其中一个可能的实施例中,所述获取所述目标对象提供的户籍信息,所述户籍信息包括第二籍贯信息和第二居住地信息,判断所述方言地理特征和所述户籍信息是否一致,包括:提取所述方言地理特征中所述目标对象的地域地点文字信息和所述籍贯信息的籍贯地点文字信息以及所述居住地信息的居住地点文字信息;将所述地域地点文字信息分别与所述籍贯地点文字信息、所述居住地点文字信息进行比较,判断所述地域地点文字信息与所述籍贯地点文字信息或者所述居住地点文字信息是否一致。在其中一个可能的实施例中,所所述获取目标对象的音频数据,从所述音频数据中提取多个特征词语的实际发音,将每一所述特征词语的实际发音的声波进行矢量化处理,生成矢量集A,包括:从视频通话中提取所述目标对象的音频数据,从所述音频数据中提取音轨;从所述音轨中截取多个所述特征词语的实际发音对应的声波,对每一所述声波进行降噪处理;对降噪处理后的每一所述声波按照预设的频率和预设的长度分别截取成若干帧片段;分别将每一所述声波对应的若干所述帧片段转化为一矢量值,汇总所有所述矢量值,生成所述矢量集A。在其中一个可能的实施例中,所述将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较,得到所述目标对象语音中的方言地理特征,包括:从所述n个矢量集中选取其中一个矢量集作为矢量集B,将所述矢量集A中的每一矢量分别与所述矢量集B中对应的矢量进行比较,得到比较结果;将所述比较结果与预设的误差阈值进行比较,若所述比较结果小于所述误差阈值,则得出所述目标对象的方言地理特征为所述矢量集B对应的所述方言信息数据所属的方言地理特征,若所述比较结果大于所述阈值,则从所述n个矢量集中再选取一个矢量集与所述矢量集A进行比较,直到得出所述目标对象的方言地理特征。在其中一个可能的实施例中,所述将所述地域地点文字信息分别与所述籍贯地点文字信息、所述居住地点文字信息进行比较,判断所述地域地点文字信息与所述籍贯地点文字信息或者所述居住地点文字信息是否一致,包括:按照预设的字符长度和高度在所述地域地点文字信息、所述籍贯地点文字信息以及所述居住地点文字信息中分别建立若干相同的矩形区域;比较所述地域地点文字信息和所述籍贯地点文字信息相同位置上的所述矩形区域的像素值,若每一相同位置上的像素值均相同,则所述地域地点文字信息与所述籍贯地点文字信息一致,否则,不一致;比较所述地域地点文字信息和所述居住地点文字信息相同位置上的所述矩形区域的像素值,若每一相同位置上的像素值均相同,则所述地域地点文字信息与所述居住地点文字信息一致,否则,不一致。一种基于方言背景的语音识别装置,包括如下模块:采集模块,设置为采集若干地方的方言信息数据,对所述方言信息数据按照地域进行分类存储,生成方言信息数据库;矢量集A生成模块,设置为获取目标对象的音频数据,从所述音频数据中提取多个特征词语的实际发音,将每一所述特征词语的实际发音的声波进行矢量化处理,生成矢量集A;方言矢量集生成模块,设置为从所述方言信息数据库中提取n个不同地域的方言信息数据,分别从每一地域的方言信息数据中提取与所述特征词语字形相同的词语对应的方言发音,将各所述方言发音矢量化,得到各所述方言发音对应的矢量值,将各所述方言发音对应的矢量值分别进行汇总,生成n个方言矢量集;比较模块,设置为将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较,得到所述目标对象语音中的方言地理特征,其中,所述方言地理特征包括第一籍贯信息和第一居住地信息;判断模块,设置为获取所述目标对象提供的户籍信息,所述户籍信息包括第二籍贯信息和第二居住地信息,判断所述方言地理特征和所述户籍信息是否一致。在其中一个可能的实施例中,所述采集模块还用于:通过网络爬虫的方式从现有各网络平台中获取若干地方的所述方言信息数据;将所述方言信息数据按照地域进行分类并打包,生成多个地域的方言信息数据包,对各地域的所述方言信息数据包使用不同的标记符号进行标记;将标记好的所述方言信息数据包存储于不同的位置,生成方言信息数据库。基于相同的构思,本申请提出了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行上述基于方言背景本文档来自技高网...

【技术保护点】
1.一种基于方言背景的语音识别方法,其特征在于,包括:/n采集若干地方的方言信息数据,对所述方言信息数据按照地域进行分类存储,生成方言信息数据库;/n获取目标对象的音频数据,从所述音频数据中提取多个特征词语的实际发音,将每一所述特征词语的实际发音的声波进行矢量化处理,生成矢量集A;/n从所述方言信息数据库中提取n个不同地域的方言信息数据,分别从每一地域的方言信息数据中提取与所述特征词语字形相同的词语对应的方言发音,将各所述方言发音矢量化,得到各所述方言发音对应的矢量值,将各所述方言发音对应的矢量值分别进行汇总,生成n个方言矢量集;/n将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较,得到所述目标对象语音中的方言地理特征,其中,所述方言地理特征包括第一籍贯信息和第一居住地信息;/n获取所述目标对象提供的户籍信息,所述户籍信息包括第二籍贯信息和第二居住地信息,判断所述方言地理特征和所述户籍信息是否一致。/n

【技术特征摘要】
1.一种基于方言背景的语音识别方法,其特征在于,包括:
采集若干地方的方言信息数据,对所述方言信息数据按照地域进行分类存储,生成方言信息数据库;
获取目标对象的音频数据,从所述音频数据中提取多个特征词语的实际发音,将每一所述特征词语的实际发音的声波进行矢量化处理,生成矢量集A;
从所述方言信息数据库中提取n个不同地域的方言信息数据,分别从每一地域的方言信息数据中提取与所述特征词语字形相同的词语对应的方言发音,将各所述方言发音矢量化,得到各所述方言发音对应的矢量值,将各所述方言发音对应的矢量值分别进行汇总,生成n个方言矢量集;
将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较,得到所述目标对象语音中的方言地理特征,其中,所述方言地理特征包括第一籍贯信息和第一居住地信息;
获取所述目标对象提供的户籍信息,所述户籍信息包括第二籍贯信息和第二居住地信息,判断所述方言地理特征和所述户籍信息是否一致。


2.根据权利要求1所述的基于方言背景的语音识别方法,其特征在于,所述采集若干地方的方言信息数据,对所述方言信息数据按照地域进行分类存储,生成方言信息数据库,包括:
通过网络爬虫的方式从现有各网络平台中获取若干地方的所述方言信息数据;
将所述方言信息数据按照地域进行分类并打包,生成多个地域的方言信息数据包,对各地域的所述方言信息数据包使用不同的标记符号进行标记;
将标记好的所述方言信息数据包存储于不同的位置,生成方言信息数据库。


3.根据权利要求1所述的基于方言背景的语音识别方法,其特征在于,所述获取所述目标对象提供的户籍信息,所述户籍信息包括第二籍贯信息和第二居住地信息,判断所述方言地理特征和所述户籍信息是否一致,包括:
提取所述方言地理特征中所述目标对象的地域地点文字信息和所述籍贯信息的籍贯地点文字信息以及所述居住地信息的居住地点文字信息;
将所述地域地点文字信息分别与所述籍贯地点文字信息、所述居住地点文字信息进行比较,判断所述地域地点文字信息与所述籍贯地点文字信息或者所述居住地点文字信息是否一致。


4.根据权利要求1所述的基于方言背景的语音识别方法,其特征在于,所述获取目标对象的音频数据,从所述音频数据中提取多个特征词语的实际发音,将每一所述特征词语的实际发音的声波进行矢量化处理,生成矢量集A,包括:
从视频通话中提取所述目标对象的音频数据,从所述音频数据中提取音轨;
从所述音轨中截取多个所述特征词语的实际发音对应的声波,对每一所述声波进行降噪处理;
对降噪处理后的每一所述声波按照预设的频率和预设的长度分别截取成若干帧片段;
分别将每一所述声波对应的若干所述帧片段转化为一矢量值,汇总所有所述矢量值,生成所述矢量集A。


5.根据权利要求1所述的基于方言背景的语音识别方法,其特征在于,所述将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较,得到所述目标对象语音中的方言地理特征,包括:
从所述n个矢量集中选取其中一个矢量集作为矢量集B,将所述矢量集A中的每一矢量分别与所述矢量集B中对应的矢量进行比较,得到比较结果;
将所述比较结果与预设的误差阈值进行比较,若所述比较结果小于所述误差阈值,则得...

【专利技术属性】
技术研发人员:张起
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1