基于方言背景的语音识别方法及相关设备技术

技术编号：22645727 阅读：38 留言：0更新日期：2019-11-26 17:06

本申请涉及人工智能领域，尤其涉及一种基于方言背景的语音识别方法及相关设备，基于方言背景的语音识别方法包括：采集若干地方的方言信息数据，并按照地域进行分类存储，生成方言信息数据库；获取目标对象的音频数据和方言信息数据库中的方言信息数据，根据目标对象的音频数据和方言信息数据，分析目标对象语音中的方言地理特征；根据目标对象语音中的方言地理特征的分析结果和目标对象提供的籍贯信息以及居住地信息，判断目标对象是否涉嫌籍贯信息和居住地信息的欺诈。本申请有效的对用户的语音进行识别，识别出用户语音中的方言地理特征，从而起到核实用户身份的作用，扩大了欺诈信息的获取维度和分析维度。

Speech recognition method and related equipment based on dialect background

The application relates to the field of artificial intelligence, in particular to a speech recognition method and related equipment based on dialect background. The speech recognition method based on dialect background includes: collecting dialect information data of several places, classifying and storing according to the region, generating dialect information database; acquiring the audio data of the target object and dialect information data in the dialect information database According to the target object's audio data and dialect information data, analyze the dialect geographical features in the target object's voice; according to the analysis results of the dialect geographical features in the target object's voice, the native place information and residence information provided by the target object, judge whether the target object is suspected of fraud in the native place information and residence information. The application effectively recognizes the user's voice, recognizes the dialect geographical features in the user's voice, thus plays the role of verifying the user's identity, and expands the acquisition dimension and analysis dimension of fraud information.

全部详细技术资料下载

【技术实现步骤摘要】
基于方言背景的语音识别方法及相关设备
本申请涉及人工智能
，尤其涉及一种基于方言背景的语音识别方法及相关设备。
技术介绍
贷款是银行或其他金融机构按一定利率和必须归还等条件出借货币资金的一种信用活动形式。广义的贷款指贷款、贴现、透支等出贷资金的总称。银行通过贷款的方式将所集中的货币和货币资金投放出去，可以满足社会扩大再生产对补充资金的需要，促进经济的发展，同时，银行也可以由此取得贷款利息收入，增加银行自身的积累。然而，贷款安全问题是商业银行面临的首要问题。对于贷款安全问题，目前各个银行普遍开始采用语音识别的方式对贷款人的身份进行核实，以防止贷款过程中的欺诈行为。但是基于方言背景的语音分析还不成熟。由于我国幅员辽阔，各地的方言存在着很大的差异，在进行语音识别时，无法准确的根据用户的语音分析出其方言特征，从而无法对用户的身份进行有效识别。
技术实现思路
有鉴于此，有必要针对各地的方言存在着很大的差异，在进行语音识别时，无法准确的根据用户的语音对用户的身份进行有效识别的问题，提供一种基于方言背景的语音识别方法及相关设备。一种基于方言背景的语音识别方法，包括：采集若干地方的方言信息数据，对所述方言信息数据按照地域进行分类存储，生成方言信息数据库；获取目标对象的音频数据，从所述音频数据中提取多个特征词语的实际发音，将每一所述特征词语的实际发音的声波进行矢量化处理，生成矢量集A；从所述方言信息数据库中提取n个不同地域的方言信息数据，分别从每一地域的方言信息数据中提...

【技术保护点】
1.一种基于方言背景的语音识别方法，其特征在于，包括：/n采集若干地方的方言信息数据，对所述方言信息数据按照地域进行分类存储，生成方言信息数据库；/n获取目标对象的音频数据，从所述音频数据中提取多个特征词语的实际发音，将每一所述特征词语的实际发音的声波进行矢量化处理，生成矢量集A；/n从所述方言信息数据库中提取n个不同地域的方言信息数据，分别从每一地域的方言信息数据中提取与所述特征词语字形相同的词语对应的方言发音，将各所述方言发音矢量化，得到各所述方言发音对应的矢量值，将各所述方言发音对应的矢量值分别进行汇总，生成n个方言矢量集；/n将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较，得到所述目标对象语音中的方言地理特征，其中，所述方言地理特征包括第一籍贯信息和第一居住地信息；/n获取所述目标对象提供的户籍信息，所述户籍信息包括第二籍贯信息和第二居住地信息，判断所述方言地理特征和所述户籍信息是否一致。/n

【技术特征摘要】
1.一种基于方言背景的语音识别方法，其特征在于，包括：
采集若干地方的方言信息数据，对所述方言信息数据按照地域进行分类存储，生成方言信息数据库；
获取目标对象的音频数据，从所述音频数据中提取多个特征词语的实际发音，将每一所述特征词语的实际发音的声波进行矢量化处理，生成矢量集A；
从所述方言信息数据库中提取n个不同地域的方言信息数据，分别从每一地域的方言信息数据中提取与所述特征词语字形相同的词语对应的方言发音，将各所述方言发音矢量化，得到各所述方言发音对应的矢量值，将各所述方言发音对应的矢量值分别进行汇总，生成n个方言矢量集；
将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较，得到所述目标对象语音中的方言地理特征，其中，所述方言地理特征包括第一籍贯信息和第一居住地信息；
获取所述目标对象提供的户籍信息，所述户籍信息包括第二籍贯信息和第二居住地信息，判断所述方言地理特征和所述户籍信息是否一致。

2.根据权利要求1所述的基于方言背景的语音识别方法，其特征在于，所述采集若干地方的方言信息数据，对所述方言信息数据按照地域进行分类存储，生成方言信息数据库，包括：
通过网络爬虫的方式从现有各网络平台中获取若干地方的所述方言信息数据；
将所述方言信息数据按照地域进行分类并打包，生成多个地域的方言信息数据包，对各地域的所述方言信息数据包使用不同的标记符号进行标记；
将标记好的所述方言信息数据包存储于不同的位置，生成方言信息数据库。

3.根据权利要求1所述的基于方言背景的语音识别方法，其特征在于，所述获取所述目标对象提供的户籍信息，所述户籍信息包括第二籍贯信息和第二居住地信息，判断所述方言地理特征和所述户籍信息是否一致，包括：
提取所述方言地理特征中所述目标对象的地域地点文字信息和所述籍贯信息的籍贯地点文字信息以及所述居住地信息的居住地点文字信息；
将所述地域地点文字信息分别与所述籍贯地点文字信息、所述居住地点文字信息进行比较，判断所述地域地点文字信息与所述籍贯地点文字信息或者所述居住地点文字信息是否一致。

4.根据权利要求1所述的基于方言背景的语音识别方法，其特征在于，所述获取目标对象的音频数据，从所述音频数据中提取多个特征词语的实际发音，将每一所述特征词语的实际发音的声波进行矢量化处理，生成矢量集A，包括：
从视频通话中提取所述目标对象的音频数据，从所述音频数据中提取音轨；
从所述音轨中截取多个所述特征词语的实际发音对应的声波，对每一所述声波进行降噪处理；
对降噪处理后的每一所述声波按照预设的频率和预设的长度分别截取成若干帧片段；
分别将每一所述声波对应的若干所述帧片段转化为一矢量值，汇总所有所述矢量值，生成所述矢量集A。

5.根据权利要求1所述的基于方言背景的语音识别方法，其特征在于，所述将所述矢量集A与所述n个方言矢量集中的每一个矢量集分别进行比较，得到所述目标对象语音中的方言地理特征，包括：
从所述n个矢量集中选取其中一个矢量集作为矢量集B，将所述矢量集A中的每一矢量分别与所述矢量集B中对应的矢量进行比较，得到比较结果；
将所述比较结果与预设的误差阈值进行比较，若所述比较结果小于所述误差阈值，则得...

【专利技术属性】
技术研发人员：张起，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人