基于语音识别的身份证号匹配方法及系统技术方案

技术编号：21973145 阅读：139 留言：0更新日期：2019-08-28 01:50

本发明专利技术适用于人工智能领域，提供了一种基于语音识别的身份证号匹配方法及系统，通过主服务器在对语音进行识别后得到目标数列，并根据目标数列中前预设个数的数字对顶与目标数列对应的目标子服务器，将目标数列发送至目标子服务器；各个目标子服务器在判定自身未过载后，才分别计算其本地存储的一个以上的数据集群中的身份证号与目标数列的差异位数；目标子服务器每当一个数据集群中的全部身份证号均已被选取后，将该数据集群中各个身份证号与目标数列的差异位数的最小值发送至主服务器；若该参考差异位数为0，则主服务器将参考差异位数对应的身份证号作为被选身份证号，并向所有目标子服务器发送搜索停止指令，以提高对身份证号的匹配效率。

Identity Card Number Matching Method and System Based on Speech Recognition

全部详细技术资料下载

【技术实现步骤摘要】
基于语音识别的身份证号匹配方法及系统
本专利技术属于人工智能领域，尤其涉及一种基于语音识别的身份证号匹配方法及系统。
技术介绍
在远程办理一些业务时，业务系统需要获取用户输入的身份证号，并在其所在的系统中进行查询匹配，从而确定用户身份。有时用户是通过语音将自己的身份证号输入到业务系统中的，在这种情况下业务系统需要在对语音进行识别后，对语音中包含的数字进行身份证号的匹配。当前业务系统往往是通过单一的服务器对用户语音中包含的待匹配数字进行身份证号匹配的，并且匹配的过程基本是遍历服务器中存储的所有身份证号，并将待匹配数字的每一位依次与全部身份证号中的18位数字中对应位的数字进行比较，从而选定与待匹配数字最接近的身份证号。但是通过上述方法对每条语音中包含的数字进行身份证号匹配时，由于存在很多不必要的遍历和匹配计算，所以计算量较大。并且单一的服务器的计算资源也是有限的，这就造成了当单位时间内需要对大量的语音进行身份证号匹配时，服务器可能出现超负荷运转，也就直接导致了身份证号的匹配速度降低。
技术实现思路
有鉴于此，本专利技术实施例提供了一种基于语音识别的身份证号匹配方法及系统，...

【技术保护点】
1.一种基于语音识别的身份证号匹配方法，其特征在于，包括：主服务器在接收到用户输入的语音后，对所述语音中包含的数字进行识别，得到所述语音对应的目标数列；所述主服务器将所述目标数列中排在前预设个数的数字作为标志数组，根据预设的数组与子服务器的对应关系，将所述标志数组对应的一个以上的子服务器均设定为目标子服务器，将所述目标数列分别发送至各个所述目标子服务器；所述目标子服务器在接收到目标数列后判断其自身是否过载；若所述目标子服务器判定其自身未过载，则所述目标子服务器同时从其本地存储的一个以上的数据集群中分别选取身份证号，计算被选取的所述身份证号与所述目标数列的差异位数；所述目标子服务器每当一个数据集...

【技术特征摘要】
1.一种基于语音识别的身份证号匹配方法，其特征在于，包括：主服务器在接收到用户输入的语音后，对所述语音中包含的数字进行识别，得到所述语音对应的目标数列；所述主服务器将所述目标数列中排在前预设个数的数字作为标志数组，根据预设的数组与子服务器的对应关系，将所述标志数组对应的一个以上的子服务器均设定为目标子服务器，将所述目标数列分别发送至各个所述目标子服务器；所述目标子服务器在接收到目标数列后判断其自身是否过载；若所述目标子服务器判定其自身未过载，则所述目标子服务器同时从其本地存储的一个以上的数据集群中分别选取身份证号，计算被选取的所述身份证号与所述目标数列的差异位数；所述目标子服务器每当一个数据集群中的全部身份证号均已被选取后，将该数据集群中的各个所述身份证号与所述目标数列的差异位数的最小值作为该数据集群对应的参考差异位数，并将所述参考差异位数以及参考差异位数对应的身份证号发送至所述主服务器；所述主服务器在得到一个所述参考差异位数后，若该参考差异位数为0，则将参考差异位数对应的身份证号作为被选身份证号，并向所有目标子服务器发送搜索停止指令。2.如权利要求1所述的基于语音识别的身份证号匹配方法，其特征在于，还包括：所述主服务器在得到一个所述参考差异位数后，若所述参考差异位数不为0，则所述主服务器对所述参考差异位数进行存储，并当得到所有所述目标子服务器中的所有数据集群对应的参考差异位数时，将最小的参考差异位数对应的身份证号作为被选身份证号。3.如权利要求1所述的基于语音识别的身份证号匹配方法，其特征在于，所述对所述语音中包含的数字进行识别，得到所述语音对应的目标数列，包括：通过预设的采样频率对所述语音进行采样，得到所述语音对应的目标离散信号；根据所述目标离散信号中每个时序值对应的信号幅值，从所述目标离散信号中提取多个信号段，其中，每个所述信号段中包含多个连续的时序值，且所述信号段中所有时序值对应的信号幅值均大于预设的幅值阈值；计算每个信号段与多个预设的标准数字信号的相似度，其中每个标准数字信号对应一个数字；若所述信号段仅与其中一个标准数字信号的相似度大于预设的相似度阈值，则将该标准数字信号对应的数字作为该信号段对应的目标数字；将各个目标数字按照其对应的信号段在所述目标离散信号中的顺序进行排列，生成所述目标数列。4.如权利要求3所述的基于语音识别的身份证号匹配方法，其特征在于，在所述通过预设的采样频率对所述语音进行采样之前，还包括：将当前时刻之前一个预设时间段内的采样频率作为参考采样频率，并将当前时刻之前一个预设时间段内接收到的各个语音作为参考语音；通过公式：计算各个所述参考语音对应的有效系数，其中，所述En为当前时刻之前一个预设时间段内接收到的第n个参考语音对应的有效系数，所述Mn为第n个参考语音的总时长，所述Tn为第n个参考语音所包含的全部所述信号段的时长的总和；计算当前时刻之前一个预设时间段内所有所述被选身份证号对应的所述参考差异位数的平均值，作为差异平均数；若所述差异平均数不小于预设的差异阈值，或各个所述参考语音对应的有效系数的平均值小于预设的系数阈值，则将所述参考采样频率作为所述预设的采样频率；若所述差异平均数小于预设的差异阈值，且各个所述参考语音对应的有效系数的平均值不小于预设的系数阈值，则将一个小于所述参考采样频率的频率作为所述预设的采样频率。5.如权利要求4所述的基于语音识别的身份证号匹配方法，其特征在于，所述将一个小于所述参考采样频率的频率作为所述预设的采样频率，包括：通过公式：计算所述预设的采样频率，所述F为所述预设的采样频率，所述Fpre为所述参考采样频率，所述D为所述差异平均数，所述S为所述各个所述参考语音对应的有效系数的平均值，所述e为自然常数。6.如权利要求1所述的基于语音...

【专利技术属性】
技术研发人员：汪旭，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人