计算机人声识别方法和具有人声识别功能的电话通讯系统技术方案

技术编号:2878500 阅读:190 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种计算机人声识别方法和具有人声识别功能的电话通讯系统。该系统包括自动呼叫分配器、接线员终端话机和计算机、说话人识别服务器。其中说话人识别服务器的工作步骤为,通过读取音频数字信号、提取上一步音频数字信号中的特征向量信号、代入存储器中数学分布模型、比较概率值等操作,可以迅速识别来电客户,并将其有关信息显示出来。采用本发明专利技术后,呼叫中心可以根据声音识别客户来电,从而摆脱对原有来电显示的依赖性,提供更加可靠的判断用户的方法,使得呼叫中心得以提供更加个性化的服务,大大提高服务质量。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种人声识别方法, 尤其是一种借助计算机识别人声的方法,本专利技术还涉及采用该方法的具有识别主叫方功能的电话通讯系统,属于通讯设备为了达到上述目的,本专利技术计算机人声识别方法在包括CPU、音频—数字信号转换卡(例如声卡)、存储器的计算机中,采用以下步骤工作1).将可以从音频数字信号中提取特征向量信号、建立数学分布模型的训练程序以及可以从音频数字信号中提取特征向量信号、并与数学分布模型比较、算出概率结果的识别程序分别存入计算机的存储器中,建立训练模块和识别模块;2).启动计算机后,音频—数字信号转换卡将首次输入的音频信号转换成数字信号;3).CPU读取经转换的音频数字信号,并调取存储器训练模块中的训练程序;4).CPU根据训练程序,提取上一步音频数字信号中的特征向量信号;5).CPU根据上一步特征向量信号建立数学分布模型数据;6).将数学分布模型数据及与之对应的结果信息数据存入外部存储器,形成数据库;7).音频—数字信号转换卡将再次输入的音频信号转换成数字信号;8).CPU读取经转换的上一步音频数字信号,并调取存储器识别模块中的识别程序;9).CPU根据识别程序,提取上一步音频数字信号中的特征向量信号;10).CPU将上一步特征向量信号代入外部存储器中的各数学分布模型,得出相应的概率值;11).CPU比较各概率值,从外部存储器数据库中选出最大的N(N=1-10)个概率值所对应的结果信息数据,送显示器显示。值得一提的是,本专利技术所说的计算机是广义概念,包括个人计算机、工控机、以及其它有类似处理能力的设备。本专利技术具有人声识别功能的电话通讯系统包括现有技术中的自动呼叫分配器(ACD)、接线员终端话机和计算机,还包括采用上述方法的计算机——在该系统中被称为说话人识别服务器(SR Server)。其中自动呼叫分配器(ACD)的外通讯端直接或经过网络接入设备外接通讯网络,内通讯端接接线员终端话机和计算机,以及说话人识别服务器(SR Server)。本专利技术具有人声识别功能的电话通讯系统工作时,当有用户向系统拨打电话,自动呼叫分配器响应,将客户的人声应答传送到说话人识别服务器,该服务器中的音频—数字信号转换卡将首次输入的音频信号转换成数字信号;CPU读取经转换的音频数字信号,并调取存储器识别模块中的识别程序,接着根据识别程序,提取音频数字信号中的特征向量信号,代入外部存储器中的各数学分布模型,得出相应的概率值,再从外部存储器数据库中选出最大的N个概率值所对应的结果信息数据,送接线员终端话机和计算机显示器显示。这样,便可迅速知晓打入电话者为何人。如果识别结果为空,即以前此呼叫从未打过本系统的电话,则说话人识别服务器的CPU经读取经转换的音频数字信号、调取存储器训练模块中的训练程序、提取音频数字信号中的特征向量信号、根据特征向量信号建立数学分布模型数据、将数学分布模型数据及与之对应的结果信息数据存入外部存储器,形成数据库,以供今后识别对比。由此可见,采用本专利技术后,可以根据声音识别客户来电,从而摆脱对原有来电显示的依赖性,提供更加可靠的判断用户的方法,使得呼叫中心得以提供更加个性化的服务,大大提高服务质量。附图说明图1是现有技术呼叫中心的系统示意图。图2是本专利技术实施例一的系统构成示意图。图3是本专利技术实施例二的系统构成示意图。本实施例具有人声识别功能的电话通讯系统工作时,当有用户向系统拨打电话,自动呼叫分配器(ACD)响应,将电话送到交互人声应答系统(IVR),询问客户需要帮助的类型,并将客户的人声传送到说话人识别服务器(SR Server),该服务器按照上述计算机有关工作步骤(步骤7)-11)), 将识别结果传送到接线员终端计算机上。如果识别结果为空,即以前此呼叫从未打过本系统的电话,则说话人识别服务器将按照有关步骤(步骤2)-6))将其记录下来,以供今后识别对比。本实施例可以在现有交互人声应答系统(IVR)上进行简单改装实现,因此便于普及推广。该实施例的特点是既可以通过媒体网关(IP Gateway)将共同电话网传来的电话呼叫转换成计算机呼叫,再通过客服服务器(Fine Support Server)协调自动呼叫分配器(ACD)以及说话人识别服务器(SR Server)的工作,从而完成呼叫者人声的识别;也可以直接通过客服服务器(Fine Support Server)的协调识别来自互联网的呼叫者的人声识别,用途更为广泛。除上述实施例外,本专利技术还可以广泛用于数字签名、防盗门开启、银行信用卡支付等诸多领域,前景广阔。权利要求1.一种计算机人声识别方法,其特征在于在包括CPU、音频—数字信号转换卡、存储器的计算机中,采用以下步骤工作1).将可以从音频数字信号中提取特征向量信号、建立数学分布模型的训练程序以及可以从音频数字信号中提取特征向量信号、并与数学分布模型比较、算出概率结果的识别程序分别存入计算机的存储器中,建立训练模块和识别模块;2).启动计算机后,音频—数字信号转换卡将首次输入的音频信号转换成数字信号;3).CPU读取经转换的音频数字信号,并调取存储器训练模块中的训练程序;4).CPU根据训练程序,提取上一步音频数字信号中的特征向量信号;5).CPU根据上一步特征向量信号建立数学分布模型数据;6).将数学分布模型数据及与之对应的结果信息数据存入外部存储器,形成数据库;7).音频—数字信号转换卡将再次输入的音频信号转换成数字信号;8).CPU读取经转换的上一步音频数字信号,并调取存储器识别模块中的识别程序;9).CPU根据识别程序,提取上一步音频数字信号中的特征向量信号;10).CPU将上一步特征向量信号代入外部存储器中的各数学分布模型,得出相应的概率值;11).CPU比较各概率值,从外部存储器数据库中选出最大的N(N=1-10)个概率值所对应的结果信息数据,送显示器显示。2.根据权利要求1所述的计算机人声识别方法,其特征在于所述步骤4)中CPU根据训练程序,用多频谱系数、线性预测系数算法提取上一步音频数字信号中的特征向量信号;所述步骤5)中CPU根据上一步特征向量信号用高斯混合模型建立混合高斯分布模型数据。3.一种具有人声识别功能的电话通讯系统,包括自动呼叫分配器(ACD)、接线员终端话机和计算机,其特征在于还包括按照权利要求1所述步骤工作的说话人识别服务器(SR Server),其中自动呼叫分配器(ACD)的外通讯端直接或经过网络接入设备外接通讯网络,内通讯端接接线员终端话机和计算机以及说话人识别服务器(SR Server)。4.根据权利要求3所述的具有人声识别功能的电话通讯系统,其特征在于含有交互人声应答装置(IVR),所述自动呼叫分配器(ACD)的外通讯端外接共电话网(PSTN),内通讯端接接线员终端话机和计算机、交互人声应答装置(IVR),以及说话人识别服务器(SR Server)。5.根据权利要求3所述的具有人声识别功能的电话通讯系统,其特征在于还含有媒体网关(IP Gateway)和客服服务器(Fine Support Server),所述自动呼叫分配器(ACD)的外通讯端经过客服服务器(Fine Support Server)接互联网,同时再通过媒体网关(IP Gateway)本文档来自技高网...

【技术保护点】
一种计算机人声识别方法,其特征在于:在包括CPU、音频-数字信号转换卡、存储器的计算机中,采用以下步骤工作:1).将可以从音频数字信号中提取特征向量信号、建立数学分布模型的训练程序以及可以从音频数字信号中提取特征向量信号、并与数学分布模 型比较、算出概率结果的识别程序分别存入计算机的存储器中,建立训练模块和识别模块;2).启动计算机后,音频-数字信号转换卡将首次输入的音频信号转换成数字信号;3).CPU读取经转换的音频数字信号,并调取存储器训练模块中的训练程序; 4).CPU根据训练程序,提取上一步音频数字信号中的特征向量信号;5).CPU根据上一步特征向量信号建立数学分布模型数据;6).将数学分布模型数据及与之对应的结果信息数据存入外部存储器,形成数据库;7).音频-数字信号转换卡将再 次输入的音频信号转换成数字信号;8).CPU读取经转换的上一步音频数字信号,并调取存储器识别模块中的识别程序;9).CPU根据识别程序,提取上一步音频数字信号中的特征向量信号;10).CPU将上一步特征向量信号代入外部存储器中的 各数学分布模型,得出相应的概率值;11).CPU比较各概率值,从外部存储器数据库中选出最大的N(N=1-10)个概率值所对应的结果信息数据,送显示器显示。...

【技术特征摘要】

【专利技术属性】
技术研发人员:冯南
申请(专利权)人:南京北极星软件有限公司
类型:发明
国别省市:84[中国|南京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利