一种基于智能语音对话实现性别识别的方法技术

技术编号:20428571 阅读:21 留言:0更新日期:2019-02-23 09:42
本发明专利技术公开一种全自动软管注头机,包括上料装置、转模装置、注塑装置和切料装置,转模装置上方设置有注塑装置,前方设置有上料装置,后方设置有切料装置;转模装置包括转模体和间歇定位分割器,转模体为长型四方体结构,左右两端固定在间歇定位分割器上,通过间歇定位分割器实现度循环间歇旋转定位,转模体的四面分别设置有一副下模模芯;上料装置包括软管料斗、两个运送台、运送滑轨和提供动力的伺服机;注塑装置包括螺杆料筒、上模板和提供动力的马达组件,上模板与下模模芯相对应;切料装置包括螺旋切刀、下料丝杆和提供动力的伺服组件,螺旋切刀、下料丝杆均与下模模芯相对应。

【技术实现步骤摘要】
一种基于智能语音对话实现性别识别的方法
本专利技术涉及智能语音识别领域,具体为一种基于智能语音对话实现性别识别的方法。
技术介绍
随着人工智能、大数据、云计算等技术的蓬勃发展,以及人口结构的变化,智能语音已经越来越普遍地应用各行各业,替代或辅助人类进行大量重复性语音工作,比如呼叫中心的外呼或接待服务,客户的满意度调查、问卷调查等。智能语音对话保留了机器人与人类的互动语音,这些语料中除了文本语义信息,还包括性别信息、情绪信息、年龄信息等更多维度的信息。目前对智能语音对话的语音数据应用基本还停留在文本语义理解层面,对其他维度的信息挖掘,尤其是对语音中人类性别信息的获取和应用尚是空白。智能语音对话的语音数据有两个明显特征,为基于这些语音数据进行性别识别增加难度:(1)声音来源复杂:对话的双方分别是机器人和人类,所以语音数据中包含机器人的声音(包括但不限于TTS\NLG\真人语音录音等)与人类的声音,涉及两种及以上的声音信息;(2)环境噪音、混音不可避免:在实际应用中,尤其是基于电话信道的智能语音对话,8K的采样率,音质较低,且人类在通话中因所处的环境因素,常常不可避免的会有环境噪音以及其他人或物的声音混杂进去,增加性别识别的难度。目前,针对语音的性别识别有两种常见的方法,具体方案及各自缺点如下:(1)一种是基于男声与女声的基音频率差异,以某一固定频率为分界,低于该频率则识别为男声,高于该频率则识别为女声。这种识别方法比较粗放,误差率较高。(2)另一种方法是基于机器学习/深度学习技术的声纹识别方法,这种识别方法处理速度较慢,且对声音环境要求较高,不适合嘈杂的环境以及混合说话的情况,不同麦克风和信道对识别性能也会有影响,尤其是电话信道下,常规的机器学习/深度学习识别方法不能很好地处理这类语音的性别识别。
技术实现思路
本专利技术的目的在于提供一种基于智能语音对话实现性别识别的方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于智能语音对话实现性别识别的方法,包括:S1:将用户的语音通话下载到指定服务器;S2:将所述语音通话切成若干语音片段,多个语音片段分别通过OpenSmile提取语音特征;S3:通过机器学习算法对所述语音片段进行分析,提取语音的数值参数,经过模型融合,得到各个语音片段的性别概率;对所有性别概率做统计分析,得到多个统计特征,基于统计特征,对用户的性别做最终的预测。作为本专利技术的一种优选技术方案,所述语音特征包括MFCC、PCM高达6000多维的高维度特征。作为本专利技术的一种优选技术方案,所述机器学习算法如下:A1,由OpenSmile得到语音文件的高维度语音特征后,构造带标签的高维度数据训练集;基于LigntGBM的python算法包,对所述高维度数据训练集做特征提取,按照与标签的相关度得到语音特征各个维度的重要度,并选取所述重要度最高的前N个语音特征,重新构造维度较低的低维度数据训练集,N取150—200;A2,将所述低维度数据训练集按照(0.7:0.3)至(0.8:0.2)的比例划分成训练集和测试集两个部分;将训练集按照0.5:0.5的比例划分为训练集1和训练集2。A3,在所述训练集1中采用模型融合,分别利用LogisticRegression、SVM算法、RandomForest算法和GradientBoostingClassifier算法对训练集1的数据进行二分类训练,分别得到训练结果;再将四个算法的所述训练结果接入LogisticRegression,得到四个模型,对四个模型的预测结果做模型融合;A4,将所述训练集1的训练结果和模型参数迁移到训练集2中,利用python的sklearn.externals.joblib包保存到.m的文件中,利用LogisticRegression对训练集2中的语音片段做性别预测,得到各语音片段的性别预测概率。作为本专利技术的一种优选技术方案,对所述训练集2中的语音片段按照用户ID做归类,一个用户ID下可以有多个语音的性别预测概率,包括概率最大值、概率最小值、概率平均数、概率中位数、概率的方差、概率大于0.5的个数、概率大于0.5的比例等信息,构造每一个用户ID的统计特征。与现有技术相比:1.本专利技术提出一种可以对智能语音对话数据进行性别识别的技术方案,弥补当前智能语音对话数据中关于性别信息获取和应用的空白;2.针对现有技术中存在的识别准确率不高、环境要求高、处理速度慢等缺陷和不足,本专利技术采用机器学习多模型融合技术,利用LogisticRegression、SVM算法、RandomForest算法和GradientBoostingClassifier算法,并结合概率统计分析,实现基于智能语音对话实现性别识别,尤其是电话信道下的语音数据,可以有效提升性别识别的准确率、识别效率、识别鲁棒性以及识别结果的应用范围;3.本专利技术可以在客户关系管理领域中得到充分应用,可以更新、补充并验证客户信息,拓展企业对现成客户资料的获取途径,降低企业维系客户的成本,实用性高,便于推广使用。附图说明图1是本专利技术的语音识别流程示意图。图2是本专利技术语音识别模型及训练框架示意图。图3是本专利技术语音性别识别模型的应用场景框架示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-3,本专利技术提供一种基于智能语音对话实现性别识别的方法,包括:S1:将用户的语音通话下载到指定服务器;S2:将语音通话切成若干语音片段,多个语音片段分别通过OpenSmile提取语音特征;S3:通过机器学习算法对语音片段进行分析,提取语音的数值参数,经过模型融合,得到各个语音片段的性别概率;对所有性别概率做统计分析,得到多个统计特征,基于统计特征,对用户的性别做最终的预测。语音特征包括MFCC、PCM高达6000多维的高维度特征。机器学习算法如下:A1,由OpenSmile得到语音文件的高维度语音特征后,构造带标签的高维度数据训练集;基于LigntGBM的python算法包,对高维度数据训练集做特征提取,按照与标签的相关度得到语音特征各个维度的重要度,并选取重要度最高的前N个语音特征,重新构造维度较低的低维度数据训练集,N取150—200;A2,将低维度数据训练集按照(0.7:0.3)至(0.8:0.2)的比例划分成训练集和测试集两个部分;将训练集按照0.5:0.5的比例划分为训练集1和训练集2;A3,在训练集1中采用模型融合,分别利用LogisticRegression、SVM算法、RandomForest算法和GradientBoostingClassifier算法对训练集1的数据进行二分类训练,分别得到训练结果;再将四个算法的训练结果接入LogisticRegression,得到四个模型,对四个模型的预测结果做模型融合;A4,将训练集1的训练结果和模型参数迁移到训练集2中,利用python的sklearn.externals.joblib包保存到.m的文本文档来自技高网
...

【技术保护点】
1.一种基于智能语音对话实现性别识别的方法,其特征在于,包括:S1:将用户的语音通话下载到指定服务器;S2:将所述语音通话切成若干语音片段,多个语音片段分别通过OpenSmile提取语音特征;S3:通过机器学习算法对所述语音片段进行分析,提取语音的数值参数,经过模型融合,得到各个语音片段的性别概率;对所有性别概率做统计分析,得到多个统计特征,基于统计特征,对用户的性别做最终的预测。

【技术特征摘要】
1.一种基于智能语音对话实现性别识别的方法,其特征在于,包括:S1:将用户的语音通话下载到指定服务器;S2:将所述语音通话切成若干语音片段,多个语音片段分别通过OpenSmile提取语音特征;S3:通过机器学习算法对所述语音片段进行分析,提取语音的数值参数,经过模型融合,得到各个语音片段的性别概率;对所有性别概率做统计分析,得到多个统计特征,基于统计特征,对用户的性别做最终的预测。2.根据权利要求1所述的方法,其特征在于:所述语音特征包括MFCC、PCM高达6000多维的高维度特征。3.根据权利要求1所述的方法,其特征在于:所述机器学习算法如下:A1,由OpenSmile得到语音文件的高维度语音特征后,构造带标签的高维度数据训练集;基于LigntGBM的python算法包,对所述高维度数据训练集做特征提取,按照与标签的相关度得到语音特征各个维度的重要度,并选取所述重要度最高的前N个语音特征,重新构造维度较低的低维度数据训练集,N取150—200;A2,将所述低维度数据训练集按照(0.7:0.3)至(0.8:0.2)的比例划分成训练集和测试集...

【专利技术属性】
技术研发人员:刘鹏林雨
申请(专利权)人:浙江百应科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1