一种基于智能语音对话实现性别识别的方法技术

技术编号：20428571 阅读：21 留言：0更新日期：2019-02-23 09:42

本发明专利技术公开一种全自动软管注头机，包括上料装置、转模装置、注塑装置和切料装置，转模装置上方设置有注塑装置，前方设置有上料装置，后方设置有切料装置；转模装置包括转模体和间歇定位分割器，转模体为长型四方体结构，左右两端固定在间歇定位分割器上，通过间歇定位分割器实现度循环间歇旋转定位，转模体的四面分别设置有一副下模模芯；上料装置包括软管料斗、两个运送台、运送滑轨和提供动力的伺服机；注塑装置包括螺杆料筒、上模板和提供动力的马达组件，上模板与下模模芯相对应；切料装置包括螺旋切刀、下料丝杆和提供动力的伺服组件，螺旋切刀、下料丝杆均与下模模芯相对应。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于智能语音对话实现性别识别的方法
本专利技术涉及智能语音识别领域，具体为一种基于智能语音对话实现性别识别的方法。
技术介绍
随着人工智能、大数据、云计算等技术的蓬勃发展，以及人口结构的变化，智能语音已经越来越普遍地应用各行各业，替代或辅助人类进行大量重复性语音工作，比如呼叫中心的外呼或接待服务，客户的满意度调查、问卷调查等。智能语音对话保留了机器人与人类的互动语音，这些语料中除了文本语义信息，还包括性别信息、情绪信息、年龄信息等更多维度的信息。目前对智能语音对话的语音数据应用基本还停留在文本语义理解层面，对其他维度的信息挖掘，尤其是对语音中人类性别信息的获取和应用尚是空白。智能语音对话的语音数据有两个明显特征，为基于这些语音数据进行性别识别增加难度：(1)声音来源复杂：对话的双方分别是机器人和人类，所以语音数据中包含机器人的声音(包括但不限于TTS\NLG\真人语音录音等)与人类的声音，涉及两种及以上的声音信息；(2)环境噪音、混音不可避免：在实际应用中，尤其是基于电话信道的智能语音对话，8K的采样率，音质较低，且人类在通话中因所处的环境因素，常常不可避免的会有环境噪音以及其他人或物的声音混杂进去，增加性别识别的难度。目前，针对语音的性别识别有两种常见的方法，具体方案及各自缺点如下：(1)一种是基于男声与女声的基音频率差异，以某一固定频率为分界，低于该频率则识别为男声，高于该频率则识别为女声。这种识别方法比较粗放，误差率较高。(2)另一种方法是基于机器学习/深度学习技术的声纹识别方法，这种识别方法处理速度较慢，且对声音环境要求较高，不适合嘈杂的环境以...

【技术保护点】
1.一种基于智能语音对话实现性别识别的方法，其特征在于，包括：S1：将用户的语音通话下载到指定服务器；S2：将所述语音通话切成若干语音片段，多个语音片段分别通过OpenSmile提取语音特征；S3：通过机器学习算法对所述语音片段进行分析，提取语音的数值参数，经过模型融合，得到各个语音片段的性别概率；对所有性别概率做统计分析，得到多个统计特征，基于统计特征，对用户的性别做最终的预测。

【技术特征摘要】
1.一种基于智能语音对话实现性别识别的方法，其特征在于，包括：S1：将用户的语音通话下载到指定服务器；S2：将所述语音通话切成若干语音片段，多个语音片段分别通过OpenSmile提取语音特征；S3：通过机器学习算法对所述语音片段进行分析，提取语音的数值参数，经过模型融合，得到各个语音片段的性别概率；对所有性别概率做统计分析，得到多个统计特征，基于统计特征，对用户的性别做最终的预测。2.根据权利要求1所述的方法，其特征在于：所述语音特征包括MFCC、PCM高达6000多维的高维度特征。3.根据权利要求1所述的方法，其特征在于：所述机器学习算法如下：A1，由OpenSmile得到语音文件的高维度语音特征后，构造带标签的高维度数据训练集；基于LigntGBM的python算法包，对所述高维度数据训练集做特征提取，按照与标签的相关度得到语音特征各个维度的重要度，并选取所述重要度最高的前N个语音特征，重新构造维度较低的低维度数据训练集,N取150—200；A2，将所述低维度数据训练集按照(0.7：0.3)至(0.8：0.2)的比例划分成训练集和测试集...

【专利技术属性】
技术研发人员：刘鹏，林雨，
申请(专利权)人：浙江百应科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人