基于语音的用户分类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：22330176 阅读：30 留言：0更新日期：2019-10-19 12:17

本发明专利技术公开了基于语音的用户分类方法、装置、计算机设备及存储介质。该方法包括：接收待识别语音，通过N‑gram模型对待识别语音进行进行识别，得到识别结果；将识别结果通过关键词抽取，得到与识别结果对应的关键词集合；获取关键词集合的语义向量，将语义向量作为文本情感分类器的输入，得到文本情感识别结果；以及将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签，以得到与所述识别结果对应的用户画像。该方法采用语音识别、情感识别及用户画像技术，实现了根据坐席与用户沟通的待识别语音进行语音识别后，进行文本情感识别及用户画像绘制，有效将各类型客户分类后便于质检岗分了抽查，提高了质检效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于语音的用户分类方法、装置、计算机设备及存储介质
本专利技术涉及语音识别
，尤其涉及一种基于语音的用户分类方法、装置、计算机设备及存储介质。
技术介绍
目前，电话营销在业务推广中得到了广泛的应用，但是现在坐席对客户拨打电话进行沟通后，质检岗对通话的录音信息进行质检时只能逐个收听，无法转化为文字，不能实时知道坐席与客户之间的沟通效果；也无法对录音信息进行情感分类及关键语音节点的标记，降低了语音质检的效率。
技术实现思路
本专利技术实施例提供了一种基于语音的用户分类方法、装置、计算机设备及存储介质，旨在解决现有技术中质检岗对坐席与客户之间的语音进行质检时只能逐个收听录音信息，录音信息无法转化为文字，不能实时知道坐席与客户之间的沟通效果，降低了语音质检的效率的问题。第一方面，本专利技术实施例提供了一种基于语音的用户分类方法，其包括：接收待识别语音，通过所述N-gram模型对所述待识别语音进行进行识别，得到识别结果；将所述识别结果通过词频-逆文本频率指数模型进行关键词抽取，得到与所述识别结果对应的关键词集合；获取所述关键词集合的语义向量，将所述语义向量作为文本情感分类器的输入，得到文本情感识别结果；以及获取所述关键词集合中名称词性的关键词，将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签，以得到与所述识别结果对应的用户画像。第二方面，本专利技术实施例提供了一种基于语音的用户分类装置，其包括：语音识别单元，用于接收待识别语音，通过所述N-gram模型对所述待识别语音进行进行识别，得到识别结果；关键词抽取单元，用于将所述识别结果通过词频-逆文...

【技术保护点】
1.一种基于语音的用户分类方法，其特征在于，包括：接收待识别语音，通过所述N‑gram模型对所述待识别语音进行进行识别，得到识别结果；将所述识别结果通过词频‑逆文本频率指数模型进行关键词抽取，得到与所述识别结果对应的关键词集合；获取所述关键词集合的语义向量，将所述语义向量作为文本情感分类器的输入，得到文本情感识别结果；以及将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签，以得到与所述识别结果对应的用户画像。

【技术特征摘要】
1.一种基于语音的用户分类方法，其特征在于，包括：接收待识别语音，通过所述N-gram模型对所述待识别语音进行进行识别，得到识别结果；将所述识别结果通过词频-逆文本频率指数模型进行关键词抽取，得到与所述识别结果对应的关键词集合；获取所述关键词集合的语义向量，将所述语义向量作为文本情感分类器的输入，得到文本情感识别结果；以及将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签，以得到与所述识别结果对应的用户画像。2.根据权利要求1所述的基于语音的用户分类方法，其特征在于，所述接收待识别语音，通过所述N-gram模型对所述待识别语音进行进行识别，得到识别结果之前，还包括：接收训练集语料库，将所述训练集语料库输入至初始N-gram模型进行训练，得到N-gram模型；其中，所述N-gram模型为N元模型。3.根据权利要求1所述的基于语音的用户分类方法，其特征在于，所述获取所述关键词集合中名称词性的关键词，将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签，以得到与所述识别结果对应的用户画像之后，还包括：获取所述关键词集合中词频-逆文本频率指数为最大值的关键词，以作为目标关键词，定位所述目标关键词在所述识别结果中的时间点并进行关键词标记。4.根据权利要求1所述的基于语音的用户分类方法，其特征在于，所述将所述识别结果通过词频-逆文本频率指数模型进行关键词抽取，得到与所述识别结果对应的关键词集合，包括：将所述识别结果通过基于概率统计分词模型进行分词，得到对应的分词结果；通过词频-逆文本频率指数模型，抽取所述分词结果中位于预设的第一排名值之前的关键词信息，以作为与所述识别结果对应的关键词集合。5.根据权利要求1所述的基于语音的用户分类方法，其特征在于，所述获取所述关键词集合的语义向量，包括：获取所述关键词集合中各关键词信息对应的目标词向量；根据...

【专利技术属性】
技术研发人员：黄锦伦，张桂芝，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人