基于语音的用户分类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:22330176 阅读:30 留言:0更新日期:2019-10-19 12:17
本发明专利技术公开了基于语音的用户分类方法、装置、计算机设备及存储介质。该方法包括:接收待识别语音,通过N‑gram模型对待识别语音进行进行识别,得到识别结果;将识别结果通过关键词抽取,得到与识别结果对应的关键词集合;获取关键词集合的语义向量,将语义向量作为文本情感分类器的输入,得到文本情感识别结果;以及将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签,以得到与所述识别结果对应的用户画像。该方法采用语音识别、情感识别及用户画像技术,实现了根据坐席与用户沟通的待识别语音进行语音识别后,进行文本情感识别及用户画像绘制,有效将各类型客户分类后便于质检岗分了抽查,提高了质检效率。

【技术实现步骤摘要】
基于语音的用户分类方法、装置、计算机设备及存储介质
本专利技术涉及语音识别
,尤其涉及一种基于语音的用户分类方法、装置、计算机设备及存储介质。
技术介绍
目前,电话营销在业务推广中得到了广泛的应用,但是现在坐席对客户拨打电话进行沟通后,质检岗对通话的录音信息进行质检时只能逐个收听,无法转化为文字,不能实时知道坐席与客户之间的沟通效果;也无法对录音信息进行情感分类及关键语音节点的标记,降低了语音质检的效率。
技术实现思路
本专利技术实施例提供了一种基于语音的用户分类方法、装置、计算机设备及存储介质,旨在解决现有技术中质检岗对坐席与客户之间的语音进行质检时只能逐个收听录音信息,录音信息无法转化为文字,不能实时知道坐席与客户之间的沟通效果,降低了语音质检的效率的问题。第一方面,本专利技术实施例提供了一种基于语音的用户分类方法,其包括:接收待识别语音,通过所述N-gram模型对所述待识别语音进行进行识别,得到识别结果;将所述识别结果通过词频-逆文本频率指数模型进行关键词抽取,得到与所述识别结果对应的关键词集合;获取所述关键词集合的语义向量,将所述语义向量作为文本情感分类器的输入,得到文本情感识别结果;以及获取所述关键词集合中名称词性的关键词,将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签,以得到与所述识别结果对应的用户画像。第二方面,本专利技术实施例提供了一种基于语音的用户分类装置,其包括:语音识别单元,用于接收待识别语音,通过所述N-gram模型对所述待识别语音进行进行识别,得到识别结果;关键词抽取单元,用于将所述识别结果通过词频-逆文本频率指数模型进行关键词抽取,得到与所述识别结果对应的关键词集合;情感识别单元,用于获取所述关键词集合的语义向量,将所述语义向量作为文本情感分类器的输入,得到文本情感识别结果;以及用户画像绘制单元,用于获取所述关键词集合中名称词性的关键词,将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签,以得到与所述识别结果对应的用户画像。第三方面,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于语音的用户分类方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于语音的用户分类方法。本专利技术实施例提供了一种基于语音的用户分类方法、装置、计算机设备及存储介质。该方法包括接收待识别语音,通过所述N-gram模型对所述待识别语音进行进行识别,得到识别结果;将所述识别结果通过词频-逆文本频率指数模型进行关键词抽取,得到与所述识别结果对应的关键词集合;获取所述关键词集合的语义向量,将所述语义向量作为文本情感分类器的输入,得到文本情感识别结果;以及获取所述关键词集合中名称词性的关键词,将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签,以得到与所述识别结果对应的用户画像。该方法采用语音识别、情感识别及用户画像技术,实现了根据坐席与用户沟通的待识别语音进行语音识别后,进行文本情感识别及用户画像绘制,有效将各类型客户分类后便于质检岗分了抽查,提高了质检效率。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的基于语音的用户分类方法的应用场景示意图;图2为本专利技术实施例提供的基于语音的用户分类方法的流程示意图;图3为本专利技术实施例提供的基于语音的用户分类方法的另一流程示意图;图4为本专利技术实施例提供的基于语音的用户分类方法的子流程示意图;图5为本专利技术实施例提供的基于语音的用户分类方法的另一子流程示意图;图6为本专利技术实施例提供的基于语音的用户分类方法的另一子流程示意图;图7为本专利技术实施例提供的基于语音的用户分类装置的示意性框图;图8为本专利技术实施例提供的基于语音的用户分类装置的另一示意性框图;图9为本专利技术实施例提供的基于语音的用户分类装置的子单元示意性框图;图10为本专利技术实施例提供的基于语音的用户分类装置的另一子单元示意性框图;图11为本专利技术实施例提供的基于语音的用户分类装置的另一子单元示意性框图;图12为本专利技术实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1和图2,图1为本专利技术实施例提供的基于语音的用户分类方法的应用场景示意图,图2为本专利技术实施例提供的基于语音的用户分类方法的流程示意图,该基于语音的用户分类方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。如图2所示,该方法包括步骤S110~S140。S110、接收待识别语音,通过所述N-gram模型对所述待识别语音进行进行识别,得到识别结果。在本实施例中,是站在服务器的角度描述技术方案。服务器可接收训练集语料库训练得到N-gram模型,通过N-gram模型对设置在坐席端上传至服务器的待识别语音进行识别。从而得到识别结果。在一实施例中,步骤S110之前还包括:接收训练集语料库,将所述训练集语料库输入至初始N-gram模型进行训练,得到N-gram模型;其中,所述N-gram模型为N元模型。在本实施例中,N-gram模型是一种语言模型(LanguageModel,LM),语言模型是一个基于概率的判别模型,它的输入是一句话(单词的顺序序列),输出是这句话的概率,即这些单词的联合概率(jointprobability)。假设句子T是有词序列w1,w2,w3...wn组成,用公式表示N-Gram语言模型如下:P(T)=P(w1)*p(w2)*p(w3)*…*p(wn)=p(w1)*p(w2|w1)*p(w3|w1w2)*…*p(wn|w1w2w3...)一般常用的N-Gram模型是Bi-Gram和Tri-Gram。分别用公式表示如下:Bi-Gram:P(T)=p(w1|begin)*p(w2|w1)*p(w3|w2)*…*p(本文档来自技高网...

【技术保护点】
1.一种基于语音的用户分类方法,其特征在于,包括:接收待识别语音,通过所述N‑gram模型对所述待识别语音进行进行识别,得到识别结果;将所述识别结果通过词频‑逆文本频率指数模型进行关键词抽取,得到与所述识别结果对应的关键词集合;获取所述关键词集合的语义向量,将所述语义向量作为文本情感分类器的输入,得到文本情感识别结果;以及将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签,以得到与所述识别结果对应的用户画像。

【技术特征摘要】
1.一种基于语音的用户分类方法,其特征在于,包括:接收待识别语音,通过所述N-gram模型对所述待识别语音进行进行识别,得到识别结果;将所述识别结果通过词频-逆文本频率指数模型进行关键词抽取,得到与所述识别结果对应的关键词集合;获取所述关键词集合的语义向量,将所述语义向量作为文本情感分类器的输入,得到文本情感识别结果;以及将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签,以得到与所述识别结果对应的用户画像。2.根据权利要求1所述的基于语音的用户分类方法,其特征在于,所述接收待识别语音,通过所述N-gram模型对所述待识别语音进行进行识别,得到识别结果之前,还包括:接收训练集语料库,将所述训练集语料库输入至初始N-gram模型进行训练,得到N-gram模型;其中,所述N-gram模型为N元模型。3.根据权利要求1所述的基于语音的用户分类方法,其特征在于,所述获取所述关键词集合中名称词性的关键词,将名称词性的关键词根据预先设置的标签库对应的标签转化策略转化成对应标签,以得到与所述识别结果对应的用户画像之后,还包括:获取所述关键词集合中词频-逆文本频率指数为最大值的关键词,以作为目标关键词,定位所述目标关键词在所述识别结果中的时间点并进行关键词标记。4.根据权利要求1所述的基于语音的用户分类方法,其特征在于,所述将所述识别结果通过词频-逆文本频率指数模型进行关键词抽取,得到与所述识别结果对应的关键词集合,包括:将所述识别结果通过基于概率统计分词模型进行分词,得到对应的分词结果;通过词频-逆文本频率指数模型,抽取所述分词结果中位于预设的第一排名值之前的关键词信息,以作为与所述识别结果对应的关键词集合。5.根据权利要求1所述的基于语音的用户分类方法,其特征在于,所述获取所述关键词集合的语义向量,包括:获取所述关键词集合中各关键词信息对应的目标词向量;根据...

【专利技术属性】
技术研发人员:黄锦伦张桂芝
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1