一种语音会话样本的身份识别方法、装置及设备制造方法及图纸

技术编号:17657239 阅读:54 留言:0更新日期:2018-04-08 09:48
本发明专利技术实施例公开了一种语音会话样本的身份识别方法、装置及设备。该方法包括:识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息。本发明专利技术实施例的技术方案,实现了对语音会话样本中不同会话语句所属用户的身份识别,为后续为不同身份用户提供个性化服务奠定了基础。

【技术实现步骤摘要】
一种语音会话样本的身份识别方法、装置及设备
本专利技术涉及数据处理
,尤其涉及一种语音会话样本的身份识别方法、装置及设备。
技术介绍
公司的发展往往是靠业务拉动的,销售和客服积累了公司的众多业务信息,销售/客服和客户的沟通电话,汇集了众多的动态业务信息,对于公司来说,如果能从这些录音中挖掘有用的商业线索数据,对于公司把握市场,洞察先机,能够赢得客户,至关重要。然而,目前销售、客服与客户的会话内容融合在一起,无法对语音会话内容进行身份识别。
技术实现思路
有鉴于此,本专利技术实施例提供一种语音会话样本的身份识别方法、装置及设备,以对语音会话样本中会话语句所属用户进行身份识别。第一方面,本专利技术实施例提供了一种语音会话样本的身份识别方法,包括:识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息。第二方面,本专利技术实施例提供了一种语音会话样本的身份识别装置,包括:语句确定模块,用于识本文档来自技高网...
一种语音会话样本的身份识别方法、装置及设备

【技术保护点】
一种语音会话样本的身份识别方法,包括:识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息。

【技术特征摘要】
1.一种语音会话样本的身份识别方法,包括:识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息。2.根据权利要求1所述的方法,其特征在于,所述身份分类器通过如下方式得到:依据不同身份用户的会话文本中包含的关键字以及关键字频次,训练得到所述身份分类器。3.根据权利要求1所述的方法,其特征在于,识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句,包括:识别所述语音会话样本的声学特征;依据识别结果,确定所述语音会话样本中包含的停顿信息;依据所述停顿信息对所述语音会话样本进行语音切分,以确定所述语音会话样本中包含的会话语句。4.根据权利要求1所述的方法,其特征在于,所述声学特征包括时长、基频、能量、共振峰频率、宽带、频率微扰、振幅微扰、过零率和梅尔频率倒谱参数中的至少一种。5.根据权利要求1所述的方法,其特征在于,确定所述每一用户的身份信息之后,包括:获取任一身份用户的所有语音内容;依据获取的语音内容,为所述任一身份用户提供服务。6.一种语音会话样本的身份识别装置,包括:语句确定模块,用于识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语...

【专利技术属性】
技术研发人员:雷成军高建忠陈鑫程涛远杨琳琳黄晓梅吴冬雪
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1