语音交互设备唤醒词生成方法及装置制造方法及图纸

技术编号:19595559 阅读:14 留言:0更新日期:2018-11-28 05:37
本公开提供一种语音交互设备唤醒词生成方法,其包括如下步骤:获取预设时间段内用户的语音交互数据;采用机器学习算法对所述语音交互数据进行聚类,以得到多个类;选取所述多个类中的至少一个类,分别将各个已选类的语音交互数据作为输入,采用聚类算法输出每个所述已选类对应的唤醒词;向所述用户推送所述唤醒词。相应地,提供一种语音交互设备唤醒词生成装置。本公开所述语音交互设备唤醒词生成方法和装置通过统计用户习惯,并对用户上传的语音交互数据采用聚类算法进行聚类分析,以生成符合该用户行为习惯的语音唤醒词,从而能为不同用户提供差异化的语音唤醒服务。

【技术实现步骤摘要】
语音交互设备唤醒词生成方法及装置
本公开涉及语音识别
,具体涉及一种语音交互设备唤醒词生成方法,以及一种语音交互设备唤醒词生成装置。
技术介绍
语音识别技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是将人类发出的语音中的词汇内容转换为计算机可读的输入信息,例如按键、二进制编码或者字符序列。随着语音识别技术的快速发展,语音交互设备已大规模投入商用。语音交互逐渐成为了新一代广泛应用的交互模式。目前,语音交互设备的交互模式通常为通过唤醒词来开启与用户之间的交流。然而,专利技术人发现,现有的语音交互技术方案通常为通过固定的唤醒词来开启语音交互服务。个别的也有通过识别交互设备场景从而生成固定唤醒词的方案。但由于用户间存在很大的差异性,人与人的需求不同,所需交互的内容也不尽相同,固定的唤醒词往往导致用户的体验不佳。因此,如何生成符合用户习惯的唤醒词成为本领域亟待解决的技术问题,并对提高用户体验,加快语音交互的发展起着关键性作用。
技术实现思路
为了至少部分解决现有技术中存在的技术问题而完成了本公开。解决本公开技术问题所采用的技术方案是:本公开提供一种语音交互设备唤醒词生成方法,其包括如下步骤:获取预设时间段内用户的语音交互数据;采用机器学习算法对所述语音交互数据进行聚类,以得到多个类;选取所述多个类中的至少一个类,分别将各个已选类的语音交互数据作为输入,采用聚类算法输出每个所述已选类对应的唤醒词;向所述用户推送所述唤醒词。可选地,在所述获取预设时间段内用户的语音交互数据的步骤之后,所述唤醒词生成方法还包括如下步骤:去掉所述语音交互数据中的无意义词汇并进行分词处理;则所述采用机器学习算法对所述语音交互数据进行聚类的步骤相应为:采用机器学习算法对分词后的所述语音交互数据进行聚类。可选地,所述采用机器学习算法对分词后的所述语音交互数据进行聚类,以得到多个类的步骤具体包括:根据分词后的所述语音交互数据,生成用户词典;根据所述用户词典,将分词后的所述语音交互数据转换为向量;采用聚类算法对转换后的所述向量进行聚类,以得到M个类,其中M为大于2的整数。可选地,在所述采用聚类算法对转换后的所述向量进行聚类,以得到M个类的步骤之后,所述唤醒词生成方法还包括如下步骤:根据聚类后得到的M个类的大小进行排序,选取排名前N位的类,其中,N为大于1的整数;则所述选取所述多个类中的至少一个类的步骤具体为:在所述排名前N位的类中选取排名靠前的至少一个类。可选地,在所述向所述用户推送所述唤醒词的步骤之后,所述唤醒词生成方法还包括如下步骤:接收所述用户输出的唤醒词反馈信息,所述唤醒词反馈信息包括唤醒词确认信息和唤醒词修正信息;若接收到所述唤醒词确认信息,则保持所述唤醒词不变;若接收到所述唤醒词修正信息,则继续接收所述用户提供的新唤醒词,并将其对应的原唤醒词替换为所述新唤醒词。本公开还提供一种语音交互设备唤醒词生成装置,其包括:语音交互数据获取模块,用于获取预设时间段内用户的语音交互数据;语音交互数据处理模块,用于采用机器学习算法对所述语音交互数据进行聚类,以得到多个类;唤醒词生成模块,用于选取所述多个类中的至少一个类;分别将各个已选类的语音交互数据作为输入,采用聚类算法输出每个所述已选类对应的唤醒词;唤醒词推送模块,用于向所述用户推送所述唤醒词。可选地,所述唤醒词生成装置还包括:语音交互数据预处理模块,用于去掉所述语音交互数据中的无意义词汇并进行分词处理;则所述语音交互数据处理模块相应用于,采用机器学习算法对分词后的所述语音交互数据进行聚类,以得到多个类。可选地,所述语音交互数据处理模块具体用于,根据分词后的所述语音交互数据,生成用户词典;根据所述用户词典,将分词后的所述语音交互数据转换为向量;采用聚类算法对转换后的所述向量进行聚类,以得到M个类,其中M为大于2的整数。可选地,所述语音交互数据处理模块还用于,根据聚类后得到的M个类的大小进行排序,选取排名前N位的类,其中,N为大于1的整数;则所述唤醒词生成模块相应用于,在所述排名前N位的类中选取排名靠前的至少一个类。可选地,所述唤醒词生成装置还包括:唤醒词更新模块,用于接收所述用户输出的唤醒词反馈信息,所述唤醒词反馈信息包括唤醒词确认信息和唤醒词修正信息;若接收到所述唤醒词确认信息,则保持所述唤醒词不变;若接收到所述唤醒词修正信息,则继续接收所述用户提供的新唤醒词,并将其对应的原唤醒词替换为所述新唤醒词。有益效果:本公开所述语音交互设备唤醒词生成方法和装置通过统计用户习惯,并对用户上传的语音交互数据采用聚类算法进行聚类分析,以生成符合该用户行为习惯的语音唤醒词,从而能为不同用户提供差异化的语音唤醒服务。附图说明图1为本公开实施例1提供的语音交互设备唤醒词生成方法的流程图;图2为本公开实施例2提供的语音交互设备唤醒词生成方法的流程图;图3为本公开实施例3提供的语音交互设备唤醒词生成装置的结构框图。图中:100-语音交互数据获取模块;200-语音交互数据预处理模块;300-语音交互数据处理模块;400-唤醒词生成模块;500-唤醒词推送模块;600-唤醒词更新模块。具体实施方式为使本领域技术人员更好地理解本公开的技术方案,下面结合附图和实施例对本公开作进一步详细描述。实施例1:如图1所示,本实施例提供一种语音交互设备唤醒词生成方法,包括如下步骤S101至S104。S101.获取预设时间段内用户的语音交互数据。本步骤具体为,识别并存储用户上传的预设时间段内的语音交互数据。S102.采用机器学习算法对所述语音交互数据进行聚类,以得到多个类。其中,聚类是指将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。S103.选取所述多个类中的至少一个类,分别将各个已选类的语音交互数据作为输入,采用聚类算法输出每个已选类对应的唤醒词。其中,聚类算法(clusteringalgorithm)可包括划分聚类法、层次聚类法、基于密度的聚类法和基于网格的聚类法等。本领域技术人员可根据实际情况来选择具体的聚类算法。本步骤中,在从所述多个类中选取至少一个类时,可根据用户习惯或实际应用情况进行选取。当然,也可以选取所述多个类的全部。S104.向所述用户推送所述唤醒词。本实施例中,提前获取预设时间段内用户的语音交互数据以统计用户习惯,然后采用机器学习算法对该用户的语音交互数据进行聚类分析,以生成符合该用户习惯的语音唤醒词并推送给该用户,即为不同用户生成有差异且有针对性的唤醒词,从而能为不同用户提供差异化的语音唤醒服务,极大地提升了用户体验,还能加快语音交互技术的发展。为了实现更快速、更准确的聚类,可对步骤S101获取的语音交互数据进行预处理:去掉无意义词汇(如的、嗯)并进行分词处理,然后在步骤S102中再对分词后的语音交互数据进行聚类。因此在步骤S101和步骤S102之间,所述唤醒词生成方法还可包括如下步骤:去掉所述语音交互数据中的无意义词汇并进行分词处理。则所述步骤S102相应为:采用机器学习算法对分词后的语音交互数据进行聚类,以得到多个类。本实施例中,无意义的词汇指的是不涉及唤醒功能的词汇,可包括语气词、具有个人色彩的口头禅等。所述分词处理的具体方法包括基于字符本文档来自技高网...

【技术保护点】
1.一种语音交互设备唤醒词生成方法,其特征在于,包括如下步骤:获取预设时间段内用户的语音交互数据;采用机器学习算法对所述语音交互数据进行聚类,以得到多个类;选取所述多个类中的至少一个类,分别将各个已选类的语音交互数据作为输入,采用聚类算法输出每个所述已选类对应的唤醒词;向所述用户推送所述唤醒词。

【技术特征摘要】
1.一种语音交互设备唤醒词生成方法,其特征在于,包括如下步骤:获取预设时间段内用户的语音交互数据;采用机器学习算法对所述语音交互数据进行聚类,以得到多个类;选取所述多个类中的至少一个类,分别将各个已选类的语音交互数据作为输入,采用聚类算法输出每个所述已选类对应的唤醒词;向所述用户推送所述唤醒词。2.根据权利要求1所述的生成方法,其特征在于,在所述获取预设时间段内用户的语音交互数据的步骤之后还包括如下步骤:去掉所述语音交互数据中的无意义词汇并进行分词处理;则所述采用机器学习算法对所述语音交互数据进行聚类的步骤相应为:采用机器学习算法对分词后的所述语音交互数据进行聚类。3.根据权利要求2所述的生成方法,其特征在于,所述采用机器学习算法对分词后的所述语音交互数据进行聚类,以得到多个类的步骤具体包括:根据分词后的所述语音交互数据,生成用户词典;根据所述用户词典,将分词后的所述语音交互数据转换为向量;采用聚类算法对转换后的所述向量进行聚类,以得到M个类,其中M为大于2的整数。4.根据权利要求3所述的生成方法,其特征在于,在所述采用聚类算法对转换后的所述向量进行聚类,以得到M个类的步骤之后还包括如下步骤:根据聚类后得到的M个类的大小进行排序,选取排名前N位的类,其中,N为大于1的整数;则所述选取所述多个类中的至少一个类的步骤具体为:在所述排名前N位的类中选取排名靠前的至少一个类。5.根据权利要求1-4中任一项所述的生成方法,其特征在于,在所述向所述用户推送所述唤醒词的步骤之后还包括如下步骤:接收所述用户输出的唤醒词反馈信息,所述唤醒词反馈信息包括唤醒词确认信息和唤醒词修正信息;若接收到所述唤醒词确认信息,则保持所述唤醒词不变;若接收到所述唤醒词修正信息,则继续接收所述用户提供...

【专利技术属性】
技术研发人员:刘馨靖
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1