设置唤醒词的方法和装置、机器可读存储介质及处理器制造方法及图纸

技术编号:21361285 阅读:25 留言:0更新日期:2019-06-15 09:19
本发明专利技术实施例提供一种设置唤醒词的方法和装置、机器可读存储介质及处理器,属于唤醒词技术领域。该方法包括:接收待设置唤醒词;根据预设字音素编码库,确定所述待设置唤醒词中的每个字的音素编码,以获取所述待设置唤醒词的音素编码;确定所述待设置唤醒词的音素编码与预设规避音素编码的规避相似度;基于规避相似度与预设规避相似度,判定所述待设置唤醒词的合理性;以及在所述待设置唤醒词不合理的情况下,屏蔽所述待设置唤醒词。藉此,实现了屏蔽具有与需规避词相同音或者相近音的所有词。

Methods and devices for setting wake-up words, machine-readable storage media and processors

The embodiment of the invention provides a method and device for setting wake-up words, a machine-readable storage medium and a processor, belonging to the technical field of wake-up words. The method includes: receiving the awakening words to be set; determining the phoneme coding of each word in the awakening words to be set according to the preset phoneme coding library to obtain the phoneme coding of the awakening words to be set; determining the evasive similarity between the phoneme coding of the awakening words to be set and the preset evasive phoneme coding; and determining the pending words based on the evasive similarity and the preset evasive similarity. The rationality of setting the wake-up words and shielding the wake-up words when the wake-up words to be set are unreasonable. Thus, all words with the same or similar pronunciation as the words to be avoided are shielded.

【技术实现步骤摘要】
设置唤醒词的方法和装置、机器可读存储介质及处理器
本专利技术涉及唤醒词
,具体地涉及一种设置唤醒词的方法和装置、机器可读存储介质及处理器。
技术介绍
现有技术中规避脏话及敏感词的方法是通过词与词的比较,现在规定如果设置的唤醒词的音与脏话及敏感词的音相同或者相近的话,也是不行的。但是,目前还没有办法可以解决规避与脏话及敏感词的音相同或相近的词。
技术实现思路
本专利技术的目的是提供一种设置唤醒词的方法和装置、机器可读存储介质及处理器,其可解决或至少部分解决上述的问题。为了实现上述目的,本专利技术的一个方面提供一种用于设置唤醒词的方法,该方法包括:接收待设置唤醒词;根据预设字音素编码库,确定所述待设置唤醒词中的每个字的音素编码,以获取所述待设置唤醒词的音素编码;确定所述待设置唤醒词的音素编码与预设规避音素编码的规避相似度;基于规避相似度与预设规避相似度,判定所述待设置唤醒词的合理性;以及在所述待设置唤醒词不合理的情况下,屏蔽所述待设置唤醒词。可选地,该方法还包括:将所述待设置唤醒词与预设语气词库进行比较,以判断所述待设置唤醒词中是否存在语气词;以及在所述待设置唤醒词中存在语气词的情况下本文档来自技高网...

【技术保护点】
1.一种用于设置唤醒词的方法,其特征在于,该方法包括:接收待设置唤醒词;根据预设字音素编码库,确定所述待设置唤醒词中的每个字的音素编码,以获取所述待设置唤醒词的音素编码;确定所述待设置唤醒词的音素编码与预设规避音素编码的规避相似度;基于规避相似度与预设规避相似度,判定所述待设置唤醒词的合理性;以及在所述待设置唤醒词不合理的情况下,屏蔽所述待设置唤醒词。

【技术特征摘要】
1.一种用于设置唤醒词的方法,其特征在于,该方法包括:接收待设置唤醒词;根据预设字音素编码库,确定所述待设置唤醒词中的每个字的音素编码,以获取所述待设置唤醒词的音素编码;确定所述待设置唤醒词的音素编码与预设规避音素编码的规避相似度;基于规避相似度与预设规避相似度,判定所述待设置唤醒词的合理性;以及在所述待设置唤醒词不合理的情况下,屏蔽所述待设置唤醒词。2.根据权利要求1所述的方法,其特征在于,该方法还包括:将所述待设置唤醒词与预设语气词库进行比较,以判断所述待设置唤醒词中是否存在语气词;以及在所述待设置唤醒词中存在语气词的情况下,屏蔽所述待设置唤醒词。3.根据权利要求1所述的方法,其特征在于,所述接收待设置唤醒词包括所述待设置唤醒词以语音和/或文字的形式被接收。4.根据权利要求1-3中任一项所述的方法,其特征在于,在所述接收待设置唤醒词之前,该方法还包括:登录账号,以使得被设置的唤醒词与所登录的账号绑定。5.根据权利要求1-3中任一项所述的方法,其特征在于,该方法还包括:在所述待设置唤醒词合理的情况下,判断所述待设置唤醒词中字的数量是否小于或等于预设值;以及在所述待设置唤醒词中字的数量小于或等于所述预设值的情况下,为所述待设置唤醒词加上预设前缀。6.一种用于设置唤醒词的装置,其特征在于,该装置包括:接收模块,用于接收待设置唤醒词;词音素编码获取模块,用于根据预设字音素编码库,确定所述待设置唤醒词中的每个字的音素编码,以获取所述待设置唤醒词的音素编码;规避相似度确...

【专利技术属性】
技术研发人员:陈立平刘勍
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1