The invention discloses a voice processing method of the robot, the voice processing method comprises the following steps: S1, the preprocessing stage, according to the special characters to punctuate the text analysis, text segmentation will be cut for only Chinese sentences, the sentence is the basic unit of word processing, the next step; the special characters including English letters, numbers and punctuation; S2: the phrase sentence for bidirectional maximum matching, two-way matching, in accordance with the principle of priority of long word, the results of segmentation as the input of S3; S3: comparison of step segmentation results, to determine whether there is ambiguity. If there is some ambiguity, disambiguation; S4: repeat S2 and S3 till all the sentences in a sentence unit step divided.
【技术实现步骤摘要】
一种机器人的语音处理方法
本专利技术属于互联网
,尤其涉及一种机器人的语音处理方法。
技术介绍
随着社会的发展,通讯工具变得越来越多样化,各种即时通讯应用程序大大丰富了人们之间的相互流通与交流的方式,在各种电子终端上就可以发送文字、语音、视频消息,更具有各种群组功能。然而,现有的各种即时通讯应用程序一般都是按照一个客户端一个用户的方式设计的,也就是说输出消息的对象就是当前的用户,而且播放、输出消息的操作也依赖于当前用户的交互操作。用户在聊天时的一个显著特点是所提出的话题一般都是比较短小的,而不是长篇大论,不具有段落篇章结构,绝大多数就是少数几句话。基于统计的分词方法适用于有段落、篇章结构以及上下文关系的文段。基于理解的分词方法目前并不成熟,且时间复杂度高,速度慢。因此,需要一种新的机器人的语音处理方法来克服上述技术中的缺陷。
技术实现思路
针对现有技术的不足,本专利技术的目的是提供一种新的机器人的语音处理方法,使得机器人能够在短时间以内识别更多语言,简单方便快速的进行沟通。一种机器人的语音处理方法,所述语音处理方法包括以下步骤:S1:预处理阶段,按照特殊字符将待分析文本进行断句,将待切分的文本切分为只有中文的短句,所述短句是下一步分词处理的基本单位;其中,所述特殊字符包括英文字母、数字和标点符号。S2:对短句出来的句子进行双向最大匹配分词,按照双向匹配、长词优先的原则进行,分词后的结果作为S3的输入;S3:对上一步分词得到的结果进行比较,判断是否存在歧义,如果存在歧义,就进行一定的歧义消解;S4:重复S2、S3,直到处理完步骤一中断句所切分出的所有句子单 ...
【技术保护点】
一种机器人的语音处理方法,其特征在于,所述语音处理方法包括以下步骤:S1:预处理阶段,按照特殊字符将待分析文本进行断句,将待切分的文本切分为只有中文的短句,所述短句是下一步分词处理的基本单位;其中,所述特殊字符包括英文字母、数字和标点符号;S2:对短句出来的句子进行双向最大匹配分词,按照双向匹配、长词优先的原则进行,分词后的结果作为S3的输入;S3:对上一步分词得到的结果进行比较,判断是否存在歧义,如果存在歧义,就进行一定的歧义消解;S4:重复S2、S3,直到处理完步骤一中断句所切分出的所有句子单元。
【技术特征摘要】
1.一种机器人的语音处理方法,其特征在于,所述语音处理方法包括以下步骤:S1:预处理阶段,按照特殊字符将待分析文本进行断句,将待切分的文本切分为只有中文的短句,所述短句是下一步分词处理的基本单位;其中,所述特殊字符包括英文字母、数字和标点符号;S2:对短...
【专利技术属性】
技术研发人员:彭建盛,覃勇,彭金松,苗剑,
申请(专利权)人:河池学院,
类型:发明
国别省市:广西,45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。