语音输入处理方法和装置制造方法及图纸

技术编号:19967334 阅读:29 留言:0更新日期:2019-01-03 14:27
本申请提出一种语音输入处理方法和装置,其中,方法包括:将当前获取的语音数据转换为文本数据,判断文本数据中是否包括预设的关键词,若包括,则对文本数据进行语义识别,确定当前文本数据对应的编辑方式及编辑对象,根据编辑方式,对编辑对象进行编辑。该方法实现了通过语音对文本进行编辑,提高了文本处理的智能化程度。同时,在识别到预设关键词时,开始通过语音进行编辑,避免了误操作,提高了操作的精准度。

Speech Input Processing Method and Device

This application proposes a voice input processing method and device. The method includes: converting the currently acquired voice data into text data, judging whether the text data includes preset keywords or not, semantically identifying the text data, determining the corresponding editing mode and object of the current text data, and editing the editing object according to the editing mode. Collection. This method realizes text editing through voice, and improves the intellectualization of text processing. At the same time, when the preset keywords are recognized, they are edited by voice, which avoids misoperation and improves the accuracy of operation.

【技术实现步骤摘要】
语音输入处理方法和装置
本申请涉及语音处理术领域,尤其涉及一种语音输入处理方法和装置。
技术介绍
目前,用户可以利用输入法在终端提供的文档中,或者浏览器的搜索框,或者聊天软件的输入框中输入文字。在实际应用中,当输入的文字存在错误,或者用户想要改变文字的显示方式等,即当用户想要编辑文字时,仍然需要手动操作进行编辑,智能化程度较低。
技术实现思路
本申请实施例提出一种语音输入处理方法,以实现通过语音对文本进行编辑,大大提高了文本处理的智能化程度。本申请实施例提出一种语音输入处理装置。本申请实施例提出一种终端设备。本申请实施例提出一种非暂态计算机可读存储介质。本申请一方面实施例提出了一种语音输入处理方法,包括:将当前获取的语音数据转换为文本数据;判断所述文本数据中是否包括预设的关键词;若包括,则对所述文本数据进行语义识别,确定所述当前文本数据对应的编辑方式及编辑对象;根据所述编辑方式,对所述编辑对象进行编辑。本申请实施例的语音输入处理方法,通过将当前获取的语音数据转换为文本数据,判断文本数据中是否包括预设的关键词,若包括,则对文本数据进行语义识别,确定当前文本数据对应的编辑方式及编辑对象,根据编辑方式,对编辑对象进行编辑。由此,实现了通过语音对文本进行编辑,提高了文本处理的智能化程度。同时,在识别到预设关键词时,开始通过语音进行编辑,避免了误操作,提高了操作的精准度。本申请另一方面实施例提出了一种语音输入处理装置,包括:转换模块,用于将当前获取的语音数据转换为文本数据;判断模块,用于判断所述文本数据中是否包括预设的关键词;第一确定模块,用于在文本数据中包括预设的关键词时,对所述文本数据进行语义识别,确定所述当前文本数据对应的编辑方式及编辑对象;编辑模块,用于根据所述编辑方式,对所述编辑对象进行编辑。本申请实施例的语音输入处理装置,通过将当前获取的语音数据转换为文本数据,判断文本数据中是否包括预设的关键词,若包括,则对文本数据进行语义识别,确定当前文本数据对应的编辑方式及编辑对象,根据编辑方式,对编辑对象进行编辑。由此,实现了通过语音对文本进行编辑,提高了文本处理的智能化程度。同时,在识别到预设关键词时,开始通过语音进行编辑,避免了误操作,提高了操作的精准度。本申请另一方面实施例提出了一种终端设备,包括:存储器和处理器,其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述一方面实施例所述的语音输入处理方法。本申请另一方面实施例提出了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述一方面实施例所述的语音输入处理方法。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请实施例提供的一种语音输入处理方法的流程示意图;图2为本申请实施例提供的一种确定当前文本数据对应的编辑方式及编辑对象的方法的流程示意图;图3为本申请实施例提供的另一种确定当前文本数据对应的编辑方式及编辑对象的方法的流程示意图;图4为本申请实施例提供的另一种语音输入处理方法的流程示意图;图5为本申请实施例提供的一种语音输入处理装置的结构示意图;图6是图示根据本申请实施例的终端设备的硬件结构示意图;图7是图示根据本申请的实施例的非暂态计算机可读存储介质的示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的语音输入处理方法和装置。本申请实施例,针对相关技术中在输入文字的过程中,仍然需要手动编辑文本的问题,本申请实施例提供一种语音输入处理方法。本申请实施例的语音输入处理方法,通过将当前获取的语音数据转换为文本数据,判断文本数据中是否包括预设的关键词,若包括,则对文本数据进行语义识别,确定当前文本数据对应的编辑方式及编辑对象,根据编辑方式,对编辑对象进行编辑。由此,实现了通过语音对文本进行编辑,提高了文本处理的智能化程度。同时,在识别到预设关键词时,开始通过语音进行编辑,避免了误操作,提高了操作的精准度。图1为本申请实施例提供的一种语音输入处理方法的流程示意图。本申请实施例提供的语音输入处理方法,可以由本申请提供的语音输入处理装置执行,上述装置可配置于终端设备中,以实现通过语音对文本进行编辑。本实施例中,终端设备可以是手机、平板电脑、个人数字助理、等具有各种操作系统、触摸屏和/或显示屏的硬件设备。如图1所示,该语音输入处理方法包括:步骤101,将当前获取的语音数据转换为文本数据。作为一种应用场景,本申请实施例的语音输入处理方法,可以对文档中的文本进行编辑,当用户在终端设备的文档中输入文字和标点后,可以通过终端设备上设置的麦克风实时采集语音。在采集到语音后,通过语音识别技术将获取的语音数据转换为文本数据,以判断是否对文档中的文本进行编辑,例如进行复制、粘贴、替换等等。作为另一种应用场景,在用户通过聊天软件聊天的过程中,可以通过终端设备上设置的麦克风阵列实时采集语音。在采集到语音后,将获取的语音数据转换为文本数据,对获取的语音数据识别为文本数据,以确定是否对输入框中的文字或者聊天记录中的文字进行编辑。需要说明的是,上述文档中的文字或者输入框中的文字,可以是用户通过键盘等输入的,也可以是通过语音输入的文字,本实施例对此不作限制。并且,上述应用场景仅是示例,本申请实施例提出的语音输入处理方法,还可以应用在其他需要对文字进行编辑的场景中。步骤102,判断文本数据中是否包括预设的关键词。为了使编辑更加精准,本实施例中,可以预先设置关键词,通过关键字,确定是否开始进行编辑。其中,预设的关键词可以是一个或者多个。当预设的关键词为一个时,将文本数据中的每个字符与预设的关键词进行比对,当文本数据中存在连续的字符组成的词,与预设的关键词一致时,可以认为文本数据中包括预设的关键词。当预设的关键词有多个时,可以分别将文本数据与预设关键词进行比对,当文本数据与其中一个关键词一致时,可以确定文本数据中包括预设的关键词。需要说明的是,预设的关键词在文本数据中的位置,可以是在句首,也是在句尾,本实施例对此不作限定。举例来说,预设关键词为“小欧”,将当前获取的语音数据转换为的文本数据为“小欧,将上一句话中的简易换成易用”,通过比对可以确定文本数据中包括预设的关键词“小欧”。当然,文本数据也可以为“将上一句话中的简易换成易用,小欧”。步骤103,若包括,则对文本数据进行语义识别,确定当前文本数据对应的编辑方式及编辑对象。本实施例中,当文本数据包括预设的关键词时,说明当前获取的语音数据是用于对文字进行编辑的语音。在确定文本数据中包括预设的关键词后,根据文本数据确定编辑方式及编辑对象。其中,编辑方式包括但不限于保存、复制、粘贴、剪切、替换、设置样式等等,编辑对象是指需要进行处理的文本、文档等等。其中,设置样式包括改变字本文档来自技高网...

【技术保护点】
1.一种语音输入处理方法,其特征在,包括:将当前获取的语音数据转换为文本数据;判断所述文本数据中是否包括预设的关键词;若包括,则对所述文本数据进行语义识别,确定所述当前文本数据对应的编辑方式及编辑对象;根据所述编辑方式,对所述编辑对象进行编辑。

【技术特征摘要】
1.一种语音输入处理方法,其特征在,包括:将当前获取的语音数据转换为文本数据;判断所述文本数据中是否包括预设的关键词;若包括,则对所述文本数据进行语义识别,确定所述当前文本数据对应的编辑方式及编辑对象;根据所述编辑方式,对所述编辑对象进行编辑。2.如权利要求1所述的方法,其特征在于,所述对所述文本数据进行语义识别,确定所述当前文本数据对应的编辑方式及编辑对象,包括:利用预设的各语义模型,对所述文本数据进行语义识别,以确定所述文本数据与所述各语义模型的匹配度;根据所述文本数据与所述各语义模型的匹配度,确定所述编辑方式及编辑对象。3.如权利要求1所述的方法,其特征在于,所述对所述文本数据进行语义识别,确定所述当前文本数据对应的编辑方式,包括:根据所述文本数据与各编辑方式对应的目标文本的相似度,确定所述文本数据对应的编辑方式。4.如权利要求3所述的方法,其特征在于,所述确定所述文本数据对应的编辑方式之后,还包括:根据所述编辑方式,确定对象识别方式;根据所述对象识别方式,对所述文本数据进行识别处理,确定所述编辑对象。5.如权利要求1-4任一所述的方法,其特征在于,历史文本数据中包括N个编辑对象,其中,历史文本数据为根据获取的历史语音数据生成的文本数据;所述根据所述编辑方式,对所述编辑对象进行编辑之前,还包括:确定所述历史文本数据中待编辑的目标编辑对象。6.如权利要求5所述的方法,其...

【专利技术属性】
技术研发人员:王映理
申请(专利权)人:天津字节跳动科技有限公司
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1