一种分词处理方法和移动终端技术

技术编号:21247283 阅读:18 留言:0更新日期:2019-06-01 07:33
本发明专利技术公开了一种分词处理方法和移动终端,所述方法包括:在确定对待处理文本进行分词处理的目标分词规则包括至少两种分词规则的情况下,利用第i个分词规则对待处理文本进行分词处理,得到第i级分词结果,利用第i+1个分词规则对所述第i级分词结果进行处理,得到第i+1级分词结果;输出第N级分词结果作为所述待处理文本的分词结果。通过本发明专利技术,用户可以按照自身需求选择想要优先使用的分词规则,输出最贴近用户需求的分词结果,提升用户体验。

A Word Segmentation Processing Method and Mobile Terminal

The invention discloses a word segmentation processing method and a mobile terminal. The method includes: in the case of determining that the target word segmentation rule for processing text includes at least two word segmentation rules, the processing text is treated by the first word segmentation rule, and the result of the first word segmentation is obtained, and the result of the second word segmentation is located by using the rule of the first word segmentation. The segmentation result of level I + 1 is obtained, and the segmentation result of level N is output as the segmentation result of the text to be processed. According to the invention, the user can select the segmentation rules that he wants to use first according to his own needs, output the segmentation results closest to the user's needs, and enhance the user experience.

【技术实现步骤摘要】
一种分词处理方法和移动终端
本专利技术涉及文本处理领域,尤其涉及一种分词处理方法和移动终端。
技术介绍
在智能识别屏幕文字的功能出现之前,移动终端无法自动识别并提取屏幕上显示的文字,在用户需要获取屏幕上显示的内容的关键信息时,需要用户手动重新输入,不便于用户操作,进而造成用户体验效果不佳。随着技术的发展,为了便于用户操作,移动终端能够对当前屏幕的文字进行识别并提取,以供用户选择自身所需要的关键信息,但现有技术中,是利用单一的分词策略将当前屏幕上的文字进行分词,进而造成用户体验效果不佳。
技术实现思路
本专利技术实施例提供一种分词处理方法和移动终端,以解决现有技术中利用单一的分词策略将当前屏幕上的文字进行分词,进而造成用户体验效果不佳的问题。为了解决上述技术问题,本专利技术是这样实现的:第一方面,提供了一种分词处理方法,包括:在确定对待处理文本进行分词处理的目标分词规则包括至少两种分词规则的情况下,利用第i个分词规则对待处理文本进行分词处理,得到第i级分词结果,利用第i+1个分词规则对所述第i级分词结果进行处理,得到第i+1级分词结果;输出第N级分词结果作为所述待处理文本的分词结果;所述第i个分词规则的使用优先级高于所述第i+1个分词规则的使用优先级,i=1,…N-1,N为大于或等于2的正整数。第二方面,提供了一种移动终端,包括:分词模块,用于在目标分词规则包括N种分词规则的情况下,利用第i个分词规则对待处理文本进行分词处理,得到第i级分词结果,利用第i+1个分词规则对所述第i级分词结果进行处理,得到第i+1级分词结果;其中,所述第i个分词规则的使用优先级高于所述第i+1个分词规则的使用优先级,i=1,…N-1,N为大于或等于2的正整数;输出模块,用于输出第N级分词结果作为所述待处理文本的分词结果。第三方面,提供了一种移动终端,该移动终端包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的方法的步骤。在本专利技术实施例中,能够提供多种分词规则,并按照多种分词规则对应的使用优先级对待处理文本进行分词处理,输出分词处理后的分词结果,使得用户可以按照自身需求选择想要优先使用的分词规则,输出最贴近用户需求的分词结果,提升了用户体验。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术的一个实施例提供的一种分词处理方法的流程图;图2是本专利技术一个实施例提供的一种显示界面的示意图;图3是本专利技术另一个实施例提供的一种显示界面的示意图;图4是本专利技术一个实施例提供的一种移动终端的结构示意图;图5是本专利技术另一个实施例提供的一种移动终端的结构示意图;图6是实现本专利技术各个实施例的一种移动终端的硬件结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1是本专利技术的一个实施例提供的一种分词处理方法的流程图。如图1所示的分词处理方法,可以包括:步骤102、在确定对待处理文本进行分词处理的目标分词规则包括至少两种分词规则的情况下,利用第i个分词规则对待处理文本进行分词处理,得到第i级分词结果,利用第i+1个分词规则对所述第i级分词结果进行处理,得到第i+1级分词结果;其中,所述第i个分词规则的使用优先级高于所述第i+1个分词规则的使用优先级,i=1,…N-1,N为大于或等于2的正整数。具体的,按照至少两种分词规则对应的使用优先级对待处理文本进行分词处理时,先利用使用优先级级别最高的分词规则对待处理文本进行分词处理,得到第一级待处理分词结果,之后,利用下一级使用优先级的分词规则对上一级待处理分词结果进行分词处理。示例性的,目标分词规则包括:第一分词规则、第二分词规则和第三分词规则共三种分词规则,其中,第一分词规则的使用优先级大于第二分词规则的使用优先级,第二分词规则的使用优先级大于第三分词规则的使用优先级,在按照至少两种分词规则对应的使用优先级对待处理文本进行分词处理时,首先,使用第一分词规则对待处理文本进行分词处理,得到第一级分词结果,然后,使用第二分词规则对第一级分词结果进行分词处理,得到第二级分词结果,最后,使用第三分词规则对第二级分词结果进行分词处理,得到第三极分词结果。步骤104、输出第N级分词结果作为所述待处理文本的分词结果。具体的,可以在屏幕上显示所述待处理文本的分词结果。本专利技术实施例,能够提供多种分词规则,并按照多种分词规则对应的使用优先级对待处理文本进行分词处理,输出分词处理后的分词结果,使得用户可以按照自身需求选择想要优先使用的分词规则,输出最贴近用户需求的分词结果,提升了用户体验。在本专利技术的一实施方式中,至少两种分词规则包括第一分词规则,以及,还包括第二分词规则与第三分词规则中的至少一项;换言之,至少两种分词规则包括第一分词规则和第二分词规则,或者,至少两种分词规则包括第一分词规则和第三分词规则,或者,至少两种分词规则包括第一分词规则、第二分词规则和第三分词规则。其中,第二分词规则为按照词语字数进行分词的规则,第三分词规则为按照词语类型进行分词的规则,第二分词规则、第三分词规则的使用优先级高于第一分词规则的使用优先级。具体的,词语字数为词语包括的字数,词语类型为词语所属的类型。示例性的,词语字数为4个,词语类型为国家或者姓名。具体的,第一分词规则为按照常用词语进行分词的规则。通过本实施例,可以对待处理文本按照词语字数优先进行分词处理,或者对待处理文本按照词语类型优先进行分词处理,或者对待处理文本按照词语字数与词语类型优先进行分词处理,使得输出的分词结果符合用户对词语字数、或者词语类型、或者词语字数与词语类型的需求。在本专利技术的一实施方式中,步骤104可以包括:根据目标显示规则显示分词处理后的分词结果。其中,目标显示规则为将分词处理后的分词结果中使用优先级最高的分词规则对应的第一子分词结果与第二子分词结果进行区别显示,第二子分词结果为分词结果中除第一子分词结果之外的子分词结果。具体的,将第一子分词结果排列在第二子分词结果的前面,以对第一子分词结果与第二子分词结果进行区别显示;或者,将第一子分词结果进行区别于第二子分词结果的高亮标注,以对第一子分词结果与第二子分词结果进行区别显示;或者,将第一子分词结果以区别于第二子分词结果的字体和/或颜色进行区别显示,以对第一子分词结果与第二子分词结果进行区别显示。本实施例,将对分词处理后的分词结果中使用优先级最高的分词规则对应的第一子分词结果与其余分词结果进行区别显示,以便于用户直观地看到符合自身需求的词语。在本专利技术的一实施方式中,至少两种分词规则包括第一分词规则以及第三分词规则,第三分词规则为按照词语类型进行分词的规则,第三分词规则的使用优先级高于第一分词规则的使用优先级。具体的,词语类型为词语所属的类型。示例性的,词语类型为国家或者姓名。具体的,第一分词规则为按照常用词语进行分本文档来自技高网...

【技术保护点】
1.一种分词处理方法,其特征在于,包括:在目标分词规则包括至少两种分词规则的情况下,利用第i个分词规则对待处理文本进行分词处理,得到第i级分词结果,利用第i+1个分词规则对所述第i级分词结果进行处理,得到第i+1级分词结果;输出第N级分词结果作为所述待处理文本的分词结果;其中,所述第i个分词规则的使用优先级高于所述第i+1个分词规则的使用优先级,i=1,…N‑1,N为大于或等于2的正整数。

【技术特征摘要】
1.一种分词处理方法,其特征在于,包括:在目标分词规则包括至少两种分词规则的情况下,利用第i个分词规则对待处理文本进行分词处理,得到第i级分词结果,利用第i+1个分词规则对所述第i级分词结果进行处理,得到第i+1级分词结果;输出第N级分词结果作为所述待处理文本的分词结果;其中,所述第i个分词规则的使用优先级高于所述第i+1个分词规则的使用优先级,i=1,…N-1,N为大于或等于2的正整数。2.如权利要求1所述的方法,其特征在于,所述N种分词规则包括第一分词规则,以及,还包括第二分词规则与第三分词规则中的至少一项;其中,所述第二分词规则为按照词语字数进行分词的规则,所述第三分词规则为按照词语类型进行分词的规则,所述第二分词规则、所述第三分词规则的使用优先级高于所述第一分词规则的使用优先级。3.如权利要求1所述的方法,其特征在于,所述输出第N级分词结果作为所述待处理文本的分词结果,包括:根据目标显示规则显示所述分词结果,所述目标显示规则为将所述分词结果中使用优先级最高的分词规则对应的第一子分词结果与第二子分词结果进行区别显示,所述第二子分词结果为所述分词结果中除所述第一子分词结果之外的子分词结果。4.如权利要求1所述的方法,其特征在于,所述N种分词规则包括第一分词规则以及第三分词规则,所述第三分词规则为按照词语类型进行分词的规则,所述第三分词规则的使用优先级高于所述第一分词规则的使用优先级;所述利用第i个分词规则对待处理文本进行分词处理,得到第i级分词结果,利用第i+1个分词规则对所述第i级分词结果进行处理,得到第i+1级分词结果,包括:在获取到用于确定所述第三分词规则对应的词语类型的关键词的情况下,按照所述第三分词规则对所述待处理文本进行分词处理,得到第一级分词结果,按照所述第一分词规则对所述第一级分词结果进行分词处理,得到第二级分词结果。5.如权利要求4所述的方法,其特征在于,所述利用第i个分词规则对待处理文本进行分词处理,得到第i级分词结果,利用第i+1个分词规则对所述第i级分词结果进行处理,得到第i+1级分词结果,还包括:在未获取到用于确定所述第三分词规则对应的词语类型的关键词的情况下,按照所述第一分词规则对所述待处理文本进行分词处理,得到至少一个推荐关键词,并推送所述至少一个推荐关键词;获取用户在所述至少一个推荐关键词中选择的目标关键词,根据所述目标关键词确定所述第三分词规则对应的词语类型,按照所述第三分词规则对应的所述词语类型对所述待处理文本进行分词处理,得到第一级分词结果,按照所述第一分词规则对所述第一级分词结果进行分词处理,...

【专利技术属性】
技术研发人员:赵俊杰
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1