一种语句拆分的方法、装置及设备制造方法及图纸

技术编号:18763788 阅读:129 留言:0更新日期:2018-08-25 10:29
本说明书公开一种语句拆分的方法、装置及设备,该方法中在获取到的语句后,可以从预先保存的各句式结构模型中,确定用于拆分该语句的句式结构模型,并根据确定出的该句式结构模型,拆分该语句。而后,根据确定出的该句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系。

【技术实现步骤摘要】
一种语句拆分的方法、装置及设备
本说明书涉及计算机
,尤其涉及一种语句拆分的方法、装置及设备。
技术介绍
句法分析是自然语言领域中的一个重要部分,通过句法分析可以完成关键词识别、自动问答、机器翻译、信息抽取等与自然语言相关的任务。在各句法分析方式中,依存句法分析是一个重要的分支,其主要是将语句拆解成若干单字或词,然后依据各单字或词在该语句中所充当的句子成分,对该单字或词的依存关系进行标注,并根据得到的标注结果,完成对该语句的分析。在现有技术中,通常都是需要专业技能较高的专业人士,人工的将语句拆解成若干单字或词,并依据经验,判断各单字或词在该语句中所充当的句子成分,以及完成对这些单字或词的依存关系的标注工作。基于现有技术,需要更为便捷有效的语句拆分方式。
技术实现思路
本说明书提供一种语句拆分的方法,用以解决现有技术的语句拆分方式会给用户带来不便的问题。本说明书提供了一种语句拆分的方法,包括:获取语句;在预先保存的各句式结构模型中,确定用于拆分所述语句的句式结构模型,并根据确定出的所述句式结构模型,拆分所述语句;根据确定出的所述句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系。本说明书提供一种语句拆分的装置,用以解决现有技术的语句拆分方式会给用户带来不便的问题。本说明书提供了一种语句拆分的装置,包括:获取模块,获取语句;拆分模块,在预先保存的各句式结构模型中,确定用于拆分所述语句的句式结构模型,并根据确定出的所述句式结构模型,拆分所述语句;标注模块,根据确定出的所述句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系。本说明书提供一种语句拆分的设备,用以解决现有技术的语句拆分方式会给用户带来不便的问题。本说明书提供了一种语句拆分的设备,包括一个或多个存储器以及处理器,所述存储器存储程序,并且被配置成由所述一个或多个处理器执行以下步骤:获取语句;在预先保存的各句式结构模型中,确定用于拆分所述语句的句式结构模型,并根据确定出的所述句式结构模型,拆分所述语句;根据确定出的所述句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系。本说明书采用的上述至少一个技术方案能够达到以下有益效果:在本说明书一个或多个实施例中,在获取到的语句后,可以从预先保存的各句式结构模型中,确定用于拆分该语句的句式结构模型,并根据确定出的该句式结构模型,拆分该语句。而后,根据确定出的该句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系。由于在获取到语句后,可以通过确定出的句式结构模型对该语句实施自动拆分,并可根据确定出的该句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,自动标注拆分得到的各语法单位之间的依存关系。这样就极大的降低了语句拆分工作的门槛,给用户在语句拆分的过程中带来了极大的方便。附图说明此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:图1为本说明书提供的对语句进行标注的示意图;图2为本说明书提供的语句拆分过程的示意图;图3为本说明书提供的终端逐步对拆分队列中的语句实施拆分的示意图;图4为本说明书提供的一种语句拆分的装置示意图;图5为本说明书提供的一种语句拆分的设备示意图。具体实施方式在实际应用中,业务人员可以通过依存句法分析的方式,对语句进行拆分,并根据拆分得到的各单字或词在该语句中所充当的句子成分,对各单字或词之间的依存关系进行标注,进而根据标注出的依存关系,完成诸如自动问答、机器翻译等相关任务,如图1所示。图1为本说明书提供的对语句进行标注的示意图。假设业务人员需要对“我忘记密码了”这一语句进行拆分,该语句是一个典型的主谓宾结构,因此可先拆分成“我”、“忘记”、“密码了”这三个拆分结果。在这三个拆分结果中,“我”、“忘记”这两个拆分结果属于不可拆分的语句,“密码了”属于可以拆分的语句,其中,“了”属于“忘记”这一谓语的修饰语,因此最终可以拆分出“我”、“忘记”、“密码”、“了”这四个语法单位。其中,本说明书提到的语法单位可以是指无需进一步拆分的语句。而后,根据这四个语法单位在整个语句中所充当的句子成分,可以对这四个语法单位之间的依存关系进行标注,如图1所示。在图1中,subj表示“我”是“忘记”这一动作的主语,obj表示“密码”是“忘记”这一动作的宾语,tmod表示“了”用于修饰“忘记”这一谓语动作,表征“忘记”这一谓语动作在时间上的状态,即,已经忘记。通过图1中可以看出,以“忘记”这一语句作为核心词出发,对应“忘记”这一动作的主语、宾语、修饰语均能一目了然的从图1中标注出的依存关系得出,从而可以通过标注出的该语句中各语法单位的依存关系,完成诸如自动问答、机器翻译等相关任务。然而,在现有技术中,业务人员通常都是通过人工的方式对语句进行拆分的,这就需要业务人员需要具备较高的词性分析能力,才能准确的对语句中的各语法单位之间的依存关系进行标注。也即,当前的标注工作对于业务人员来说,门槛较高。不仅如此,通过人工的方式对语句中的各语法单位之间的依存关系进行标注,将极大的耗费业务人员的经历,成本较高,也即,通过人工的方式对语句中的各语法单位之间的依存关系进行标注将会给业务人员带来极大的不便。为此,在本说明书中,在获取到的语句后,可以从预先保存的各句式结构模型中,确定用于拆分该语句的句式结构模型,并根据确定出的该句式结构模型,拆分该语句。而后,根据确定出的该句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系。由于在获取到语句后,可以通过确定出的句式结构模型对该语句实施自动拆分,并可根据确定出的该句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,自动标注拆分得到的各语法单位之间的依存关系。这样就极大的降低了语句拆分工作的门槛,给用户在语句拆分的过程中带来了极大的方便。在本说明书中,对语句执行标注的执行主体可以是终端、服务器等设备,下面将仅以终端为执行主体对本说明书提供的语句拆分方法进行说明。为了使本
的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。图2为本说明书提供的语句拆分过程的示意图,具体包括以下步骤:S200:获取语句。在本说明书中,终端可以获取用户需要进行拆分的至少一个语句,以在后续过程中,对获取到的语句进行拆分。其中,这里提到的用户可以是指上述提到的业务人员,也可以是指有标注需求的普通用户。需要说明的是,终端获取到的语句可以是指从未拆分过的语句,也可以是经拆分后得到的语句。例如,对于语句A:“我喜欢自然语言处理,但不擅长学语言”来说,该语句A为从未本文档来自技高网
...

【技术保护点】
1.一种语句拆分的方法,包括:获取语句;在预先保存的各句式结构模型中,确定用于拆分所述语句的句式结构模型,并根据确定出的所述句式结构模型,拆分所述语句;根据确定出的所述句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系。

【技术特征摘要】
1.一种语句拆分的方法,包括:获取语句;在预先保存的各句式结构模型中,确定用于拆分所述语句的句式结构模型,并根据确定出的所述句式结构模型,拆分所述语句;根据确定出的所述句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系。2.如权利要求1所述的方法,确定用于拆分所述语句的句式结构模型,并根据确定出的所述句式结构模型,拆分所述语句,具体包括:将所述语句作为待拆分句;判断所述待拆分句是否满足预设的拆分条件;若是,则确定用于拆分所述待拆分句的句式结构模型,并根据确定出的所述句式结构模型,拆分所述待拆分句并得到至少一个拆分结果,针对每个拆分结果,将该拆分结果重新确定为待拆分句,判断重新确定的该待拆分句是否满足所述拆分条件,直到拆分得到的全部拆分结果均不满足所述拆分条件为止;若否,则确定该待拆分句为拆分所述语句得到的语法单位。3.如权利要求2所述的方法,判断所述待拆分句是否满足预设的拆分条件,具体包括:当确定所述待拆分句为单字或词时,则确定该待拆分句不满足所述拆分条件,否则确定该待拆分句满足所述拆分条件。4.如权利要求2所述的方法,根据确定出的所述句式结构模型以及预设的各句式结构模型与各依存关系的对应关系,标注拆分得到的各语法单位之间的依存关系,具体包括:针对拆分得到的每个语法单位,确定拆分得到该语法单位所采用的每个句式结构模型;根据拆分得到该语法单位所采用的每个句式结构模型与依存关系的对应关系,对这该语法单位进行依存关系标注。5.如权利要求1所述的方法,确定用于拆分所述语句的句式结构模型,具体包括:将用户从预先保存的各句式结构模型中选择的句式结构模型确定为用于拆分所述语句的句式结构模型。6.一种语句拆分的装置,包括:获取模块,获取语句;拆分模块,在预先保...

【专利技术属性】
技术研发人员:毛德峰胡翔王雅芳
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1