语句解析方法及语句解析装置制造方法及图纸

技术编号:16379417 阅读:1378 留言:0更新日期:2017-10-15 13:00
本发明专利技术公开了一种语句解析方法及语句解析装置。其中,该方法包括:获取待解析语句;根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。本发明专利技术解决了在相关技术中,基于英文的领域特定语言,处理复杂,不符合中文的语言习惯的技术问题,提升了待解析语句和中文领域特定语言的可阅读性,进而提高了用户体验。

Statement parsing method and sentence parsing device

The invention discloses a statement parsing method and a sentence parsing device. Among them, the method includes: obtaining the statement to be analyzed; according to the Chinese domain specific language syntax, to parse the statement parsing, which, to parse the statement and Chinese domain specific languages are described based on the Chinese. The invention solves the related technology, domain specific languages, English based on complex technical problems, does not meet the Chinese language habits, to enhance the analytical statement and Chinese domain specific language can be read, and improve the user experience.

【技术实现步骤摘要】
语句解析方法及语句解析装置
本专利技术涉及领域特定语言领域,具体而言,涉及一种语句解析方法及语句解析装置。背景
特定语言(Domain-SpecificLanguage,简称为DSL)是针对特定应用领域而设计的计算机语言,它使用约定的文法,表达专业人员的意图,辅助其在该领域中高效地解决问题。在相关技术中,描述一种计算机语言,一般使用扩展巴科斯范式(ExtendedBackus-NaurForms,简称为EBNF)。传统的领域特定语言描述工具,如(AnotherToolofLanguageRecognition,简称为Antlr),能够在一定程度上简化领域特定语言的设计。然而,传统的基于扩展巴科斯范式的计算机语言描述方法,以及现有的语言描述和解析工具(如Antlr)还是存在问题的:例如,在一般的领域特定语言描述方法中,要求以英文作为基本词法要素和关键字。但是,由于难以正确处理复杂的中文断句逻辑,即使允许使用中文作为关键字,也必须像英文一样,在词与词之间增加空格,因此,这种方法并不符合中文的语言习惯。因此,在相关技术中,基于英文的领域特定语言,处理复杂,不符合中文的语言习惯。
技术实现思路
本专利技术实施例提供了一种语句解析方法及语句解析装置,以至少解决在相关技术中,基于英文的领域特定语言,处理复杂,不符合中文的语言习惯的技术问题。根据本专利技术实施例的一个方面,提供了一种语句解析方法,包括:获取待解析语句;根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。可选地,语法采用动态可变数据进行描述;语法包括:用于描述中文领域特定语言的词素的类型的符号,以及,除符号之外的用于对符号进行补充的字典。可选地,根据中文领域特定语言的语法,对待解析语句进行解析包括:将待解析语句分解为基本词素;对分解的基本词素标注词性;根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树。可选地,在将待解析语句分解为基本词素之前,还包括:采用预定歧义判断算法判断待解析语句是否存在歧义;在判断结果为是的情况下,采用预定规避措施对待解析语句存在的歧义进行规避。可选地,将待解析语句分解为基本词素包括:采用最长匹配原则,将待解析语句分解为基本词素,其中,最长匹配原则为匹配尽可能长的语句。可选地,根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树包括以下之一:采用下降式语法树解析算法,将标注了词性的基本词素解析为语法树,其中,下降式语法树解析算法为:在预定的词素位置,依次向前搜索匹配,当匹配的词素引用了除词素所引用的符号之外的其他符号时,匹配其他符号;采用上升式语法树解析算法,将标注了词性的基本词素解析为语法树,其中,上升式语法树解析算法为:构建从待解析语句分解产生的基本词素的父节点,之后采用相同的方式构建父节点的父节点,直至产生唯一的根节点;采用下降式语法树解析算法和上升式语法树解析算法结合的方式,将标注了词性的基本词素解析为语法树。可选地,在将待解析语句分解为基本词素之前,还包括:采用预定的省略语推断算法,对待解析语句进行推断,将待解析语句还原为完全信息的语句,其中,预定的省略语推断算法包括以下至少之一:根据前文的基本词素,对省略语进行补充的上文推断算法;根据指代时间的基本词素对时间进行推算的时间推断算法;对未指定完整信息的基本词素进行定位的业务对象推断算法。可选地,在根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树之后,还包括:语法树上的叶子节点将叶子节点的内容传递给叶子节点的父节点;父节点对所包括的所有叶子节点传递的内容进行处理,得到父节点的内容;依次执行:上述内容传递以及处理操作,直至根节点,以根节点的内容作为语法树的最终值,其中,所述最终值用于执行应用程序接口。根据本专利技术实施例的另一个方面,还提供了一种语句解析装置,其特征在于,包括:获取模块,用于获取待解析语句;解析模块,用于根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。可选地,解析模块包括:分词单元,用于将待解析语句分解为基本词素;标注单元,用于对分解的基本词素标注词性;解析单元,用于根据中文领域特定语言的语法,将标注了词性的基本词素解析为语法树。可选地,解析模块还包括:判断单元,用于采用预定歧义判断算法判断待解析语句是否存在歧义;规避单元,用于在判断结果为是的情况下,采用预定规避措施对待解析语句存在的歧义进行规避。可选地,分词单元包括:分解子单元,用于采用最长匹配原则,将待解析语句分解为基本词素,其中,最长匹配原则为匹配尽可能长的语句。可选地,解析单元包括以下之一:第一解析子单元,用于采用下降式语法树解析算法,将标注了词性的基本词素解析为语法树,其中,下降式语法树解析算法为:在预定的词素位置,依次向前搜索匹配,当匹配的词素引用了除词素所引用的符号之外的其他符号时,匹配其他符号;第二解析子单元,用于采用上升式语法树解析算法,将标注了词性的基本词素解析为语法树,其中,上升式语法树解析算法为:构建从待解析语句分解产生的基本词素的父节点,之后采用相同的方式构建父节点的父节点,直至产生唯一的根节点;第三解析子单元,用于采用下降式语法树解析算法和上升式语法树解析算法结合的方式,将标注了词性的基本词素解析为语法树。可选地,解析模块还包括:推断单元,用于采用预定的省略语推断算法,对待解析语句进行推断,将待解析语句还原为完全信息的语句,其中,预定的省略语推断算法包括以下至少之一:根据前文的基本词素,对省略语进行补充的上文推断算法;根据指代时间的基本词素对时间进行推算的时间推断算法;对未指定完整信息的基本词素进行定位的业务对象推断算法。可选地,解析模块还包括:传递单元,用于语法树上的叶子节点将叶子节点的内容传递给叶子节点的父节点;处理单元,用于父节点对所包括的所有叶子节点传递的内容进行处理,得到父节点的内容;执行模块,用于依次执行:上述内容传递以及处理操作,直至根节点,以根节点的内容作为语法树的最终值。根据本专利技术实施例的另一个方面,还提供了一种存储介质,其特征在于,存储介质包括存储的程序,其中,程序运行时控制存储介质所在设备执行以下操作:获取待解析语句;根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。根据本专利技术实施例的另一个方面,还提供了一种处理器,其特征在于,处理器用于运行程序,其中,程序运行时执行以下操作:获取待解析语句;根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的。在本专利技术实施例中,通过采用获取待解析语句,然后根据中文领域特定语言的语法,对待解析语句进行解析,其中,待解析语句和中文领域特定语言均是基于中文进行描述的,由于上述待解析语句和中文领域特定语言均是基于中文进行描述的,提升了待解析语句和中文领域特定语言的可阅读性,进而解决了在相关技术中,基于英文的领域特定语言,处理复杂,不符合中文的语言习惯的技术问题,进而提高了用户体验。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意本文档来自技高网...
语句解析方法及语句解析装置

【技术保护点】
一种语句解析方法,其特征在于,包括:获取待解析语句;根据中文领域特定语言的语法,对所述待解析语句进行解析,其中,所述待解析语句和所述中文领域特定语言均是基于中文进行描述的。

【技术特征摘要】
1.一种语句解析方法,其特征在于,包括:获取待解析语句;根据中文领域特定语言的语法,对所述待解析语句进行解析,其中,所述待解析语句和所述中文领域特定语言均是基于中文进行描述的。2.根据权利要求1所述的方法,其特征在于,所述语法采用动态可变数据进行描述;所述语法包括:用于描述所述中文领域特定语言的词素的类型的符号,以及,除所述符号之外的用于对所述符号进行补充的字典。3.根据权利要求1所述的方法,其特征在于,根据所述中文领域特定语言的所述语法,对所述待解析语句进行解析包括:将所述待解析语句分解为基本词素;对分解的所述基本词素标注词性;根据所述中文领域特定语言的语法,将标注了词性的基本词素解析为语法树。4.根据权利要求3所述的方法,其特征在于,在将所述待解析语句分解为所述基本词素之前,还包括:采用预定歧义判断算法判断所述待解析语句是否存在歧义;在判断结果为是的情况下,采用预定规避措施对所述待解析语句存在的歧义进行规避。5.根据权利要求3所述的方法,其特征在于,将所述待解析语句分解为所述基本词素包括:采用最长匹配原则,将所述待解析语句分解为所述基本词素,其中,所述最长匹配原则为匹配尽可能长的语句。6.根据权利要求3所述的方法,其特征在于,根据所述中文领域特定语言的语法,将标注了词性的基本词素解析为所述语法树包括以下之一:采用下降式语法树解析算法,将标注了词性的基本词素解析为所述语法树,其中,所述下降式语法树解析算法为:在预定的词素位置,依次向前搜索匹配,当匹配的词素引用了除所述词素所引用的符号之外的其他符号时,匹配所述其他符号;采用上升式语法树解析算法,将标注了词性的基本词素解析为所述语法树,其中,所述上升式语法树解析算法为:构建从所述待解析语句分解产生的基本词素的父节点,之后采用相同的方式构建父节点的父节点,直至产生唯一的根节点;采用所述下降式语法树解析算法和所述上升式语法树解析算法结合的方式,将标注了词性的基本词素解析为所述语法树。7.根据权利要求3所述的方法,其特征在于,在将所述待解析语句分解为所述基本词素之前,还包括:采用预定的省略语推断算法,对所述待解析语句进行推断,将所述待解析语句还原为完全信息的语句,其中,所述预定的省略语推断算法包括以下至少之一:根据前文的基本词素,对省略语进行补充的上文推断算法;根据指代时间的基本词素对时间进行推算的时间推断算法;对未指定完整信息的基本词素进行定位的业务对象推断算法。8.根据权利要求3至7中任一项所述的方法,其特征在于,在根据所述中文领域特定语言的语法,将标注了词性的基本词素解析为所述语法树之后,还包括:所述语法树上的叶子节点将所述叶子节点的内容传递给所述叶子节点的父节点;所述父节点对所包括的所有叶子节点传递的内容进行处理,得到父节点的内容;依次执行:上述内容传递以及处理操作,直至根节点,将所述根节点的内容作为所述语法树的最终值,其中,所述最终值用于执行应用程序接口。9.一种语句解析装置,其特征在于,包括:获取模块,用于获取待解析语句;解析模块,用于根据中文领域特定语言的语法,对所述待解析语句进行解析,其中,...

【专利技术属性】
技术研发人员:邢锦江李剑朱华邹雪梅陈险峰朱峰登史可华董扬威李亮
申请(专利权)人:北京航天飞行控制中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1