一种语义信息处理方法和装置制造方法及图纸

技术编号:21799343 阅读:22 留言:0更新日期:2019-08-07 10:33
本发明专利技术实施例提供了一种语义信息处理方法和装置,属于信息处理技术领域。该语义信息处理方法包括根据得到的题干,将题干划分为已知条件和结论两部分;根据得到的已知条件和结论,提取已知条件和结论中的显性语义信息;当已知条件和/或结论中存在隐性语义信息时,提取已知条件和/结论中的隐性语义信息;合并提取到的显性语义信息和隐性语义信息,得到题干的语义信息。本发明专利技术实施例提供的语义信息处理方法能够从题干中提取出较为全面、完整的语义信息,从而可以为题目的自动解答提供准确统一的输入信息。

A Semantic Information Processing Method and Device

【技术实现步骤摘要】
一种语义信息处理方法和装置
本专利技术实施例涉及信息处理的
,尤其涉及一种语义信息处理方法和装置。
技术介绍
为了提高信息处理的效率,全面地掌握所需要的信息,特征提取渐渐成为研究热点。基于语义的特征提取方法是常用的特征提取方法之一,如何从具有多种表述方式的语句中提取出有用信息成为一个亟待解决的问题。
技术实现思路
有鉴于此,本专利技术实施例所解决的技术问题之一在于提供一种语义信息处理方法和装置,能够从题目的题干中准确提取出语义信息,从而为题目的自动解答提供准确统一的输入。第一方面,本专利技术实施例提供一种语义信息处理方法,包括:根据得到的题干,将所述题干划分为已知条件和结论两部分;根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息;当所述已知条件和/或结论中存在隐性语义信息时,提取所述已知条件和/或结论中的隐性语义信息;合并提取到的显性语义信息和隐性语义信息,得到所述题干的语义信息。可选地,在基于第一方面的具体实施例中,所述已知条件和/或结论存在隐性语义信息的判断步骤为:根据所述已知条件和/或结论,按照显性语义信息的提取方式所得到的语义信息中有实体缺失时,则判断所述已知条件和/或结论存在隐性语义信息。可选地,所述根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息的步骤具体为:根据关键词和关系的对应表,得到所述已知条件和结论中的关键词对应的关系;根据所述关键词和所述已知条件和结论中的实体之间的位置关系,结合所述关键词对应的关系,提取所述已知条件和结论中的显性语义信息。可选地,当所述已知条件和/或结论存在隐性语义信息时,提取所述已知条件和/或结论中的隐性语义信息的具体步骤:当按照显性语义信息的提取方式所得到的语义信息中有实体缺失时,根据存在缺失实体的语义信息中的关系,得到所述关系对应的关键词;根据所述关键词之前和/或之后的语句,提取所述已知条件和/或结论中的隐性语义信息。可选地,所述根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息的步骤具体为:根据所述已知条件和结论中的逗号,得到被所述逗号分割的所述已知条件和结论中的单个语句;分别从所述单个语句中提取显性语义信息;合并从每个所述单个语句中提取出的显性语义信息,得到所述已知条件和结论中的显性语义信息。可选地,所述合并提取到的显性语义信息和隐性语义信息,得到所述题干的语义信息之前还包括:当根据所述关键词所在的语句之前和/或之后的语句,提取所述已知条件和/或结论中的隐性语义信息的过程中,若查找到了所述题干的补充语义信息,则提取所述补充语义信息,并将所述补充语义信息记为隐性语义信息。第二方面,本专利技术实施例还提供了一种语义信息处理装置,包括:划分模块,用于根据得到的题干,将所述题干划分为已知条件和结论两部分;显性语义信息提取模块,用于根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息;隐性语义信息提取模块,用于当所述已知条件和/或结论存在隐性语义信息时,提取所述已知条件和/或结论中的隐性语义信息;合并模块,用于合并所述显性语义信息提取模块提取到的显性语义信息和所述隐性语义信息提取模块提取到的隐性语义信息,得到所述题干的语义信息。可选地,在基于第二方面的本专利技术具体实施例中,所述装置还包括判断模块,用于:根据所述已知条件和/或结论,按照显性语义信息的提取方式所得到的语义信息中有实体缺失时,则判断所述已知条件和/或结论存在隐性语义信息;所述隐性语义信息提取模块和所述判断模块相连接,用于当判断模块判断所述已知条件和/或结论中存在隐性语义信息时,提取所述已知条件和/或结论中的隐性语义信息;所述合并模块具体用于合并所述显性语义信息提取模块提取到的显性语义信息和所述隐性语义信息提取模块提取到的隐性语义信息,得到所述题干的语义信息。可选地,所述显性语义信息提取模块具体用于:根据关键词和关系的对应表,得到所述已知条件和结论中的关键词对应的关系;根据关键词和所述已知条件和结论中的实体之间的位置关系,结合所述关键词对应的关系,提取所述已知条件和结论中的显性语义信息。可选地,所述隐性语义信息提取模块具体用于:当按照显性语义信息的提取方式所得到的语义信息中有实体缺失时,根据存在实体缺失的语义信息中的关系,得到所述关系对应的关键词;根据关键词之前和/或之后的语句,提取所述已知条件和/或结论中的隐性语义信息,以及,当根据所述关键词所在的语句之前和/或之后的语句,提取所述已知条件和/或结论中的隐性语义信息的过程中,若查找到了所述题干的补充语义信息,则提取出所述补充语义信息,并将所述补充语义信息记为隐性语义信息。由以上技术方案可见,本专利技术实施例能够从题干中提取出全面的题干信息,提取出的题干语义信息组能够囊括题干中所有的信息,从而为题目的自动解答提供准确、有效且统一的输入。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种语义信息处理方法的流程示意图;图2为本专利技术实施例提供的一种语义信息处理装置的装置结构图。具体实施方式为了使本领域的人员更好地理解本专利技术实施例中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术实施例一部分实施例,而不是全部的实施例。基于本专利技术实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本专利技术实施例保护的范围。请参阅图1,本专利技术实施例提供了一种语义处理方法,包括步骤S100-S400,具体为:S100:根据得到的题干,将所述题干划分为已知条件和结论两部分。需要说明的是,本申请实施例提供的语义信息处理方法,可适用于多种题型,包括几何证明题,计算题等,在此以提取几何证明题题干中的语义信息为例对本申请实施例进行说明。本申请实施例通过对大量证明题题干文本的统计分析,发现证明题的题干可以用“求证”或者“证明”等分割成已知条件和结论两部分,“求证”或者“证明”前的部分题干为已知条件,“求证”或者“证明”后的部分题干为结论。因此,在本申请实施例中,可通过遍历题干,找到“求证”或者“证明”,进而得到证明题题干的已知条件和结论。同样,当提取计算题的题干语义信息时,也可通过“计算”、“求解”等对题干的已知条件和结论进行分类。需要说明的是,本申请实施例中的“语义信息”包括显性语义信息和隐性语义信息。其中,显性语义信息指的是不需要联系上下文,根据单个语句可以直接得出的包含两个实体以及两个实体之间的关系的语义信息,所述两个实体可以分别分布在所对应的关系的两侧,且在每一侧,所述实体与所对应的关系的距离均最短,如AB⊥CD;也可以分布在所对应的关系的同一侧,如AC是菱形ABCD的对角线;隐性语义信息指的是需要联系上下文才可以得出的信息,对于几何证明题来说,“语义信息”指的是题干语句中包含的数学信息。S200:根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息。在实际操作中,可选地,根据关键词和关系的对应表,得到所述已知条件本文档来自技高网...

【技术保护点】
1.一种语义信息处理方法,其特征在于,包括以下步骤:根据得到的题干,将所述题干划分为已知条件和结论两部分;根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息;当所述已知条件和/或结论中存在隐性语义信息时,提取所述已知条件和/或结论中的隐性语义信息;合并提取到的显性语义信息和隐性语义信息,得到所述题干的语义信息。

【技术特征摘要】
1.一种语义信息处理方法,其特征在于,包括以下步骤:根据得到的题干,将所述题干划分为已知条件和结论两部分;根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息;当所述已知条件和/或结论中存在隐性语义信息时,提取所述已知条件和/或结论中的隐性语义信息;合并提取到的显性语义信息和隐性语义信息,得到所述题干的语义信息。2.根据权利要求1所述的一种语义信息处理方法,其特征在于,所述已知条件和/或结论存在隐性语义信息的判断步骤为:根据所述已知条件和/或结论,按照显性语义信息的提取方式所得到的语义信息中有实体缺失时,则判断所述已知条件和/或结论存在隐性语义信息。3.根据权利要求1所述的一种语义信息处理方法,其特征在于,所述根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息的步骤具体为:根据关键词和关系的对应表,得到所述已知条件和结论中的关键词对应的关系;根据所述关键词和所述已知条件和结论中的实体之间的位置关系,结合所述关键词对应的关系,提取所述已知条件和结论中的显性语义信息。4.根据权利要求1或2或3所述的一种语义信息处理方法,其特征在于,当所述已知条件和/或结论存在隐性语义信息时,提取所述已知条件和/或结论中的隐性语义信息的具体步骤为:当按照显性语义信息的提取方式所得到的语义信息中有实体缺失时,根据存在缺失实体的语义信息中的关系,得到所述关系对应的关键词;根据所述关键词之前和/或之后的语句,提取所述已知条件和/或结论中的隐性语义信息。5.根据权利要求1或3所述的一种语义信息处理方法,其特征在于,所述根据得到的已知条件和结论,提取所述已知条件和结论中的显性语义信息的步骤具体为:根据所述已知条件和结论中的逗号,得到被所述逗号分割的所述已知条件和结论中的单个语句;分别从所述单个语句中提取显性语义信息;合并从每个所述单个语句中提取出的显性语义信息,得到所述已知条件和结论中的显性语义信息。6.根据权利要求4所述的一种语义信息处理方法,其特征在于,所述合并提取到的显性语义信息和隐性语义信息,得到所述题干的语义信息之前还包括:当根据所述关键词所在的语句之前和/或之后的语句,提取所述已知条件和/或结论中的隐性语义信息的过程中,...

【专利技术属性】
技术研发人员:刘飞飞
申请(专利权)人:亿度慧达教育科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1