语义工程平台的构建方法及语义工程平台技术

技术编号:30080387 阅读:22 留言:0更新日期:2021-09-18 08:37
本发明专利技术提出了一种语义工程平台的构建方法及语义工程平台,所述语义工程平台的构建方法包括:从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语言初等数学应用题集合;对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,所述语义表示实例数据包括数据元变量的语料实例、变量之间的数值关系的语义实例、变量的逻辑关系的语义实例;根据得到的语义表示实例数据构建面向问题的语义工程平台。本发明专利技术能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,构建了面向问题的语义工程平台,为实现真正的类人思维的求解提供数据基础。据基础。据基础。

【技术实现步骤摘要】
语义工程平台的构建方法及语义工程平台


[0001]本专利技术涉及计算机自然语言
,尤其涉及一种语义工程平台的构建方法及语义工程平台。

技术介绍

[0002]目前,现有的自然语言初等数学应用题求解技术,都是采用支持向量机等机器学习算法进行语义识别,没有“类人”的中间步骤,直接求解结果,结果也不尽如人意。而对于自然语言数学应用题类人机器求解方式,由于自然语言的表述形式几乎是无限的,因此对于语义处理问题而言,语义特征稀疏问题十分突出。这使得众多以数据为基础的机器学习算法对自然语言模型匹配无从下手。要解决这个问题,一要发展适应语义表示稀疏问题的新算法;二要建设语义工程平台积累语料和语义表示数据。
[0003]可见,如何构建语义工程平台以实现积累语料和语义表示数据,对于自然语言数学应用题类人机器求解具有重要意义。

技术实现思路

[0004]基于上述技术问题,本专利技术提出了一种语义工程平台的构建方法及语义工程平台,能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,构建了面向问题的语义工程平台,为实现真正的类人思维的求解提供数据基础。
[0005]本专利技术提供了一种语义工程平台的构建方法,所述方法包括:
[0006]从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语言初等数学应用题集合;
[0007]对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,所述语义表示实例数据包括数据元变量的语料实例、变量之间的数值关系的语义实例、变量的逻辑关系的语义实例;
[0008]根据得到的语义表示实例数据构建面向问题的语义工程平台。
[0009]进一步地,所述对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,包括:
[0010]识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,数据元包含表征数字量的数字串和表征数据提问的汉字串;
[0011]提取所述数据元所处的上下文分词和语义预处理后的词汇流,根据得到的上下文分词和词汇流构建对应数据元变量的子句框架库与语义特征库;
[0012]识别语义工程问题中的上下文显式数值关系,所述上下文显式数值关系为数据元变量之间的显式数值关系,根据得到的上下文显式数值关系构建对应数据元变量的语义导图库;
[0013]识别语义工程问题中的数据元变量的逻辑关系,所述数据元变量的逻辑关系为变量之间的直接运算关系,根据得到的逻辑关系构建对应数据元变量的语义导图库;
[0014]所述子句框架库和语义特征库构成数据元变量的语料实例;
[0015]所述子句框架库和语义导图库构成变量之间的数值关系的语义实例;
[0016]所述子句框架库、语义特征库和语义导图库构成变量的逻辑关系的语义实例。
[0017]进一步地,所述识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,包括:
[0018]对提取的语义工程问题进行分词处理,分词后通过量词识别、概念属性识别、概念关系识别、指代识别、时间分段识别和/或常识关系识别,依次识别出语义工程问题中的数据元;
[0019]根据预设的变量标签集合,选择当前场景单元框架涉及变量的核心词集合及其修饰词集合对识别出的数据元进行表示。
[0020]进一步地,所述语义导图库由多个封闭的语义圈组成,每个语义圈包含多条语义边,每条语义边对应一个数学公式。
[0021]进一步地,所述方法还包括:
[0022]按照预设的数据规则对变量标签、变量的上下文分词、语义圈、语义边以及数学公式进行数据文件配置。
[0023]进一步地,所述方法还包括:
[0024]当检测到重复命名的变量时,则根据相关语义圈相应变量名和语义特征库进行修正,或,增加场景修饰词汇以去除重名。
[0025]进一步地,所述方法还包括:
[0026]对语义边的数值运算关系进行匹配处理,以及
[0027]对同类型变量的数值关系补充和类似模型的类比关系扩展。
[0028]进一步地,所述方法还包括:
[0029]基于所述语义工程平台对待计算的初等数学应用题进行分析计算和结果输出。
[0030]进一步地,所述基于所述语义工程平台对待计算的初等数学应用题进行计算和结果输出,具体包括:
[0031]识别所述待计算的初等数学应用题中的数据元变量、上下文显式数值关系和数据元变量的逻辑关系;
[0032]根据识别出的数据元变量、上下文显式数值关系和数据元变量的逻辑关系进行语义表示实例数据匹配,生成待计算的初等数学应用题对应的动态语义圈,以描述数据元变量与相应公式变量的一一对应关系;
[0033]基于所述动态语义圈进行模拟求解计算。
[0034]本专利技术还提供了一种语义工程平台,所述语义工程平台采用如上所述的方法构建。
[0035]本专利技术提出的语义工程平台的构建方法及语义工程平台,通过对从自然语言初等数学应用题提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,并基于得到的语义表示实例数据构建面向问题的语义工程平台,能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,为实现真正的类人思维的求解提供数据基础。
[0036]进一步地,本专利技术构建的语义工程平台能够用可解释的中间步骤实现类人的求解过程,实现真正的类人思维,对在线教育辅助学生学习领域具有重要的应用价值。
附图说明
[0037]图1为本专利技术的语义工程平台的构建方法的流程图;
[0038]图2为本专利技术的语义工程平台的构建方法中步骤S12的具体实现流程图;
[0039]图3为本专利技术提出的数学应用题语义问题的分析示意图;
[0040]图4为本专利技术一个具体实施例中涉及的语义圈示意图。
具体实施方式
[0041]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0042]语义表述的维度是十分广泛的,要积累语义表示数据,首先必须明确语义工程问题,并以问题为维度积累语义表示实例数据;然后用研究用自然语言处理的方法自动求解语义工程问题。本专利技术以自然语言初等数学应用题的类人求解为研究对象,凝练自然语言初等数学应用题的类人求解技术环节面临的语义工程问题,针对问题建设语义工程平台,积累语义表示数据,适时用算法自动处理。
[0043]请参照图1所示,其为本专利技术实施例提供的语义工程平台的构建方法的流程示意图。本专利技术实施例提供的语义工程平台的构建方法,具体包括以下步骤:
[0044]S11、从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义工程平台的构建方法,其特征在于,所述方法包括:从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语言初等数学应用题集合;对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,所述语义表示实例数据包括数据元变量的语料实例、变量之间的数值关系的语义实例、变量的逻辑关系的语义实例;根据得到的语义表示实例数据构建面向问题的语义工程平台。2.如权利要求1所述的方法,其特征在于,所述对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,包括:识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,数据元包含表征数字量的数字串和表征数据提问的汉字串;提取所述数据元所处的上下文分词和语义预处理后的词汇流,根据得到的上下文分词和词汇流构建对应数据元变量的子句框架库与语义特征库;识别语义工程问题中的上下文显式数值关系,所述上下文显式数值关系为数据元变量之间的显式数值关系,根据得到的上下文显式数值关系构建对应数据元变量的语义导图库;识别语义工程问题中的数据元变量的逻辑关系,所述数据元变量的逻辑关系为变量之间的直接运算关系,根据得到的逻辑关系构建对应数据元变量的语义导图库;所述子句框架库和语义特征库构成数据元变量的语料实例;所述子句框架库和语义导图库构成变量之间的数值关系的语义实例;所述子句框架库、语义特征库和语义导图库构成变量的逻辑关系的语义实例。3.如权利要求2所述的方法,其特征在于,所述识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,包括:对提取的语义工程问题进行分词处理,分词后通过量词识别、概念属性识别、概念关系识别、指代识别、时间分段识别和/或常识关系识别,依次识别...

【专利技术属性】
技术研发人员:朱平史进
申请(专利权)人:北京泰豪智能工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1