当前位置: 首页 > 专利查询>饶竹一专利>正文

基于业务模型的语义训练系统及其方法技术方案

技术编号:21034748 阅读:36 留言:0更新日期:2019-05-04 05:35
本发明专利技术公开一种基于业务模型的语义训练系统及其方法;该系统包括:录入模块,用于接收业务模型的录入操作,获取业务模型数据,业务模型数据包括对象、属性或方法;分析模块,与录入模块相连,用于对对象、属性或方法进行分析处理,获取用户语言知识、语义结构或语义事件,并据此构造语义模式,生成基础语料;训练用例生成模块,与分析模块相连,用于根据基础语料生成训练用例数据;训练执行模块,与分析模块以及训练用例生成模块相连,用于根据语义模式、训练用例数据生成SPD文件、TCD文件以及映射关系文件。本发明专利技术解决了语义训练操作工具难以被应用开发人员使用和掌握的问题;降低了应用领域开发人员接入语义分析能力的门槛。

【技术实现步骤摘要】
基于业务模型的语义训练系统及其方法
本专利技术涉及自然语言处理的
,尤其涉及一种基于业务模型的语义训练系统及其方法。
技术介绍
随着人工智能在各个领域的渗透,全球将从互联网时代步入人工智能时代。自然语言处理作为人工智能重要的分支,在人工智能发展的进程上起着重要的促进作用。自然语言处理(NLP)是指机器理解并解释人类写作、说话方式的能力。NLP的目标是让计算机/机器在理解语言上像人类一样智能,最终目标是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。NLP分析技术大致分为三个层面:词法分析、句法分析和语义分析。语义分析的最终目的是理解句子表达的真实语义。语义分析需要语义训练手段,通过语义训练产生的用户语言知识、语义结构和语义模式,即词法分析和句法分析,实现语义分析能力。目前语义训练的方法都是通过词法分析和句法分析的手段,同时对用户的语料进行语义角色标注,产生用户语言知识、语义结构和语义模式这样的分析引擎可以理解的形式。目前,当前应用市场并没有一个较好的语义训练流程来帮助那些没有NLP基础的应用领域开发人员进行语义开发。例如科大讯飞的AIUI开发平台,百度的AI开发平台以及微软的luis。这些开发平台提供的语义训练帮助工具对于应用领域开发人员来说无法直接使用,知识的不对称阻碍这人工智能的应用,同时在上述平台使用,需要极大的工作量,管理和维护成本高,同时应用开发人员对训练过程中的概念和流程并不是很理解,造成用户虽然在进行语义训练,但是一头雾水的情况。目前来看,现在语义训练相关的训练工具难以使用,若应用开发人员不具备NLP知识,会导致无法掌握语义训练流程,从而提高了接入NLP分析技术的门槛。同时,用户的语义训练工作量极大,存在管理不容易且维护成本很高的技术问题。
技术实现思路
本专利技术的主要目的在于提出一种基于业务模型的语义训练方法及其系统,旨在解决语义训练难以管理,维护成本高的问题。为实现上述目的,本专利技术提出一种基于业务模型的语义训练方法,包括:录入模块,用于接收业务模型的录入操作,获取业务模型数据,所述业务模型数据包括对象、属性或方法;分析模块,与所述录入模块相连,用于对所述对象、属性或方法进行分析处理,获取用户语言知识、语义结构或语义事件,并据此构造语义模式,生成基础语料;训练用例生成模块,与所述分析模块相连,用于根据所述基础语料生成训练用例数据;训练执行模块,与所述分析模块以及训练用例生成模块相连,用于根据所述语义模式、训练用例数据生成SPD文件、TCD文件以及映射关系文件。在一个可能的设计中,所述录入模块包括对象录入单元、属性录入单元和方法录入单元、数据存储单元;其中:所述对象录入单元用于接收所述业务模型中对象的录入操作;所述对象包含抽象词、下位词和实例词;所述属性录入单元用于接收所述对象的属性的录入操作;所述属性包含属性词、属性值和属性类型;所述方法录入单元用于接收所述对象的方法的录入操作;所述方法包含方法名、输入参数和输出参数;所述数据存储单元用于将所述业务模型存储到所述数据库。在一个可能的设计中,所述分析模块包括对象分析单元、属性分析单元、方法分析单元、本体扩充单元、模式构造单元、基础语料生成单元以及数据存储单元;其中:所述对象分析单元用于对所述对象进行术语的抽取,获取用户语言知识,并将所述对象与所述用户语言知识进行关联;所述属性分析单元用于对所述属性进行分析,获取所述属性的语义结构;所述方法分析单元用于对所述方法进行分析,获取对应的语义事件;所述本体扩充单元,用于对所述用户语言知识进行扩充,并对所述用户语言知识的结构进行调整;所述模式构造单元用于通过所述业务模型中的谓词语义关系和短语语义关系,结合所述用户语言知识和语义结构,构造出语义模式;所述基础语料生成单元用于分析所述语义模式,将所述语义模式中的各个语义角色替换为具体词以生成基础语料;所述数据存储单元用于将所述用户语言知识和业务模型的映射关系、用户语言知识、语义结构、语义模式以及基础语料存储到数据库服务器中。在一个可能的设计中,所述训练用例生成模块包含语料获取单元、等价扩充合并单元、自动标注单元以及数据存储单元;其中:所述语料获取单元用于获取所述分析模块生成的基础语料,并通过预设方式获取扩充语料;所述等价扩充合并单元用于将公共语言知识与所述语料获取单元获取的语料进行等价的扩充和合并,得到语料的标准型及其关联的等价表达;所述自动标注单元用于对所述等价扩充合并单元产生的语料的标准型来进行自动标注,得到训练用例数据;所述数据存储单元用于将所述训练用例数据保存到数据库中。在一个可能的设计中,所述训练执行模块包括SPD生成单元、TCD生成单元、基本语义映射单元、复杂语义映射单元以及数据存储单元;其中:所述SPD生成单元用于将所述语义事件关联到所述语义模式,生成SPD文件;所述TCD生成单元用于将所述训练用例数据关联到所述语义模式,生成TCD文件;所述基本语义映射单元用于分析所述训练用例数据中的简单语句,将其映射为基本语义模式,生成简单映射关系文件;所述复杂语义映射单元用于分析所述训练用例数据中的复杂语句,将其映射到基本语义模式的集合,生成复杂映射关系文件;所述数据存储单元将所述SPD文件、TCD文件、简单映射关系文件以及复杂映射关系文件上传到文件服务器中。本专利技术还提供一种基于业务模型的语义训练方法,包括:接收业务模型的录入操作,获取业务模型数据,所述业务模型数据包括对象、属性或方法;对所述对象、属性或方法进行分析处理,获取用户语言知识、语义结构或语义事件,并据此构造语义模式,生成基础语料;根据所述基础语料生成训练用例数据;根据所述语义模式、训练用例数据生成SPD文件、TCD文件以及映射关系文件。在一个可能的设计中,所述接收业务模型的录入操作包括:接收所述业务模型中对象的录入操作;所述对象包含抽象词、下位词和实例词;接收所述对象的属性的录入操作;所述属性包含属性词、属性值和属性类型;接收所述对象的方法的录入操作;所述方法包含方法名、输入参数和输出参数;将所述业务模型存储到所述数据库。在一个可能的设计中,所述分对所述对象、属性或方法进行分析处理,获取用户语言知识、语义结构或语义事件,并据此构造语义模式,生成基础语料包括:对所述对象进行术语的抽取,获取用户语言知识,并将所述对象与所述用户语言知识进行关联;对所述用户语言知识进行扩充,并对所述用户语言知识的结构进行调整;对所述属性进行分析,获取所述属性的语义结构;对所述方法进行分析,获取对应的语义事件;通过所述业务模型中的谓词语义关系和短语语义关系,结合所述用户语言知识和语义结构,构造出语义模式;分析所述语义模式,将所述语义模式中的各个语义角色替换为具体词以生成基础语料;将所述用户语言知识和业务模型的映射关系、用户语言知识、语义结构、语义模式以及基础语料存储到数据库服务器中。在一个可能的设计中,所述根据所述基础语料生成训练用例数据包括:获取所述分析模块生成的基础语料,并通过预设方式获取扩充语料;将公共语言知识与所述语料获取单元获取的语料进行等价的扩充和合并,得到语料的标准型及其关联的等价表达;所述语料的标准型来进行自动标注,得到训练用例数据;将所述训练用例数据保存到数据库中。在一个可能本文档来自技高网
...

【技术保护点】
1.一种基于业务模型的语义训练系统,其特征在于,包括:录入模块,用于接收业务模型的录入操作,获取业务模型数据,所述业务模型数据包括对象、属性或方法;分析模块,与所述录入模块相连,用于对所述对象、属性或方法进行分析处理,获取用户语言知识、语义结构或语义事件,并据此构造语义模式,生成基础语料;训练用例生成模块,与所述分析模块相连,用于根据所述基础语料生成训练用例数据;训练执行模块,与所述分析模块以及训练用例生成模块相连,用于根据所述语义模式、训练用例数据生成SPD文件、TCD文件以及映射关系文件。

【技术特征摘要】
1.一种基于业务模型的语义训练系统,其特征在于,包括:录入模块,用于接收业务模型的录入操作,获取业务模型数据,所述业务模型数据包括对象、属性或方法;分析模块,与所述录入模块相连,用于对所述对象、属性或方法进行分析处理,获取用户语言知识、语义结构或语义事件,并据此构造语义模式,生成基础语料;训练用例生成模块,与所述分析模块相连,用于根据所述基础语料生成训练用例数据;训练执行模块,与所述分析模块以及训练用例生成模块相连,用于根据所述语义模式、训练用例数据生成SPD文件、TCD文件以及映射关系文件。2.根据权利要求1所述基于业务模型的语义训练系统,其特征在于,所述录入模块包括对象录入单元、属性录入单元和方法录入单元、数据存储单元;其中:所述对象录入单元用于接收所述业务模型中对象的录入操作;所述对象包含抽象词、下位词和实例词;所述属性录入单元用于接收所述对象的属性的录入操作;所述属性包含属性词、属性值和属性类型;所述方法录入单元用于接收所述对象的方法的录入操作;所述方法包含方法名、输入参数和输出参数;所述数据存储单元用于将所述业务模型存储到所述数据库。3.根据权利要求1所述基于业务模型的语义训练系统,其特征在于,所述分析模块包括对象分析单元、属性分析单元、方法分析单元、本体扩充单元、模式构造单元、基础语料生成单元以及数据存储单元;其中:所述对象分析单元用于对所述对象进行术语的抽取,获取用户语言知识,并将所述对象与所述用户语言知识进行关联;所述属性分析单元用于对所述属性进行分析,获取所述属性的语义结构;所述方法分析单元用于对所述方法进行分析,获取对应的语义事件;所述本体扩充单元,用于对所述用户语言知识进行扩充,并对所述用户语言知识的结构进行调整;所述模式构造单元用于通过所述业务模型中的谓词语义关系和短语语义关系,结合所述用户语言知识和语义结构,构造出语义模式;所述基础语料生成单元用于分析所述语义模式,将所述语义模式中的各个语义角色替换为具体词以生成基础语料;所述数据存储单元用于将所述用户语言知识和业务模型的映射关系、用户语言知识、语义结构、语义模式以及基础语料存储到数据库服务器中。4.根据权利要求1所述基于业务模型的语义训练系统,其特征在于,所述训练用例生成模块包含语料获取单元、等价扩充合并单元、自动标注单元以及数据存储单元;其中:所述语料获取单元用于获取所述分析模块生成的基础语料,并通过预设方式获取扩充语料;所述等价扩充合并单元用于将公共语言知识与所述语料获取单元获取的语料进行等价的扩充和合并,得到语料的标准型及其关联的等价表达;所述自动标注单元用于对所述等价扩充合并单元产生的语料的标准型来进行自动标注,得到训练用例数据;所述数据存储单元用于将所述训练用例数据保存到数据库中。5.根据权利要求1所述基于业务模型的语义训练系统,其特征在于,所述训练执行模块包括SPD生成单元、TCD生成单元、基本语义映射单元、复杂语义映射单元以及数据存储单元;其中:所述SPD生成单元用于将所述语义事件关联到所述语义模式,生成SPD文件;所述TCD生成单元用于将所述训练...

【专利技术属性】
技术研发人员:饶竹一
申请(专利权)人:饶竹一张云翔
类型:发明
国别省市:广东,44

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1