当前位置: 首页 > 专利查询>谷松专利>正文

以语用为核心的自然语言文本辅助知识库书写和检测系统与方法技术方案

技术编号:26690278 阅读:28 留言:0更新日期:2020-12-12 02:40
以语用为核心的自然语言文本辅助知识库书写和检测系统,以汉语为输入语言,包括语用体裁库、语用要素表达子系统、语用体裁真值库、语用关系子系统以及知识推理子系统,本发明专利技术还提供了以汉语为输入语言的书写和检测方法,在自然语言书写过程中,以高层次的语用要素类型和语用要素关系决定低层次词性标注、句法语义表示和分析,可识别自然语言的语用,计算语用真值,对知识构成及其自身层次上是否正确进行判断,可以解决知识表达形式的正确性问题,而不仅仅是词法、句法方面的形式判断,并且本发明专利技术是根据书写顺序实时判断,书写者严格按系统的流程和规范进行书写的知识可以直接构成系统的知识库,对以后的使用带来很大的方便。

【技术实现步骤摘要】
以语用为核心的自然语言文本辅助知识库书写和检测系统与方法
本专利技术属于计算语言学领域,特别涉及一种以语用为核心的自然语言文本辅助知识库书写和检测系统与方法。
技术介绍
自然语言的语用真值,指的是语句与语句之间的确定关系的真值,主要通过关系表达式进行计算。特定体裁的语用真值是指对其语用要素及其特定计算关系而设定的真值传统自然语言识别中,一种趋势是对词法、句法、语义等进行标注,例如哈工大的语言云系统;另外一种趋势是基于统计方法比对语义相似度,例如中国知网的学术不端文献检测(ALMC)系统。两种趋势的共同点在于均不涉及实际意义上的语用真值计算。
技术实现思路
为了克服上述现有技术的缺点,本专利技术的目的在于提供一种以语用为核心的自然语言文本辅助知识库书写和检测系统与方法,在识别自然语言词法、句法、语义的基础上,增加了句子之间的语用真值及特定题材的语用真值计算。为了实现上述目的,本专利技术采用的技术方案是:一种以语用为核心的自然语言文本辅助知识库书写和检测系统,以汉语为输入语言,包括:语用体裁库,存储若干种语用体裁,语用体裁是有固定语用要素的由句子构成的有特殊使用目的体裁,这种特殊使用目的可以用确定的语用表达式计算语用体裁真值;常见的语用体裁如论文摘要、借条、合同、通知、报导、诉状以及专利申请书等,其书写范围包括词库、语法、动词以及语用格。语用要素是指各语用体裁中的必要构成部分,例如,体裁为论文摘要时,语用要素为目的、方法、结果、结论或者对象、方法、结果;体裁为借条时,语用要素为债权人、借款金额、利息计算、还款时间、债务人、借款日期;体裁为劳动合同时,语用要素为劳动者、用人单位、合同期限、工作内容、劳动报酬、劳动纪律。语用要素表达子系统,分别匹配不同语用体裁,包括语用要素标记数据库和语用要素关系计算数据库,语用要素标记数据库存储不同语用体裁中的语用要素标记以及各标记所标注的语用要素类型(比如摘要中的对象类、方法类、结果类),语用要素标记指与语用要素对应的常用关键词,例如关于摘要的语用要素标记包括“对于、采用、得到”等,标记“对于”标注的语用要素是“对象”(对象是指研究的所指),标记“采用”标注的语用要素是“方法”(方法包括研究所采用的具体方法、原理、理论、条件、手段等),标记“得到”标注的语用要素是“结果”(是指实验的、研究的数据,被确定的关系,得到的效果和性能等)。语用要素关系计算数据库存储不同语用体裁中语用要素关系对应的表达式,所述语用关系标记指与语用关系对应的常用关键词,语用要素关系是指每种语用体裁的各个语用要素之间存在的以形式逻辑、公式计算为基础的特定的计算关系。本专利技术的语用要素与以往“要素”的含义不完全相同。语用要素是指针对语用真值计算而设置的要素,各语用要素之间的关系存在确定的表达式。如摘要这种语用体裁中,可以根据需要设置“目的”、“方法”、“结果”、“结论”四个要素,也可以设置成“目的”、“方法”、“结果”三个要素,还可以设置为“对象”、“方法”、“结果”三个要素,也就是说,同一种体裁下可以对应不同的语用要素方案,书写者可以根据自己的需要选择语用要素方案。以三要素的语用体裁为例,可以设三要素为三元组w=(i,j,k),当j为一个二元关系式,i和k分别为对象集合和结果集合,符合j的定义域,真值为j的值域,k∈j的值域;语用体裁真值库,存储不同语用体裁中语用要素关系对应的语用真值表;例如,以摘要的三要素(对象、方法、结果)为例,三者之间关系对应的结构语用真值表如下,其中A为对象,B为方法,C为结果。ABCA∧B∧CTrueTrueTrueTrueTrueTrueFalseFalseTrueFalseTrueFalseTrueFalseFalseFalseFalseTrueTrueFalseFalseTrueFalseFalseFalseFalseTrueFalseFalseFalseFalseFalse以摘要的三要素(对象、方法、结果)关系对应的创新语用真值表如下,其中A为对象,B为方法,C为结果。ABCA∨B∨CNewNewNewNewOldOldNewNewNewNewOldNewNewOldNewNewNewOldOldOldOldNewNewNewOldNewOldNewOldOldOldOld以摘要的四要素(目的、方法、结果、结论)关系对应的创新语用真值表如下,其中A为目的,B为方法,C为结果,D为结论。ABCDA∨B∨CNewNewNewNewNewNewNewNewOldNewOldOldNewNewNewOldOldNewOldNewNewNewOldNewNewNewNewOldOldNewNewOldNewNewNewNewOldNewOldNewNewOldOldNewOldNewOldOldOldNewOldNewNewNewNewOldNewNewOldNewOldNewOldNewNewOldNewOldOldNewOldOldOldNewOldOldOldOldOldOld本文档来自技高网...

【技术保护点】
1.以语用为核心的自然语言文本辅助知识库书写和检测系统,以汉语为输入语言,其特征在于,包括:/n语用体裁库,存储若干种语用体裁,语用体裁是有固定语用要素的由句子构成的有特殊使用目的体裁;/n语用要素表达子系统,分别匹配不同语用体裁,包括语用要素标记数据库和语用要素关系计算数据库,语用要素标记数据库存储不同语用体裁中的语用要素标记以及各标记所标注的语用要素类型,语用要素关系计算数据库存储不同语用体裁中语用要素关系对应的表达式;/n语用体裁真值库,存储不同语用体裁中语用要素关系对应的语用真值表;/n语用关系子系统,包括语用关系标记数据库和语用关系表达式数据库,语用关系标记数据库存储标注语用关系的各种标记,语用关系表达式数据库存储各语用关系所对应的逻辑和数学运算关系;/n知识推理子系统,包括知识层级数据库以及知识网络计算数据库。/n

【技术特征摘要】
1.以语用为核心的自然语言文本辅助知识库书写和检测系统,以汉语为输入语言,其特征在于,包括:
语用体裁库,存储若干种语用体裁,语用体裁是有固定语用要素的由句子构成的有特殊使用目的体裁;
语用要素表达子系统,分别匹配不同语用体裁,包括语用要素标记数据库和语用要素关系计算数据库,语用要素标记数据库存储不同语用体裁中的语用要素标记以及各标记所标注的语用要素类型,语用要素关系计算数据库存储不同语用体裁中语用要素关系对应的表达式;
语用体裁真值库,存储不同语用体裁中语用要素关系对应的语用真值表;
语用关系子系统,包括语用关系标记数据库和语用关系表达式数据库,语用关系标记数据库存储标注语用关系的各种标记,语用关系表达式数据库存储各语用关系所对应的逻辑和数学运算关系;
知识推理子系统,包括知识层级数据库以及知识网络计算数据库。


2.根据权利要求1所述以语用为核心的自然语言文本辅助知识库书写和检测系统,其特征在于,所述体裁为论文摘要、借条、合同、通知、报导、诉状或专利申请书等,其书写范围包括词库、语法、动词以及语用格。


3.根据权利要求2所述以语用为核心的自然语言文本辅助知识库书写和检测系统,其特征在于,所述体裁为论文摘要时,语用要素为目的、方法、结果、结论,或者为对象、方法、结果;体裁为借条时,语用要素为债权人、借款金额、利息计算方式、还款时间、债务人、借款日期;体裁为劳动合同时,语用要素为劳动者、用人单位、合同期限、工作内容、劳动报酬、劳动纪律。


4.根据权利要求1所述以语用为核心的自然语言文本辅助知识库书写和检测系统,其特征在于,还包括存储汉语的词性标记和语法规则的词法、语法规则库。


5.根据权利要求1所述以语用为核心的自然语言文本辅助知识库书写和检测系统,其特征在于,所述语用要素表达子系统具有语用要素标注的功能。


6.根据权利要求1所述以语用为核心的自然语言文本辅助知识库书写和检测系统,其特征在于,所述语用要素标记指与语用要素对应的常用关键词;所述语用关系标记指与语用关系对应的常用关键词;所述语用要素关系是指每种语用体裁的各个语用要素之间存在的以形式逻辑、公式计算为基...

【专利技术属性】
技术研发人员:谷松赵丽新张新华李国霞
申请(专利权)人:谷松赵丽新张新华李国霞
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1