当前位置: 首页 > 专利查询>孙军堂专利>正文

文本数据多元权数和属性的递归分解运算方法技术

技术编号:36758212 阅读:26 留言:0更新日期:2023-03-04 10:51
一种多元权数的属性的递归分解运算方法,涉及计算机应用技术和AI智能领域,用于数据多元权数或属性的自主消歧与信息决策,把一个多元或多项属性的数据,处理成符合其应用环境的单一数据。方法基于绑定的词典库切分文本数据并获取其数据格式;并基于绑定的“知识库”和“基础装置”,方法去构造待处理文本数据对象与它左右环境的文本数据对象的存在现象,基于存在现象的数字化组合描述,去“知识库”文件中查询相关的逻辑知识及其候选结果,以辨析并决策当前数据与当前环境数据之间最可行的逻辑关系,即过滤掉当前数据属性中与当前环境数据数据之间不适当的属性,以保障逻辑决策和执行的合理性。合理性。合理性。

【技术实现步骤摘要】
文本数据多元权数和属性的递归分解运算方法


[0001]本专利技术涉及计算机应用技术和AI智能领域,具体涉及数据多元权数的自主理解、歧义消除方法。

技术介绍

[0002]在AI智能领域,通常会面对一个数据的多元属性筛选问题,通过人工训练模型来决策存在一定比率的不确定性,会影响逻辑结果甚至得出不想要的逻辑结果。
[0003]当机器具有相对自主消歧与决策能力时,能够让机器在执行复杂逻辑时,避开对训练模型权数的依赖和其局限,大幅提高执行逻辑的正确率。

技术实现思路

[0004]本申请是一种多元权数的属性的递归分解运算方法,用于数据多元权数或属性的自主消歧与信息决策,把一个多元或多项属性的数据,处理成符合其应用环境的单一数据。所述方法基于绑定的词典库切分文本数据并获取其数据格式;并基于绑定的“知识库”和“基础装置”,方法去构造待处理文本数据对象与它左右环境的文本数据对象的存在现象,基于存在现象的数字化组合描述,去“知识库”文件中查询相关的逻辑知识及其候选结果,以辨析并决策当前数据与当前环境数据之间最可行的逻辑关系,即过滤掉当前数据属性中与当前环境数据数据之间不适当的属性,以保障逻辑决策和执行的合理性。
[0005]本申请按“基础数据格式、知识格式、知识运用法、候选结果筛选方法、候选对象选择方法、基础装置、多元知识数字化二维表式设计与编制方法、多元知识数字化三维表式设计与编制方法”八个部分说明,包括:
[0006]一、基础数据格式。由数据区、左区运算区、属性候选区、右区运算区;如图9所示,特征包含:
[0007]1.文本数据区,包括:
[0008]AA列(String):数据参数;作为数据匹配、调用数据格式的依据;
[0009]BB列(String):数据转换参数;用于数据的形式转换;如英文转换成中文或其它信息类型转换等;
[0010]2.左区运算;数字化管理与调用类型方法(基础程序),执行知识方法运算(知识运用),
[0011]包括:
[0012]LC列(int):左区数字区间与相邻综合运算管理及知识方法标注;用于数据运算方法的宏观管理;
[0013]LB列(int):左区数字区间运算管理与知识方法标注;用于分析数据宏观分类的区间运
[0014]算与管理;
[0015]LA列(String):左区相邻运算分类管理;用于分析数据宏观分类的基础管理;
[0016]K列(int):LA的数字化索引与链接的知识方法标注;
[0017]3.属性候选区,包括:
[0018]S列(String):数据字符式属性;数据类型属性的字符化表达;
[0019]M列:第一候选属性;用于左区运算的候选结果去筛选候选对象;
[0020]N列:第二候选属性;用于右区运算的候选结果去筛选候选对象;
[0021]4.右区运算;数字化管理与调用类型方法(基础程序),执行知识方法运算(知识运用),
[0022]包括:
[0023]RA列(int):右区数字相邻运算管理与知识方法标注1分区;
[0024]RB列(int):右区数字区间运算管理与知识方法标注2分区;
[0025]RC列(int):右区数字相邻与区间综合运算管理与知识方法标注3分区;
[0026]RD列(int):右区数字相邻与区间综合运算管理与知识方法标注4分区;
[0027]RE列(int):右区数字相邻与区间综合运算管理与知识方法标注5分区;
[0028]其中,M值是数据对象的词性属性值,是运算的主体,在绑定词典库中的基本规则是:名词集合以奇数作尾数,如尾数1、3、5、7、9主要用作代词、名词、数词、形容词、量词等词性的标识;非名词集合以偶数作尾数,如尾数0、2、4、6、8主要用途副词、动词、介词、连词等词性的标识。下文主要以奇、偶数或数的具体类型来描述本申请所涉及的方法和概念,不再以动词、名词等名称表达。
[0029]二、知识方法格式;知识方法作为知识库的基本内容,如图10所示,其数字化阵列式编制方法包括:
[0030]第一列L用于描述数据的知识方法类型编号K左边的数据属性(左边的条件);
[0031]第二列K用于定义数据的知识方法类型编号;
[0032]第三列R用于描述K右边的数据属性(右边的条件);
[0033]第四列KL用于定义K与L的组合现象的候选结果(基于左边条件产生的结果);
[0034]第五列KR用于定义K与R的组合现象的候选结果(基于右边条件产生的结果)。
[0035]基于知识方法类别(第二列K)的数字编码,分别描述其与左、右两边(第一列L、第三列R)的各数据属性间的存在现象,并给出它们各自存在现象的候选结果:当描述与左边的数据属性的存在现象时,其对应的逻辑关系结果描述于第四列KL、当描述与右边的数据属性的存在现象时,其对应的逻辑关系结果描述于第五列KR。其目的是用于把人的常规逻辑知识预制成可方便机器查询的阵列模型,是一种人机知识交流的机制,作为多元权数递归分解运算的逻辑知识基础。
[0036]知识方法格式的列表分列位置及代称字符允许自定义调整,但需要与调用它的方法一致。
[0037]三、知识运用法。一种机器运用知识的具体手段,基于

知识格式

和第六部分

基础装置

中设定的读取数据时的边界权限运行。包含

一元知识运用法



多元知识运用法


[0038](一).一元知识运用法(一元运算):其处理过程如图3所示,包括:
[0039]1、读取属性:遍历待分析数据左、右的数据属性;
[0040]2、描述与构造存在现象:分别描述与构造当前数据与左、右环境若干数据的存在
现象;
[0041]与左边环境数据的存在现象描述与构造为:L+K,与右边环境数据的存在现象描述与构造为:K+R;
[0042]3、匹配存在现象并收集结果:基于描述与构造的存在现象,去知识库中匹配各存在现象及对应的结果;与左边环境数据的存在现象的对应结果为KL值,与右边环境数据的存在现象的对应结果为KR值;
[0043]4、筛选结果:由候选结果筛选方法在所收集的若干候选结果中,筛选出唯一候选结果作为候选结果。
[0044]例如

抓紧

,其对比理解示例如下表S10:
[0045]例句译文对比简述抓紧工作Hurried up work

抓紧

作副词抓紧绳子Seize the cord

抓紧

作动词
[0046]例句所用词汇在绑定词典库中的数据格式如下表S10

1:
[0047]AABBLCLBLAK本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本数据多元权数和属性的迭代分解运算方法,其特征包括:迭代获取待处理数据,基于绑定的词典库文件及其数据格式、知识库文件、基础装置,执行

左区运算

,收集其运算的若干候选结果,然后执行

候选结果筛选

,基于其筛选规则筛选出唯一候选结果,然后执行

候选结果判断

:如果候选结果是空,则执行其安全策略方法

默认选择

,于数据候选属性区与

左区运算



右区运算

分别对应的第一或第二候选属性中选择最小值作为候选对象;如果

候选结果判断

判断候选结果不是空,然后则执行

候选对象选择



候选对象选择

基于候选结果,于数据候选属性区与

左区运算



右区运算

分别对应的第一或第二候选属性中筛选候选对象;基于

候选对象选择

规则所选择的候选对象,然后对其执行

候选对象唯一项判断

,如果候选对象是唯一项则结束当前方法线程并迭代新的方法线程;否则如果判断候选对象不是唯一项,然后则执行

右区运算

,收集其运算的若干候选结果,重复执行从

候选结果筛选



候选对象唯一项筛选

。2.根据权利要求1所...

【专利技术属性】
技术研发人员:孙军堂
申请(专利权)人:孙军堂
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1