一种云端字库的汉字图形网络构建方法技术

技术编号:30157516 阅读:22 留言:0更新日期:2021-09-25 15:09
本发明专利技术公开了一种云端字库的汉字图形网络构建方法,对获取的汉字原始信息进行编码转换和临时存储;基于汉字认知描述库对临时存储的基本语义信息文档进行对比分析,得到多层基本语义联结关系图和对应的基本语义分析结果;基于汉字认知描述库对临时存储的扩展语义信息文档进行对比分析,得到多层扩展语义联结关系图和对应的扩展语义分析结果;对所述基本语义分析结果和所述扩展语义分析结果进行交差语义分析;并基于得到的多层交叉语义联结关系图对所述多层基本语义联结关系图和所述多层扩展语义联结关系图进行循环语义提取和存储,完成汉字图形网络模型的构建,能让多模态下的各个输入能根据认知的需求实现平滑的输出。各个输入能根据认知的需求实现平滑的输出。各个输入能根据认知的需求实现平滑的输出。

【技术实现步骤摘要】
一种云端字库的汉字图形网络构建方法


[0001]本专利技术涉及云端字库
,尤其涉及一种云端字库的汉字图形网络构建方法。

技术介绍

[0002]在自然语言处理研究过程中,基于规则的方法通常采用对语言现象的综合和认识,总结规律,得到语法、语义等规则,然后生成语义目标;而基于语料库的方法则需要在在大规模语料库的支持下实现语义的输出。不论是哪种语言,这两种方法都要涉及对字(或单词)的认知分析。即先将文档拆分为句子,由句子拆分为词,由词再分解为字(或单词),最后分析单词的基本属性。
[0003]单一模态下自然语言处理不利于汉语的深度计算,而多模态的自然语言处理又难于控制和实现,如何建立自然语言认知的多模态机制,让多模态下的各个输入能根据认知的需求实现平滑的输出,这是长期以来在自然语言研究中的一个焦点问题。

技术实现思路

[0004]本专利技术的目的在于提供一种云端字库的汉字图形网络构建方法,能让多模态下的各个输入能根据认知的需求实现平滑的输出。
[0005]为实现上述目的,本专利技术提供了一种云端字库的汉字图形网络构建方法,包括以下步骤:
[0006]获取云端字库中对应的汉字原始信息,并所述汉字原始信息进行编码转换和临时存储;
[0007]基于汉字认知描述库对临时存储的基本语义信息文档进行对比分析,得到多层基本语义联结关系图和对应的基本语义分析结果;
[0008]基于汉字认知描述库对临时存储的扩展语义信息文档进行对比分析,得到多层扩展语义联结关系图和对应的扩展语义分析结果;
[0009]对所述基本语义分析结果和所述扩展语义分析结果进行交差语义分析,得到多层交叉语义联结关系图;
[0010]基于所述多层交叉语义联结关系图对所述多层基本语义联结关系图和所述多层扩展语义联结关系图进行循环语义提取和存储,完成汉字图形网络模型的构建。
[0011]其中,所述方法还包括:
[0012]将存储的多级语义进行转换,并与所述汉字认知描述库之外的资源进行比较,生成准确的语义表达。
[0013]其中,所述方法还包括:
[0014]将所述语义表达以语义信息编码的形式存储在语义描述库中。
[0015]其中,基于汉字认知描述库对临时存储的基本语义信息文档进行对比分析,得到多层基本语义联结关系图和对应的基本语义分析结果,包括:
[0016]将每一个汉字字符的结构特征转换为树状结构,将叶节点表示构成字符的每一个笔画;叶节点的上一层非叶结点表示构成该字符的偏旁部首,根节点表示这个字符本身,得到多层基本语义联结关系图;
[0017]对所述汉字字符中的每一笔画的关键点作为特征点,将所述特征点对应的时间、空间和状态属性作为权值进行量化计算,得到对应的基本语义分析结果。
[0018]其中,基于汉字认知描述库对临时存储的扩展语义信息文档进行对比分析,得到多层扩展语义联结关系图和对应的扩展语义分析结果之前,所述方法还包括:
[0019]基于构建的汉字图形语义网络模型的第五层语义关系集,在第四层的定义连结集或第三层的语义定义集中增加扩展语义的描述。
[0020]其中,基于汉字认知描述库对临时存储的扩展语义信息文档进行对比分析,得到多层扩展语义联结关系图和对应的扩展语义分析结果,包括:
[0021]基于构建的汉字字形描述库对汉字字符的语义进行编码;
[0022]根据编码后的所述汉字字符,将对应的特征点作为结点,以所述特征点之间的连线作为边,构建对应的多层扩展语义联结关系图和对应的邻接矩阵。
[0023]其中,获取云端字库中对应的汉字原始信息,并所述汉字原始信息进行编码转换和临时存储之后,所述方法还包括:
[0024]使用字形采集算法将编码文字进行特征化处理。
[0025]本专利技术的一种云端字库的汉字图形网络构建方法,获取云端字库中对应的汉字原始信息,并所述汉字原始信息进行编码转换和临时存储;基于汉字认知描述库对临时存储的基本语义信息文档进行对比分析,得到多层基本语义联结关系图和对应的基本语义分析结果;基于汉字认知描述库对临时存储的扩展语义信息文档进行对比分析,得到多层扩展语义联结关系图和对应的扩展语义分析结果;对所述基本语义分析结果和所述扩展语义分析结果进行交差语义分析,得到多层交叉语义联结关系图;基于所述多层交叉语义联结关系图对所述多层基本语义联结关系图和所述多层扩展语义联结关系图进行循环语义提取和存储,完成汉字图形网络模型的构建,能让多模态下的各个输入能根据认知的需求实现平滑的输出。
附图说明
[0026]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1是本专利技术提供的一种云端字库的汉字图形网络构建方法的步骤示意图。
[0028]图2是本专利技术提供的一种云端字库的汉字图形网络构建方法的流程示意图。
[0029]图3是本专利技术提供的汉字表示的层次结构图。
[0030]图4是本专利技术提供的多层次汉字语义网络示意图。
[0031]图5是本专利技术提供的多模态认知过程示意图。
[0032]图6是本专利技术提供的“安”字部件的邻接矩阵的关系图。
[0033]图7是本专利技术提供的“安”字部件的邻接矩阵图。
[0034]图8是本专利技术提供的汉字字形骨架及汉字图形网络的生成过程示意图。
具体实施方式
[0035]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0036]在本专利技术的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0037]请参阅图1和图2,本专利技术提供一种云端字库的汉字图形网络构建方法,包括以下步骤:
[0038]S101、获取云端字库中对应的汉字原始信息,并所述汉字原始信息进行编码转换和临时存储。
[0039]具体的,基于云端字库中存储的数据,获取对应的汉字原始信息,根据输入的信息格式不同,分为结构化数据输入和非结构化数据输入,结构化数据以文本为主,非结构化输入以图形为主。
[0040]编码转换。即对输入信息进行语义信息编码,使用基本模态信息的认知描本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种云端字库的汉字图形网络构建方法,其特征在于,包括以下步骤:获取云端字库中对应的汉字原始信息,并所述汉字原始信息进行编码转换和临时存储;基于汉字认知描述库对临时存储的基本语义信息文档进行对比分析,得到多层基本语义联结关系图和对应的基本语义分析结果;基于汉字认知描述库对临时存储的扩展语义信息文档进行对比分析,得到多层扩展语义联结关系图和对应的扩展语义分析结果;对所述基本语义分析结果和所述扩展语义分析结果进行交差语义分析,得到多层交叉语义联结关系图;基于所述多层交叉语义联结关系图对所述多层基本语义联结关系图和所述多层扩展语义联结关系图进行循环语义提取和存储,完成汉字图形网络模型的构建。2.如权利要求1所述的云端字库的汉字图形网络构建方法,其特征在于,所述方法还包括:将存储的多级语义进行转换,并与所述汉字认知描述库之外的资源进行比较,生成准确的语义表达。3.如权利要求2所述的云端字库的汉字图形网络构建方法,其特征在于,所述方法还包括:将所述语义表达以语义信息编码的形式存储在语义描述库中。4.如权利要求1所述的云端字库的汉字图形网络构建方法,其特征在于,基于汉字认知描述库对临时存储的基本语义信息文档进行对比分析,得到多层基本语义联结关系图和对应的基本语义分析结果,包括:将每一个汉字字符的结构特征转换为树状结构,将叶节点表示构成字符的每...

【专利技术属性】
技术研发人员:栗青生张丽罗志强郑珺陶贵丽王雪梅陈莉郑新源刘翔宇赵琳琳姜婳婳姜春竹
申请(专利权)人:浙江传媒学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1