【技术实现步骤摘要】
本专利技术涉及现代汉语分析,更具体地说,涉及一种基于图网络的汉字及结构的关联分析方法、介质及设备。
技术介绍
1、语法分析是自然语言处理中一个比较重要的任务,其目标是分析句子的语法结构,反映一个完整句子中的字词关联。由于自然语言分布特性,不同领域的语料库在知识侧重方面也大有不同,例如,在开放域的语料库中,虚词的出现频率明显高于实词;在垂直域的语料库中,专业名词的出现频率明显高于非专业名词;相同的汉字在不同的语境下也蕴含截然相反的意思。简单地通过汉字出现的频率来衡量其重要程度明显缺乏合理性。在汉语言研究领域的现有工作中,尚未发现一种科学的分析方法能够在不同类型的中文语料库中因地制宜的准确量化每个汉字的贡献度。
2、现代汉语的常规分析方法通常采用语法树对完整语句进行结构分析。语法树就是按照某一语言规则进行推导时所形成的能够反映句子语法结构的图形表示。一棵语法树包括了一个句型的所有可能的推导过程。语法树的构建和设计以人工经验为主导,蕴含了丰富且专业的语言学知识。
3、但是以人工经验为主导的语法树分析方式在数据层面上局限
...【技术保护点】
1.一种基于图网络的汉字及结构的关联分析方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的基于图网络的汉字及结构的关联分析方法,其特征在于:所述步骤S1,是指:
3.根据权利要求1所述的基于图网络的汉字及结构的关联分析方法,其特征在于:所述步骤S2,是指:
4.根据权利要求1所述的基于图网络的汉字及结构的关联分析方法,其特征在于:所述步骤S3,包括如下步骤:
5.根据权利要求1所述的基于图网络的汉字及结构的关联分析方法,其特征在于:所述步骤S4中关键指标,是指:平均最短路径长度、半径与直径、强连通分量中的任一项或
<...【技术特征摘要】
1.一种基于图网络的汉字及结构的关联分析方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的基于图网络的汉字及结构的关联分析方法,其特征在于:所述步骤s1,是指:
3.根据权利要求1所述的基于图网络的汉字及结构的关联分析方法,其特征在于:所述步骤s2,是指:
4.根据权利要求1所述的基于图网络的汉字及结构的关联分析方法,其特征在于:所述步骤s3,包括如下步骤:
5.根据权利要求1所述的基于图网络的汉字及结构的关联分析方法,其特征在于:所述步骤s4中关键指标,是指:平均最短路径长度、半径与直径、强连通分量中的任一项或两项以上;
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。