一种古汉语语义分析方法及其系统技术方案

技术编号：16755545 阅读：44 留言：0更新日期：2017-12-09 02:04

本发明专利技术提供一种古汉语语义分析方法，包括步骤获取古汉语语句、词元划分、词元翻译、语义拼接、语义检查；本发明专利技术还提供一种古汉语语义分析系统，包括配置库、分析模块；配置库包括古汉语词典库；古汉语词典库包括词元释义；分析模块包括划分模块、翻译模块、拼接模块、检查模块、输出模块；本发明专利技术采用词元划分将古汉语语句划分为若干词元，获取古汉语词典库中的词元释义，后将若干词元释义拼接成古汉语初始语义，最终将古汉语初始语义与现代汉语语义模板进行匹配检查，解决古汉语语义的分析问题；本发明专利技术逻辑缜密，方法高效实用，打破古汉语分析缺乏稳定性的难题，便于古汉语语义的规则化分析与实现。

An ancient Chinese semantic analysis method and its system

The present invention provides an analysis method for ancient Chinese semantics, which comprises the following steps of ancient Chinese language, word element division, words translation, semantic splicing, semantic check; the invention also provides an ancient Chinese semantic analysis system, including the configuration database, analysis module; the repository includes ancient Chinese dictionary; ancient Chinese Dictionary includes the word element definitions; analysis module including partition module, translation module, splicing module, check module, output module; the invention adopts the ancient Chinese sentence word division is divided into several words, for the ancient Chinese dictionary in the library Yuanshi word meaning, word elements will be spliced into the interpretation of ancient Chinese initial semantics, will eventually the matching test of ancient Chinese and modern Chinese initial semantic semantic template, analyze and solve problems in ancient Chinese semantics; the logical, efficient and practical method, break the ancient Chinese The analysis of language is not a problem of stability, so it is easy to analyze and implement the semantic rules of ancient Chinese.

全部详细技术资料下载

【技术实现步骤摘要】
一种古汉语语义分析方法及其系统
本专利技术涉及语义分析，尤其涉及一种古汉语语义分析方法及其系统。
技术介绍
古汉语是我国古代文化的重要载体，正确解读古汉语成为人们研究分析古代文化的关键途径；目前，有不少学者对古汉语的语义分析展开研究，其中基于统计学规律的分析方法，利用统计大量的古汉语分析数据得出一定的分析规律来辅助古汉语分析释义，但统计规律很大程度上是基于经验主义的分析方法，通过归总古汉语的形式形态的出现频率，指导古汉语分析。但因古汉语表现形式丰富，释义不一，无法确保语义分析的稳定性与一致性。
技术实现思路
为了克服现有技术的不足，本专利技术的目的在于提供一种古汉语语义分析方法及其系统。本专利技术提供一种古汉语语义分析方法，包括以下步骤：获取古汉语语句，用户端上传待分析的古汉语信息，获取以完整句为最小输入单元的古汉语语句；词元划分，获取古汉语语句中词元，所述的词元为最小的语义单元，将所述古汉语语句中的词元顺序存储于词元栈中；词元翻译，获取所述的词元栈，检索查找古汉语词典库中的词元释义，建立所述词元的释义关系映射；语义拼接，获取所述词元的释义关系映射，排列组合各所述词元的的释义，得到古汉语初始语义；语义检查，获取所述古汉语初始语义，匹配现代汉语语义模板，匹配成功则将古汉语初始语义存储至输出缓存区得到待输出语义；匹配不成功则返回语义拼接；语义输出，输出待输出语义。进一步地，所述的古汉语语义分析方法还包括朝代匹配，所述的朝代匹配位于词元翻译与语义拼接之间；所述的词元释义中包括词元朝代信息；所述的朝代匹配具体为获取所述词元栈中词元朝代信息，统计得到词元栈中频率最高的词...
一种古汉语语义分析方法及其系统

【技术保护点】
一种古汉语语义分析方法，其特征在于，包括以下步骤：获取古汉语语句，用户端上传待分析的古汉语信息，获取以完整句为最小输入单元的古汉语语句；词元划分，获取古汉语语句中词元，所述的词元为最小的语义单元，将所述古汉语语句中的词元顺序存储于词元栈中；词元翻译，获取所述的词元栈，检索查找古汉语词典库中的词元释义，建立所述词元的释义关系映射；语义拼接，获取所述词元的释义关系映射，排列组合各所述词元的的释义，得到古汉语初始语义；语义检查，获取所述古汉语初始语义，匹配现代汉语语义模板，匹配成功则将古汉语初始语义存储至输出缓存区得到待输出语义；匹配不成功则返回语义拼接；语义输出，输出待输出语义。

【技术特征摘要】
1.一种古汉语语义分析方法，其特征在于，包括以下步骤：获取古汉语语句，用户端上传待分析的古汉语信息，获取以完整句为最小输入单元的古汉语语句；词元划分，获取古汉语语句中词元，所述的词元为最小的语义单元，将所述古汉语语句中的词元顺序存储于词元栈中；词元翻译，获取所述的词元栈，检索查找古汉语词典库中的词元释义，建立所述词元的释义关系映射；语义拼接，获取所述词元的释义关系映射，排列组合各所述词元的的释义，得到古汉语初始语义；语义检查，获取所述古汉语初始语义，匹配现代汉语语义模板，匹配成功则将古汉语初始语义存储至输出缓存区得到待输出语义；匹配不成功则返回语义拼接；语义输出，输出待输出语义。2.如权利要求1所述的一种古汉语语义分析方法，其特征在于：所述的古汉语语义分析方法还包括朝代匹配，所述的朝代匹配位于词元翻译与语义拼接之间；所述的词元释义中包括词元朝代信息；所述的朝代匹配具体为获取所述词元栈中词元朝代信息，统计得到词元栈中频率最高的词元朝代，并对所述词元的释义关系映射按照词元朝代信息排序，高频率的词元朝代的词元释义位于低频率的词元朝代的词元释义之前。3.如权利要求2所述的一种古汉语语义分析方法，其特征在于：所述的古汉语语义分析方法还包括句式匹配，所述的句式匹配位于朝代匹配与语义拼接之间；所述的句式匹配具体为根据朝代建立句式库，获取所述的频率最高的词元朝代，得到所述的频率最高的词元朝代的语义句式，所述语义句式为所述词元的关系链表，根据所述的语义句式对所述的词元栈中的词元进行重新排序。4.如权利要求1所述的一种古汉语语义分析方法，其特征在于：所述的古汉语词典库包括词元典故，所述的语义检查还包括词元典故检查，匹配现代汉语语义模板后，对所述的古汉语初始语义与所述的词元典故进行匹配，匹配成功则将古汉语初始语义存储至输出缓存区得到待输出语义；匹配不成功则返回语义拼接。5.如权利要求3所述的一种古汉语语义分析方法，其特征在于：所述的古汉语语义分析方法还包括语义自学习，所述的语义自学习统计并记录所述的词元释义的频率、词元朝代频率、句式频率，根据所述的释义的频率、词元朝代频率、句式频率排序下一所述的古汉语语句中相同词元的词元释义、词元朝代、...

【专利技术属性】
技术研发人员：熊卫，
申请(专利权)人：广州尚恩科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人