【技术实现步骤摘要】
一种文言文的解析方法及系统
本专利技术涉及自然语言处理解析
,尤指一种文言文的解析方法及系统。
技术介绍
文言文是用“文言”这种古代书面语写成的文章。所谓“文言”,是汉语书面语的一种,产生于先秦时期,因此,文言文首先是指古代秦汉时期所写的文章,也包括后代作家模仿秦汉语言而写成的文章。从外延来看,“文言文”指古代诗、词、曲、小说以外的各体文章,主要包括散体文、赋与骈文等。几千年中华文化的核心都蕴含在文言文中,它是中华文化数千年延绵不断的主要原因之一,也是中国古人的信仰、价值观的载体。可以说,文言文就是中华文化基因图谱。与现代白话文相比,文言文语言往往更为简洁典雅。在移动应用中,比如手机短信中能够较少的文字表达丰富的含义;同时在游戏(比如与历史相关的游戏)、网上聊天等场景中,用文言文要么更符合场景的需求,要么能显得风趣幽默,更好地起到娱乐休闲的效果。然而,文言文学习往往无法一蹴而就,大多数人无法流利使用文言文,特别是对于文言文初学者来说,在读一篇新的文言文时,字词解释是最大的障碍,发现68%学生因为不理解文 ...
【技术保护点】
1.一种文言文的解析方法,其特征在于,包括:/n获取文言文中易混淆的关键词,根据所述关键词建立关键词库;/n获取文言文样本和对应的样本语义;/n结合所述关键词库,根据所述文言文样本和所述样本语义确定样本属性信息;/n根据所述样本属性信息和所述关键词库建立语义概念图;/n获取文言文语料;/n将所述文言文语料与所述关键词库进行比对,确定所述文言文语料中包含的语料关键词;/n根据所述文言文语料分析所述语料关键词的属性信息;/n结合所述语义概念图,分析所述语料关键词和所述属性信息确定所述语料关键词对应的语料关键词语义;/n结合所述语料关键词语义分析所述文言文语料确定文言文语料语义。/n
【技术特征摘要】
1.一种文言文的解析方法,其特征在于,包括:
获取文言文中易混淆的关键词,根据所述关键词建立关键词库;
获取文言文样本和对应的样本语义;
结合所述关键词库,根据所述文言文样本和所述样本语义确定样本属性信息;
根据所述样本属性信息和所述关键词库建立语义概念图;
获取文言文语料;
将所述文言文语料与所述关键词库进行比对,确定所述文言文语料中包含的语料关键词;
根据所述文言文语料分析所述语料关键词的属性信息;
结合所述语义概念图,分析所述语料关键词和所述属性信息确定所述语料关键词对应的语料关键词语义;
结合所述语料关键词语义分析所述文言文语料确定文言文语料语义。
2.根据权利要求1所述的文言文的解析方法,其特征在于,获取文言文中易混淆的关键词,根据所述关键词建立关键词库具体包括:
获取文言文中易混淆的所述关键词;
获取所述关键词对应的词语信息,所述词语信息包括关键词词性和关键词词义;
根据所述关键词和所述词语信息建立所述关键词库。
3.根据权利要求1所述的文言文的解析方法,其特征在于,结合所述关键词库,根据所述文言文样本和所述样本语义确定样本属性信息具体包括:
将所述文言文样本与所述关键词库进行比对,确定所述文言文样本中包含的样本关键词;
根据所述样本语义确定所述样本关键词的样本关键词语义;
根据所述样本关键词分析所述文言文样本确定所述样本属性信息,所述样本属性信息为所述样本关键词与所述文言文样本中其余的样本词语之间的位置关系。
4.根据权利要求3所述的文言文的解析方法,其特征在于,根据所述样本属性信息和所述关键词库建立语义概念图具体包括:
根据所述样本关键词、所述样本词语以及所述位置关系建立每一个文言文样本对应的样本概念图;
根据所述关键词库将所有的样本概念图结合,得到所述语义概念图。
5.根据权利要求1-4任一项所述的文言文的解析方法,其特征在于,还包括:
根据所述语料关键词、所述属性信息以及所述语料关键词语义确定相符的文言文样本,将所述相符的文言文样本集合生成拓展训练集;
根据所述拓展训练集进行知识拓展训练。
6.一种文言文的解析系统,其特征在于,包括:
词库建立模块,获取文言文中易混淆的关键词,根据所述关键词建立关键词库;
样本获取模块,获取文言文样本和对应的样本语义;
信息处理模块,结合所述词库建立模块建立的所述关键词库,根据所述样本获取模块获取的所述文言文样本和所述样本语义确定样本属性信息;
概念图建立模块,根据所述信息处理模块确定的所述样本属性信息和所述所述词库建立模块建立的关键词库建立语义概念图;
语料获取模块,获取文言文语料...
【专利技术属性】
技术研发人员:魏誉荧,
申请(专利权)人:广东小天才科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。