基于语素的汉语智能处理方法和系统及装置制造方法及图纸

技术编号:19903438 阅读:33 留言:0更新日期:2018-12-26 02:55
本发明专利技术提供了一种基于语素的汉语智能处理方法和系统及装置。其方法包括如下步骤:以语素作为构词单位,收集诗词数据;建立诗词数据库的字段,并生成关系型诗词数据库字段;将所述收集到的诗词数据,添加到所述关系型诗词数据库各字段中,并建立所述诗词数据内部之间,以及诗词数据之间的数据链接树生成具有诗词数据的关系型语素数据库。其具有对诗词的检索功能,使得人们能够方便、快速、准确地处理汉语诗词。

【技术实现步骤摘要】
基于语素的汉语智能处理方法和系统及装置
本专利技术涉及计算机数据处理
,特别涉及一种在计算机中对汉语,特别是古诗词等,如《唐诗》、《宋词》、《三字经》、《史记》、《诗经》等进行智能处理方法和系统及装置。
技术介绍
中国至少五千年的古代文化,随着中国大陆的改革开放和发展强大,渐渐地被外国人所了解,特别是其中的古代文化,令很多外国人,特别是外国研究人员所着迷,其中的古诗词,用短短的几行有限的字,就能充分表述了人们的意境,让人感叹。例如:唐代诗人贺知章的《回乡偶书》,“少小离家老大回,乡音不改鬓毛衰;儿童相见不相知,笑问客从何处来。”这首诗是久客异乡、缅怀故里的感怀诗。诗人置身于故乡熟悉而又陌生的环境之中,一路迤逦行来,心情颇不平静;当年离家,风华正茂;今日返归,鬓毛疏落,不禁感慨系之。然而,在人们心中,特别是外国人和儿童心中,由于汉语言的学习难度太高,无法很好地学习,很多人更谈不上对这种中国古代精华的诗词的理解,也就无法全面地欣赏古诗词,如从中国某人的一句诗词或者诗词中的某个字词检索到某诗词,并对该诗词全文及读法、各种外语翻译、作者等的理解,无法对世界文化作出应有的贡献。专利技术内本文档来自技高网...

【技术保护点】
1.一种基于语素的汉语智能处理方法,其特征在于,包括以下步骤:以语素作为构词单位,收集诗词数据;建立诗词数据库的字段,并生成关系型诗词数据库字段;将所述收集到的诗词数据,添加到所述关系型诗词数据库各字段中,并建立所述诗词数据内部之间,以及诗词数据之间的数据链接树生成具有诗词数据的关系型语素数据库。

【技术特征摘要】
2017.06.14 CN 20171044649351.一种基于语素的汉语智能处理方法,其特征在于,包括以下步骤:以语素作为构词单位,收集诗词数据;建立诗词数据库的字段,并生成关系型诗词数据库字段;将所述收集到的诗词数据,添加到所述关系型诗词数据库各字段中,并建立所述诗词数据内部之间,以及诗词数据之间的数据链接树生成具有诗词数据的关系型语素数据库。2.根据权利要求1所述的汉语智能处理方法,其特征在于,还包括如下步骤:以语素为词及短语的构词单位,使用所述诗词数据库进行检索诗词数据。3.根据权利要求2所述的汉语智能处理方法,其特征在于,还包括如下步骤:根据所述诗词数据链接树得到原文全文、翻译、读音、作者、历史中的一种或者多种的组合。4.根据权利要求2或3所述的汉语智能处理方法,其特征在于,还包括如下步骤:如未检索到所需要的诗词,则直接返回;或者返回将检索到的其他诗词,作为新的诗词数据,添加到关系型诗词数据库中,并进行关系型数据链接树,然后返回退出。5.根据权利要求1所述的汉语智能处理方法,其特征在于,所述添加数据并对数据进行关系链接,包括如下步骤:将收集到的诗词数据,添加到所述关系型诗词数据库的各字段中;建立以语素为根,建立单字语素和词语语素为技,诗词数据为叶的数据链接树;在数据链接树的各个诗词数据之间,建立相应的链接。6.根据权利要求5所述的汉语智能处理方法,其特征在于,所述语素是最小语言单位,比字更小,同一个字对应多个语素;语素和字之间的最明显区别是语素表意,中性,用多种不同字形显示,所以其代码称之为“中性码”。7.根据权利要求6所述的汉语智能处理方法,其特征在于,所述语素从组词角度分为①语文类语素②姓氏类语素③人名类语素④地名类语素⑤科技类语素⑥古汉语语素⑦无义表音语素⑧表形语素。8.根据权利要求6所述的汉语智能处理方法,其特征在于,所述诗词数据为古诗词数据;所述古诗词数据为《唐诗》、《宋词》、《诗经》、《史记》、《说文解字》、《三字经》、《康熙字典》中一种或者一种以上的组合。9.根据权利要求6所述的汉语智能处理方法,其特征在于,所述诗词数据库包括诗词原文字段和诗词翻译字段。10.根据权利要求9所述的汉语智能处理方法,其特征在于,所述诗词数据库还包括原文中文读法字段...

【专利技术属性】
技术研发人员:夏铨真
申请(专利权)人:佛山辞荟源信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1