一种基于语义分析的诗词检索方法及系统技术方案

技术编号:20866715 阅读:22 留言:0更新日期:2019-04-17 09:23
本申请提供一种基于语义分析的诗词检索方法及系统,所述方法在获取用户输入的会话文本后,判断会话文本是否含有必要属性信息,如果所述会话文本含有必要属性信息,根据所述必要属性信息对应词汇确定检索范围;如果所述会话文本中不含有必要属性信息,通过显示提示信息,提示用户再次输入并获取用户再次输入的补充文本,以多轮会话的形式获取含有必要属性信息的文本内容,确定符合会话文本的检索结果并反馈。本申请提供的检索方法,以多轮会话的形式提示用户输入补充文本,避免因用户输入的会话文本缺乏必要属性信息而无法检索到诗词资源的问题。解决传统检索方法对输入文本的要求高,无法检索到满足用户需求诗词资源的问题。

【技术实现步骤摘要】
一种基于语义分析的诗词检索方法及系统本申请要求在2018年6月1日提交中国专利局、申请号为201810557250.3、专利技术名称为“一种基于语义分析的诗词检索方法及系统”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及文本语义分析
,尤其涉及一种基于语义分析的诗词检索方法及系统。
技术介绍
自白话文普及以来,传统文学语言便不再作为日常用语的主流,加之网络用语对其产生的冲击,使得传统文学作品,尤其是文言文和诗词经常被使用者曲解其真实含义,不仅影响文化的传承和文学教育,而且是对传统文化的肆意践踏。为了便于传播传统文化,在传统文学领域中,会通过网络途径向诗词爱好者提供交流、赏析资源,旨在让更多人领略诗词之美和古语之趣,提高文化素养。由于古代文人智慧的结晶,留存于世的诗词数量庞大,提供文化素材的同时也为人们欣赏、学习提供障碍。因此,通过网络途径学习诗词作品需要对诗词资源进行检索。现有技术中示出的诗词检索方法,其本身与传统搜索引擎的检索方式相似,即通过将用户输入的文本进行分词,与网络资源库中的数据进行匹配,再将匹配相近的文本资源进行显示,呈现给检索用户。例如,用户输入文本“月落乌啼霜满天”,搜索引擎根据文本内容进行检索,确定该文本属于《枫桥夜泊》的诗句原文,并将《枫桥夜泊》的原文内容作为检索结果进行显示。从现有的诗词检索方法可以看出,诗词检索对文本的输入具有较高要求。而对于用户而言,个人诗词的理解程度参差不齐,很多用户由于自身知识的匮乏,在进行文本输入时并不能正确输入诗句内容,造成无法检索到合适的结果;或者用户想要检索表达某种情绪的诗词,如忧伤,喜悦,相思等,此时,输入的文本可能并不包含诗句内容,同样造成检索结果不尽如人意。例如,用户输入的文本内容为“表达思乡之情的诗词”,现有技术对于这种文本输入,一般通过检索用户在网络中提出的相似问题,以及将其他用户针对该问题的回答作为检索结果,可见检索结果极可能不能满足用户需求;另外,对于部分年代久远的诗词作品,语言佶屈聱牙,用户经常由于不能正确输入文本,而无法检索到想要的诗词资源。
技术实现思路
本申请提供了一种基于语义分析的诗词检索方法及系统,以解决传统检索方法对输入文本的要求高,进而无法检索到满足用户需求的诗词资源的问题。一方面,本申请提供一种基于语义分析的诗词检索方法,包括:获取用户输入的会话文本;根据所述会话文本内容,判断所述会话文本中是否含有必要属性信息,所述必要属性信息包括与诗词原文内容对应的词汇和/或描述诗词的词汇;如果所述会话文本中不含有必要属性信息,显示提示信息,并获取用户再次输入的补充文本,并根据所述补充文本内容,确定必要属性信息,所述提示信息包括询问必要属性信息以及提示再次输入信息;根据所述必要属性信息对应词汇确定检索范围;匹配所述检索范围内的诗词资源与所述必要属性信息,确定检索结果,并反馈检索结果。可选的,所述检索方法还包括:获取诗词文本信息,所述诗词文本信息包括诗词原文文本、诗词描述文本以及诗词赏析文本;根据所述诗词文本信息确定诗词属性信息,所述属性信息是文本信息对应的特征词汇集合;根据所述诗词属性信息对所述诗词文本信息进行分类,以及确定每个分类的分类标签;根据分类后的诗词文本构建诗词资源库。可选的,根据所述会话文本内容,判断所述会话文本中是否含有必要属性信息,所述必要属性信息包括与诗词原文内容对应的词汇和/或描述诗词的词汇的步骤,包括:提取所述会话文本中的关键词;获取所述必要属性信息对应的预置语料,并将所述关键词与所述预置语料进行匹配,所述预置语料包括,预置在数据库中的与诗词原文内容对应的词汇,和/或描述诗词的词汇;根据所述匹配结果,确定与所述预置语料相对应的关键词为必要属性信息。可选的,根据所述必要属性信息对应词汇确定检索范围的步骤,包括:获取所述会话文本中为所述必要属性信息的词汇数量;判断所述必要属性信息词汇数量是否大于1;如果所述词汇数量大于1,根据预设规则,设置多个所述必要属性信息词汇的优先级;确定所述优先级最高的所述必要属性信息词汇在所述诗词资源库中的分类,并作为检索范围;如果所述词汇数量等于1,确定所述词汇在所述诗词资源库中的分类,并作为检索范围。可选的,根据所述必要属性信息对应词汇确定检索范围的步骤,包括:获取所述会话文本中为所述必要属性信息的词汇数量;判断所述必要属性信息词汇数量是否大于1;如果所述词汇数量大于1,根据预设规则,设置多个所述必要属性信息词汇的优先级;根据所述优先级顺序,依次确定多个所述必要属性信息词汇在所述诗词资源库中的分类;根据每个所述分类的分类标签,确定所述诗词资源库中符合多个所述分类的诗词资源,构成诗词集合,并将所述诗词集合确定为检索范围;如果所述词汇数量等于1,确定所述词汇在所述诗词资源库中的分类作为检索范围。另一方面,本申请还提供一种基于语义分析的诗词检索系统,包括通过通信网络连接的终端和服务器,其中,所述终端用于提供用户会话文本输入、检索结果显示以及数据交互,所述服务器包括存储模块,并根据用户输入的会话文本检索诗词资源,所述服务器还包括:文本获取模块,用于获取用户输入的会话文本;必要属性信息确定模块,用于根据所述会话文本内容,判断所述会话文本中是否含有必要属性信息,所述必要属性信息包括与诗词原文内容对应的词汇和/或描述诗词的词汇;提示信息模块,用于如果所述会话文本中不含有必要属性信息,显示提示信息,并获取用户再次输入的补充文本,并根据所述补充文本内容,确定必要属性信息,所述提示信息包括询问必要属性信息以及提示再次输入信息;检索范围确定模块,用于根据所述必要属性信息对应词汇确定检索范围;检索结果反馈模块,用于匹配所述检索范围内的诗词资源与所述必要属性信息,确定检索结果,并反馈检索结果。可选的,所述服务器还包括:诗词文本信息模块,用于获取诗词文本信息,所述诗词文本信息包括诗词原文文本、诗词描述文本以及诗词赏析文本;属性信息模块,用于根据所述诗词文本信息确定诗词属性信息,所述属性信息是文本信息对应的特征词汇集合;分类模块,用于根据所述诗词属性信息对所述诗词文本信息进行分类,以及确定每个分类的分类标签;诗词资源库模块,用于根据分类后的诗词文本构建诗词资源库。可选的,所述必要属性信息确定模块包括:关键词提取单元,用于提取所述会话文本中的关键词;关键词匹配单元,用于获取所述必要属性信息对应的预置语料,并将所述关键词与所述预置语料进行匹配,所述预置语料包括,预置在数据库中的与诗词原文内容对应的词汇,和/或描述诗词的词汇;必要属性信息确定单元,用于根据所述匹配结果,确定与所述预置语料相对应的关键词为必要属性信息。可选的,所述检索范围确定模块包括:词汇数量获取单元,用于获取所述会话文本中为所述必要属性信息的词汇数量;词汇数量判断单元,用于判断所述必要属性信息词汇数量是否大于1;优先级确定单元,用于如果所述词汇数量大于1,根据预设规则,设置多个所述必要属性信息词汇的优先级;检索范围确定单元,用于确定所述优先级最高的所述必要属性信息词汇在所述诗词资源库中的分类,并作为检索范围;并且,如果所述词汇数量等于1,确定所述词汇在所述诗词资源库中的分类,并作为检索范围。可选的,所述检索范围确定模本文档来自技高网
...

【技术保护点】
1.一种基于语义分析的诗词检索方法,其特征在于,包括:获取用户输入的会话文本;根据所述会话文本内容,判断所述会话文本中是否含有必要属性信息,所述必要属性信息包括与诗词原文内容对应的词汇和/或描述诗词的词汇;如果所述会话文本中不含有必要属性信息,显示提示信息,并获取用户再次输入的补充文本,并根据所述补充文本内容,确定必要属性信息,所述提示信息包括询问必要属性信息以及提示再次输入信息;根据所述必要属性信息对应词汇确定检索范围;匹配所述检索范围内的诗词资源与所述必要属性信息,确定检索结果,并反馈检索结果。

【技术特征摘要】
2018.06.01 CN 20181055725031.一种基于语义分析的诗词检索方法,其特征在于,包括:获取用户输入的会话文本;根据所述会话文本内容,判断所述会话文本中是否含有必要属性信息,所述必要属性信息包括与诗词原文内容对应的词汇和/或描述诗词的词汇;如果所述会话文本中不含有必要属性信息,显示提示信息,并获取用户再次输入的补充文本,并根据所述补充文本内容,确定必要属性信息,所述提示信息包括询问必要属性信息以及提示再次输入信息;根据所述必要属性信息对应词汇确定检索范围;匹配所述检索范围内的诗词资源与所述必要属性信息,确定检索结果,并反馈检索结果。2.根据权利要求1所述的检索方法,其特征在于,所述检索方法还包括:获取诗词文本信息,所述诗词文本信息包括诗词原文文本、诗词描述文本以及诗词赏析文本;根据所述诗词文本信息确定诗词属性信息,所述属性信息是文本信息对应的特征词汇集合;根据所述诗词属性信息对所述诗词文本信息进行分类,以及确定每个分类的分类标签;根据分类后的诗词文本构建诗词资源库。3.根据权利要求1所述的检索方法,其特征在于,根据所述会话文本内容,判断所述会话文本中是否含有必要属性信息,所述必要属性信息包括与诗词原文内容对应的词汇和/或描述诗词的词汇的步骤,包括:提取所述会话文本中的关键词;获取所述必要属性信息对应的预置语料,并将所述关键词与所述预置语料进行匹配,所述预置语料包括,预置在数据库中的与诗词原文内容对应的词汇,和/或描述诗词的词汇;根据所述匹配结果,确定与所述预置语料相对应的关键词为必要属性信息。4.根据权利要求1或2所述的检索方法,其特征在于,根据所述必要属性信息对应词汇确定检索范围的步骤,包括:获取所述会话文本中为所述必要属性信息的词汇数量;判断所述必要属性信息词汇数量是否大于1;如果所述词汇数量大于1,根据预设规则,设置多个所述必要属性信息词汇的优先级;确定所述优先级最高的所述必要属性信息词汇在所述诗词资源库中的分类,并作为检索范围;如果所述词汇数量等于1,确定所述词汇在所述诗词资源库中的分类,并作为检索范围。5.根据权利要求1或2所述的检索方法,其特征在于,根据所述必要属性信息对应词汇确定检索范围的步骤,包括:获取所述会话文本中为所述必要属性信息的词汇数量;判断所述必要属性信息词汇数量是否大于1;如果所述词汇数量大于1,根据预设规则,设置多个所述必要属性信息词汇的优先级;根据所述优先级顺序,依次确定多个所述必要属性信息词汇在所述诗词资源库中的分类;根据每个所述分类的分类标签,确定所述诗词资源库中符合多个所述分类的诗词资源,构成诗词集合,并将所述诗词集合确定为检索范围;如果所述词汇数量等于1,确定所述词汇在所述诗词资源库中的分类作为检索范围。6.一种基于语义分析的诗词检索系统,包括通过通信网络连接的终端和服务器,其中,所述终端用于提供用户会话文本输入、检索结果显示以及数据交互,所述服务器包括存储模块,并根据用户输...

【专利技术属性】
技术研发人员:杨凯程曹晓张青程剑华蒋宏飞
申请(专利权)人:安徽省泰岳祥升软件有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1