【技术实现步骤摘要】
一种古诗词搜索方法、装置、设备及存储介质
[0001]本专利技术涉及数据处理领域,尤其涉及一种古诗词搜索方法、装置、设备及存储介质。
技术介绍
[0002]在文稿写作时常需要使用引用古诗词来丰富文章的表达,但在写作过程中往往因为作者的诗词储备量不足,无法通过引用经典诗词从而更形象的完成文稿写作,因而需要进行古诗词搜索。
[0003]现有技术是通过诗词知识图谱的诗词推荐方法,对诗词数据预处理后,学习训练生成主题与主题模型,把诗词关联到主题模型得到诗词知识图谱,在按照查找结果在知识图谱中搜索主题相关度最高的诗词,根据结果输出推荐诗词。
[0004]但现有技术通过搜索主题相关度最高诗词的方式,搜索的主题类型单一,进而容易扩散场景理解范围,最终造成搜索结果不准确。
技术实现思路
[0005]本专利技术提供了一种古诗词搜索方法、装置、设备及存储介质,以实现针对用户输入的目标语句获取匹配的古诗词搜索结果。
[0006]根据本专利技术的一方面,提供了一种古诗词搜索方法,该方法包括:
[000 ...
【技术保护点】
【技术特征摘要】
1.一种古诗词搜索方法,其特征在于,包括:根据获取的各古诗词的原诗句以及对应的相关信息构建古诗词数据库,其中,所述古诗词数据库中包含所述原诗句和第一特征的对应关系;获取用户输入的目标语句,确定所述目标语句对应的第二特征,其中,所述第一特征和所述第二特征中包括相关向量、匹配向量和契合向量;根据所述第二特征和所述第一特征确定所述古诗词数据库中与所述目标语句匹配的搜索结果。2.根据权利要求1所述的方法,其特征在于,所述根据获取的各古诗词的原诗句以及对应的相关信息构建古诗词数据库,包括:确定所述原诗句对应的原始翻译句子、原始赏析句子和意境标记,并将所述原始翻译句子、所述原始赏析句子和所述意境标记作为所述相关信息;分别生成与所述原始翻译句子、所述原始赏析句子和所述原始意境标记匹配的输入向量;将各所述输入向量输入语义相似度模型,获取与所述原诗句对应的第一特征,其中,所述第一特征中包括第一相关向量、第一匹配向量和第一契合向量;将各所述原诗句和对应的所述第一特征建立关联关系,以构建所述古诗词数据库。3.根据权利要求2所述的方法,其特征在于,所述语义相似度模型中包括相关特征提取模块、匹配特征提取模块和契合特征提取模块;所述将各所述输入向量输入语义相似度模型,获取所述原诗句对应的第一特征,包括:将所述原始翻译句子对应的输入向量输入所述相关特征提取模块,获取所述原诗句对应的第一相关向量;将所述原始赏析句子对应的输入向量输入所述匹配特征提取模块,获取所述原诗句对应的第一匹配向量;将所述意境标记对应的输入向量输入所述契合特征提取模块,获取所述原诗句对应的第一契合向量;将所述第一相关向量、所述第一匹配向量和所述第一契合向量作为所述第一特征。4.根据权利要求3所述的方法,其特征在于,所述确定所述目标语句对应的第二特征,包括:将所述目标语句进行分词处理生成分词语句;将所述分词语句转换成目标翻译句子和目标赏析句子,并分别根据所述目标翻译句子、所述目标赏析句子和所述分词语句生成各输入向量;将所述目标翻译句子对应的输入向量输入所述相关特征提取模块,获取所述目标语句对应的第二相关向量;将所述目标赏析句子对应的输入向量输入所述匹配特征提取模块,获取所述目标语句对应的第二匹配向量;将所述分词语句对应的输入向量输入所述契合特征提取模块,获取所述目标语句对应的第二契合向量;将所述第二相关向量、所述第二匹配向量和所述第二契合向量作为所述第二特征。5.根据权利要...
【专利技术属性】
技术研发人员:魏俊杰,李海,许志海,陈开杰,杨帆,王彬,张琳,王凯琳,梁建瑜,徐长飞,贺晓柏,
申请(专利权)人:中国南方电网有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。