一种关键词的提取方法技术

技术编号:43945577 阅读:19 留言:0更新日期:2025-01-07 21:35
本发明专利技术实施例公开了一种关键词的提取方法,包括:将待提取电力数据和待提取电力数据中的多个候选关键词输入至预设BERT模型中,得到每个候选关键词的嵌入向量和待提取电力数据的嵌入向量,然后根据每个候选关键词的嵌入向量和待提取电力数据的嵌入向量确定每个候选关键词与其余候选关键词之间的相关性值,以及每个候选关键词与待提取电力数据之间的相关性值,最后将两种相关性值进行聚合,得到每个候选关键词的重要性分数,进而提取所需的关键词,能够有效解决现有技术中只能提取偏向于较长的关键词的偏向性问题,以及由于缺乏上下文信息导致的相似度匹配的有效性问题。

【技术实现步骤摘要】

本专利技术涉及电力系统,尤其涉及一种关键词的提取方法


技术介绍

1、关键词提取是一项重要任务,它能从文档中自动提取一组短语,为读者提供核心内容的简明摘要,同时也有利于信息检索和摘要等众多下游任务。

2、目前的关键词提取方式主要是利用相似度来从文档中提取关键词,但该方式存在两个主要缺点:一是由于文档通常比关键词长很多,且包含多个关键词,因此,为了可靠地测量它们之间的相似度,导致该方式只能提取偏向于较长的关键词;二是关键词是在没有上下文信息的情况下所提取的,这就限制了相似度匹配的有效性。


技术实现思路

1、基于此,有必要针对上述问题,提出了一种关键词的提取方法,能够有效解决现有技术中只能提取偏向于较长的关键词的偏向性问题,以及由于缺乏上下文信息导致的相似度匹配的有效性问题。

2、为实现上述目的,本专利技术在第一方面提供一种关键词的提取方法,所述方法包括:

3、获取待提取电力数据;

4、对所述待提取电力数据进行关键词识别,得到多个候选关键词;p>

5、将多个本文档来自技高网...

【技术保护点】

1.一种关键词的提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据每个候选关键词的嵌入向量和所述待提取电力数据的嵌入向量确定每个候选关键词与其余候选关键词之间的相关性值,以及每个候选关键词与所述待提取电力数据之间的相关性值,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据每个候选关键词的表示向量和所述待提取电力数据的表示向量确定每个候选关键词与其余候选关键词之间的相关性值,以及每个候选关键词与所述待提取电力数据之间的相关性值,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据每个候选关键词的表示向...

【技术特征摘要】

1.一种关键词的提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据每个候选关键词的嵌入向量和所述待提取电力数据的嵌入向量确定每个候选关键词与其余候选关键词之间的相关性值,以及每个候选关键词与所述待提取电力数据之间的相关性值,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据每个候选关键词的表示向量和所述待提取电力数据的表示向量确定每个候选关键词与其余候选关键词之间的相关性值,以及每个候选关键词与所述待提取电力数据之间的相关性值,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据每个候选关键词的表示向量和其余候选关键词的表示向量确定每个候选关键词与其余候选关键词之间的相关性值,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据每个候选...

【专利技术属性】
技术研发人员:冯勇谢青洋周寒英马朋飞张旭东
申请(专利权)人:云南电网有限责任公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1