【技术实现步骤摘要】
一种电力文档的搜索方法、装置、电子设备及存储介质
[0001]本专利技术涉及文档搜索
,尤其涉及一种电力文档的搜索方法、装置、电子设备及存储介质。
技术介绍
[0002]由于当前电网系统存在大量指导文件,例如:电网设备应用手册、电网操作系统使用手册和电网各种操作规程等用于电力方面的文档,这些文件由于其数量多,更新快,为了查找相关内容给电网技术人员带来了不方便,且操作过程较为繁琐,导致获取相关内容时效率不高。
[0003]因此,如何提高电力文档的搜索效率成为亟待解决的问题。
技术实现思路
[0004]本专利技术提供了一种电力文档的搜索方法、装置、电子设备及存储介质,以解决现有技术中获取电力文档效率低的问题,提高了电力文档的搜索效率。
[0005]根据本专利技术的一方面,提供了一种电力文档的搜索方法,包括:
[0006]获取用户输入的文本内容,其中,所述文本内容用于搜索文档搜索系统包含的电力文档中的相近内容;
[0007]计算所述文本内容与所述电力文档包含的各小文档的相关度, ...
【技术保护点】
【技术特征摘要】
1.一种电力文档的搜索方法,其特征在于,包括:获取用户输入的文本内容,其中,所述文本内容用于搜索文档搜索系统包含的电力文档中的相近内容;计算所述文本内容与所述电力文档包含的各小文档的相关度,其中,每个小文档为电力文档中各章节对应的内容,并且所述每个小文档均有对应的标题及文本内容;根据所述相关度对所述小文档进行排序,根据排序结果确定设定数量的目标小文档;根据所述目标小文档的文本内容、所述目标小文档对应的核心关键词和所述电力文档对应的关键词生成搜索结果。2.根据权利要求1所述的方法,其特征在于,在获取用户输入的文本内容之前,还包括:获取电力文档;按照文档结构对所述电力文档进行分类,对每类电力文档分别抽取标题、小标题和小标题对应内容;根据所述小标题拆分所述电力文档生成小文档,根据所述小文档中电网专业术语词汇的出现次数,确定所述小文档对应的核心关键词;根据所述电力文档中每个词的权重值确定所述电力文档对应的关键词;根据所述电力文档、小文档、关键词和核心关键词构建文档搜索系统。3.根据权利要求2所述的方法,其特征在于,所述根据所述电力文档中每个词的权重值确定所述电力文档对应的关键词,包括:采用结巴分词工具和电网专业词库对所述电力文档进行分词,基于分词结果确定所述电力文档中每个词的出现次数;采用TF
‑
IDF算法根据所述电力文档中各个词的出现次数,确定每个词对应的权重值,根据所述权重值确定所述电网文档的关键词。4.根据权利要求3所述的方法,其特征在于,所述基于分词结果确定所述电力文档中每个词的出现次数,包括:对于出现在所述电力文档的标题中的词汇,根据第一权重和所述标题中的词汇的出现次数生成标题词汇出现次数;对于出现在所述电力文档的小标题中的词汇,根据第二权重和所述小标题中的词汇的出现次数生成小标题词汇出现次数;对于所述电力文档中的电网专业术语词汇,根据第三权重和所述电网专业术语词汇的出现次数生成术语词汇出现次数。5.根据权利要求2所述的方法,其特征在于,所述根据所述小文档中电网专业术语词汇的出现次数,确定所述小文档对应的核心关键词,包括:根据结巴分词工具和电网专业词库,对所述小文档进行分词处理,根据分词结果标记所述小文档中的电网专业术语词汇;确定所述小文档中电网专业术语词汇的出现次数,根据所述小文档中电网专业术语词汇的出现次数确定所述小文档...
【专利技术属性】
技术研发人员:王晓光,李惠松,江飞达,周宣彦,李申乾,陈玉秀,许达培,邱媛媛,
申请(专利权)人:广东电网有限责任公司惠州供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。