一种文本关键词的查找方法、装置、设备和存储介质制造方法及图纸

技术编号:26376402 阅读:39 留言:0更新日期:2020-11-19 23:45
本发明专利技术实施例公开了一种文本关键词的查找方法、装置、设备和存储介质。该方法包括:获取目标文本;采用命名实体识别技术提取出所述目标文本中的第一实体词语;将所述第一实体词语输入至预先训练好的第一神经网络模型以得到每个所述第一实体词语的第一词向量;确定所述第一词向量的中心点;将与所述第二词向量对应的第一实体词语作为所述目标文本的关键词,所述第二词向量为与所述中心点的距离最近的前第一预设数量的第一词向量。本发明专利技术实施例实现了快速准确的获取文本关键词。

【技术实现步骤摘要】
一种文本关键词的查找方法、装置、设备和存储介质
本专利技术实施例涉及文本技术,尤其涉及一种文本关键词的查找方法、装置、设备和存储介质。
技术介绍
在博眼球、赚点击的时代,很多文本的内容彼此不协调,可能在段落中穿插了广告或一些无意义的内容,商家获取到了点击量,但是用户的时间却因此被浪费。但在现有的用户获取文本进行阅读的过程中,没有方法对这些文本中的广告进行过滤,用户没有办法跳过这些穿插的无效信息,无法直接找到自己想要看的信息,也无法仅仅通过文本标题直接判断该文本是否为自己所需要的,因此为了让阅读或查找更有效率,直接获取到一篇文本的关键词,可以帮助用户判断是否需要阅读或该篇文本是否为自己想要的需求越来越迫切。
技术实现思路
本专利技术实施例提供一种文本关键词的查找方法、装置、设备和存储介质,以实现快速准确的获取文本关键词。为达此目的,本专利技术实施例提供了一种文本关键词的查找方法,该方法包括:获取目标文本;采用命名实体识别技术提取出所述目标文本中的第一实体词语;将所述第一实体词语输入至预先本文档来自技高网...

【技术保护点】
1.一种文本关键词的查找方法,其特征在于,包括:/n获取目标文本;/n采用命名实体识别技术提取出所述目标文本中的第一实体词语;/n将所述第一实体词语输入至预先训练好的第一神经网络模型以得到每个所述第一实体词语的第一词向量;/n确定所述第一词向量的中心点;/n将与所述第二词向量对应的第一实体词语作为所述目标文本的关键词,所述第二词向量为与所述中心点的距离最近的前第一预设数量的第一词向量。/n

【技术特征摘要】
1.一种文本关键词的查找方法,其特征在于,包括:
获取目标文本;
采用命名实体识别技术提取出所述目标文本中的第一实体词语;
将所述第一实体词语输入至预先训练好的第一神经网络模型以得到每个所述第一实体词语的第一词向量;
确定所述第一词向量的中心点;
将与所述第二词向量对应的第一实体词语作为所述目标文本的关键词,所述第二词向量为与所述中心点的距离最近的前第一预设数量的第一词向量。


2.根据权利要求1所述的方法,其特征在于,所述确定所述第一词向量的中心点之后包括:
获取与所述第三词向量对应的第一实体词语作为所述目标文本的过滤词,所述第三词向量为与所述中心点的距离最远的前第二预设数量的第一词向量;
对所述过滤词进行调整以展示所述目标文本。


3.根据权利要求2所述的方法,其特征在于,所述对所述过滤词进行调整以展示所述目标文本包括:
对所述过滤词进行折叠以展示所述目标文本。


4.根据权利要求2所述的方法,其特征在于,所述对所述过滤词进行调整以展示所述目标文本包括:
对所述过滤词进行调整后,将所述目标文本中同一段落内的句子依次两两输入至预先训练好的第二神经网络模型以得到同一段落内句子间的相似度;
根据同一段落内句子间的相似度展示所述目标文本。


5.根据权利要求4所述的方法,其特征在于,所述根据同一段落内句子间的相似度展示...

【专利技术属性】
技术研发人员:卓民杨楠
申请(专利权)人:深圳市卡牛科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1