信息推荐方法、电子设备及存储介质技术

技术编号:26418579 阅读:25 留言:0更新日期:2020-11-20 14:13
本发明专利技术公开了一种信息推荐方法、计算设备及存储介质,包括获取第一信息文本,并对第一信息文本进行关键词匹配,以得到匹配数据;将匹配数据通过BERT模型得到第一语义向量;获取第二信息文本,将第二信息文本通过BERT模型得到第二语义向量;根据第一语义向量和第二语义向量的相似度比对,以得到比对数据;根据比对数据将相应的第一信息文本分发到与第一信息文本匹配的终端。应用本发明专利技术,能够有效提升信息推荐的效率。

【技术实现步骤摘要】
信息推荐方法、电子设备及存储介质
本专利技术涉及互联网的
,特别涉及一种信息推荐方法、电子设备及存储介质。
技术介绍
随着信息技术发展,网络上的新闻、自媒体、论坛的信息呈爆炸趋势,当前的舆情服务仍以关键词匹配和人工处理为主,存在处理效度低,处理速度慢,发现时间滞后,存在时间盲区等不足之处,不能适应现在舆情处理发展要求。自然语言表达有多样性,相同意思有多种表达,关键词只能匹配到固定的模式,并不能捕捉到语义。由于关键词匹配具有规模大,成本高,维护难的特点,并且,人工处理效率低下,通过网站下发,然后客户到网站查看具有延时性,增加了客户接收舆情预警的难度。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种信息推荐方法、计算设备及存储介质,能够有效提升信息推荐的效率。本专利技术实施例的第一方面,提供了一种信息推荐方法,包括以下步骤:获取第一信息文本,并对所述第一信息文本进行关键词匹配,以得到匹配数据;将所述匹配数据通过BERT模型得到第一语义向量;获取第二信息文本,将所述第二信息文本通过所述BERT模型得到第二语义向量;将所述第一语义向量和所述第二语义向量进行相似度比对,以得到比对数据;根据所述比对数据将相应的第一信息文本分发到与所述第一信息文本匹配的终端。根据本专利技术实施例的信息推荐方法,至少具有如下有益效果:获取第一信息文本,并对所述第一信息文本进行关键词匹配,以得到匹配数据。然后,将所述匹配数据通过BERT模型得到第一语义向量;获取第二信息文本,将所述第二信息文本通过所述BERT模型得到第二语义向量,将所述第一语义向量和所述第二语义向量进行相似度比对,以得到比对数据,根据所述比对数据将相应的第一信息文本分发到与所述第一信息文本匹配的终端。综上所述,本专利技术实施例通过BERT模型得到第一语义向量和第二语义向量,并将第一语义向量和所述第二语义向量进行相似度比对,最终得到符合用户需要的信息文本,并将该信息文本推送到用户终端。相较于当前需要人工参与的信息文本分发方式,本专利技术实施例能够有效提升信息推荐分发的效率。根据本专利技术的一些实施例,所述获取第二信息文本,包括:对所述第一信息文本进行相似度去重,以得到去重文本信息;将所述去重文本信息进行时间去重,以得到所述第二信息文本。根据本专利技术的一些实施例,所述对所述第一信息文本进行相似度去重,以得到去重文本信息,包括以下步骤:获取预设时间段内的所有历史语义向量;将所述第一语义向量与所述历史语义向量进行余弦相似度比对,得到两者数值大小的比对差异值;将所述比对差异值大于第一预设值的第一语义向量,进行去重处理,得到去重文本信息。根据本专利技术的一些实施例,所述将所述去重文本信息进行时间去重,以得到所述第二信息文本,包括:提取所述第一信息文本的时间数据;将所述时间数据与当前时间进行比对,以得到时间差值;将所述时间差值超过第二预设值的所述第一信息文本进行去重处理。根据本专利技术的一些实施例,所述获取第一信息文本,并对所述第一信息文本进行关键词匹配,以得到匹配数据,包括以下步骤:获取所述第一信息文本;将获取的所述第一信息文本进行分词操作,以得到词表;根据关键词条件查询所述词表,以得到所述匹配数据。根据本专利技术的一些实施例,所述将所述匹配数据通过BERT模型得到第一语义向量,包括以下步骤:将所述匹配数据输入所述BERT模型;接收所述BERT模型输出的对应所述匹配数据的第一语义向量。根据本专利技术的一些实施例,所述根据所述第一语义向量和所述第二语义向量的相似度比对,以得到比对数据,包括:获取所有的历史语义向量,计算出所有的所述历史语义向量的平均值,将所述平均值作为所述第二语义向量;分别分析所述第一语义向量和所述第二语义向量的余弦相似度,得到所述第一语义向量和所述第二语义向量的余弦相似度值。根据本专利技术的一些实施例,所述根据所述第一语义向量和所述第二语义向量的相似度比对,以得到比对数据,还包括:将所述余弦相似度值与预设余弦相似度阈值进行比对,得到两者数值大小的比对数据。本专利技术实施例的第二方面,提供了一种电子设备,包括:至少一个存储器;至少一个处理器;至少一个程序;所述程序被存储在所述存储器中,所述处理器执行所述至少一个所述程序以实现上述的信息推荐方法。本专利技术实施例的第三方面,提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的信息推荐方法的步骤。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术实施例的信息推荐方法的流程图;图2为图1示出的信息推荐方法具体实施例的流程图;图3为本专利技术实施例的关键词匹配具体实施例的流程图;图4为本专利技术实施例的BERT模型构建语义向量具体实施例的流程图;图5为本专利技术实施例的相似度去重具体实施例的流程图;图6为本专利技术实施例的时间去重具体实施例的流程图;图7为本专利技术实施例的电子设备的示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。在本专利技术的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。本专利技术的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属
技术人员可以结合技术方案的具体内容合理确定上述词语在本专利技术中的具体含义。目前,网络上的信息数据越来越多,更新的速度也越来越快,不同的用户会不同的信息感兴趣,或者需要及时获取相关的信息。相关的技术主要通过人工对网络上的信息进行筛选,然后将符合用户需求的信息筛选出来,并推荐给匹配的客户。上述的模式效率较低,不能适应当下信息膨胀的网络环境。参照图7,该电子设备1000的部件包括但不限于存储器1100和处理器1本文档来自技高网
...

【技术保护点】
1.一种信息推荐方法,其特征在于,包括以下步骤:/n获取第一信息文本,并对所述第一信息文本进行关键词匹配,以得到匹配数据;/n将所述匹配数据通过BERT模型得到第一语义向量;/n获取第二信息文本,将所述第二信息文本通过所述BERT模型得到第二语义向量;/n将所述第一语义向量和所述第二语义向量进行相似度比对,以得到比对数据;/n根据所述比对数据将相应的第一信息文本分发到与所述第一信息文本匹配的终端。/n

【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括以下步骤:
获取第一信息文本,并对所述第一信息文本进行关键词匹配,以得到匹配数据;
将所述匹配数据通过BERT模型得到第一语义向量;
获取第二信息文本,将所述第二信息文本通过所述BERT模型得到第二语义向量;
将所述第一语义向量和所述第二语义向量进行相似度比对,以得到比对数据;
根据所述比对数据将相应的第一信息文本分发到与所述第一信息文本匹配的终端。


2.根据权利要求1所述的信息推荐方法,其特征在于,所述获取第二信息文本,包括:
对所述第一信息文本进行相似度去重,以得到去重文本信息;
将所述去重文本信息进行时间去重,以得到所述第二信息文本。


3.根据权利要求2所述的信息推荐方法,其特征在于,所述对所述第一信息文本进行相似度去重,以得到去重文本信息,包括以下步骤:
获取预设时间段内的所有历史语义向量;
将所述第一语义向量与所述历史语义向量进行余弦相似度比对,得到两者数值大小的比对差异值;
将所述比对差异值大于第一预设值的第一语义向量,进行去重处理,得到去重文本信息。


4.根据权利要求3所述的信息推荐方法,其特征在于,所述将所述去重文本信息进行时间去重,以得到所述第二信息文本,包括:
提取所述第一信息文本的时间数据;
将所述时间数据与当前时间进行比对,以得到时间差值;
将所述时间差值超过第二预设值的所述第一信息文本进行去重处理。


5.根据权利要求1所述的信息推荐方法,其特征在于,所述获取第一信息文本,并对所述第一信息文本进行关键词匹配...

【专利技术属性】
技术研发人员:赖文波陈志群刘晓靓陈锦冰
申请(专利权)人:深圳中泓在线股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1