基于人工智能的新闻推荐方法、装置、电子设备及介质制造方法及图纸

技术编号:38745087 阅读:12 留言:0更新日期:2023-09-08 23:27
本发明专利技术涉及人工智能技术领域,提供一种基于人工智能的新闻推荐方法、装置、电子设备及介质,所述方法包括:构建新闻训练集;使用新闻内容编码器对新闻训练集中的新闻内容进行编码,得到每条新闻的新闻编码向量;使用用户编码器对用户历史行为进行编码,得到每个用户的最终编码向量;计算每条新闻的新闻编码向量和对应用户的最终编码向量之间的向量内积作为概率分值,基于每个用户的每条新闻的概率分值,训练预设的新闻推荐模型,得到目标新闻推荐模型;将用户输入的推荐内容输入至目标新闻推荐模型中,得到目标推荐新闻。本发明专利技术通过使用用户编码器对用户历史行为进行编码,有效的过滤掉新闻内容中的噪音信息,提高了新闻推荐的准确率。的准确率。的准确率。

【技术实现步骤摘要】
基于人工智能的新闻推荐方法、装置、电子设备及介质


[0001]本专利技术涉及人工智能
,具体涉及一种基于人工智能的新闻推荐方法、装置、电子设备及介质。

技术介绍

[0002]随着自媒体时代的快速发展,从海量数据中挖掘出用户感兴趣的信息变得越发重要。传统的推荐引擎的技术方案通过使用用户编码器将用户历史行为编码为向量进行推荐。
[0003]然而,由于用户历史行为中存在很多的错误信息,比如用户点击了某商品,仅仅是误点行为,而不是用户真正感兴趣的消息,传统用户编码器无法剔除掉误点行为,造成最终推荐结果存在巨大偏差,推荐的准确率低。

技术实现思路

[0004]鉴于以上内容,有必要提出一种基于人工智能的新闻推荐方法、装置、电子设备及介质,通过使用用户编码器对用户历史行为进行编码,有效的过滤掉新闻内容中的噪音信息,提高了新闻推荐的准确率。
[0005]本专利技术的第一方面提供一种基于人工智能的新闻推荐方法,所述方法包括:
[0006]构建新闻训练集,其中,所述新闻训练集中包含有多个用户及每个用户的历史推荐列表,所述历史推荐列表中包含有至少一条新闻;
[0007]使用新闻内容编码器对所述新闻训练集中的新闻内容进行编码,得到每个用户对应的每条新闻的新闻编码向量;
[0008]使用用户编码器对所述新闻训练集中的用户历史行为进行编码,得到每个用户的最终编码向量;
[0009]计算所述每个用户对应的每条新闻的新闻编码向量和对应用户的最终编码向量之间的向量内积,得到对应用户的每条新闻的概率分值;
[0010]基于每个用户的每条新闻的概率分值,使用逻辑回归的损失函数训练预设的新闻推荐模型,得到目标新闻推荐模型;
[0011]接收用户输入的推荐内容,及将所述推荐内容输入至所述目标新闻推荐模型中,得到目标推荐新闻。
[0012]可选地,所述构建新闻训练集包括:
[0013]从多个预设的数据源获取预设时间段内多个用户及每个用户的历史推荐列表;
[0014]从每个用户的历史推荐列表中,获取每条新闻的阅读参数;
[0015]判断所述每条新闻的阅读参数是否满足构建训练集要求;
[0016]将满足所述构建训练集要求的阅读参数对应的历史新闻,构建为新闻训练集。
[0017]可选地,所述使用新闻内容编码器对所述新闻训练集中的新闻内容进行编码,得到每个用户对应的每条新闻的新闻编码向量包括:
[0018]对所述新闻训练集中的每个用户的每条新闻的新闻内容进行预处理;
[0019]使用分词工具对预处理后的新闻内容中的每个句子进行分词,得到所述每个句子的多个分词;
[0020]将所述每个句子的多个分词输入至预先训练的词袋模型中,得到每个用户对应的每条新闻的新闻编码向量。
[0021]可选地,所述使用用户编码器对所述新闻训练集中的用户历史行为进行编码,得到每个用户的最终编码向量包括:
[0022]获取影响每个用户历史行为的多个指标,及每个指标的数据转换策略;
[0023]基于所述多个指标对所述新闻训练集中的新闻内容进行划分,得到每个指标的数据集;
[0024]将每个指标的数据集,按照对应的数据转换策略进行转换,得到所述每个用户的历史行为序列;
[0025]使用用户编码器对所述历史行为序列进行编码,得到每个用户历史行为编码向量;
[0026]将所述每个用户历史行为编码向量输入至GRU循环神经网络模型中进行用户兴趣预测,得到每个用户的最终编码向量。
[0027]可选地,所述基于每个用户的每条新闻的概率分值,使用逻辑回归的损失函数训练预设的新闻推荐模型,得到目标新闻推荐模型包括:
[0028]将每个用户的每条新闻的概率分值及对应新闻的点击频率输入至所述逻辑回归的损失函数中,获取预设的新闻推荐模型的损失值;
[0029]基于所述损失值迭代优化所述预设的新闻推荐模型的参数,直至所述损失值小于或者等于预设的损失阈值,得到目标新闻推荐模型。
[0030]可选地,在所述将所述推荐内容输入至所述目标新闻推荐模型中,得到目标推荐新闻之后,所述方法还包括:
[0031]对所述目标推荐新闻进行分词处理,得到分词结果;计算所述分词结果中每个分词与对应注意力权重之间的乘积,得到每个分词的重要性得分;从所述多个分词的多个重要性得分中选取满足重要性得分阈值的分词作为第一关键词;
[0032]将所述目标推荐新闻输入标注模型,得到标注结果;从所述标注结果中提取第二关键词;
[0033]计算所述第一关键词和所述第二关键词与所述用户的用户画像之间的匹配度;
[0034]当所述匹配度大于或者等于预设的匹配度阈值时,推荐所述目标推荐新闻;
[0035]当所述匹配度小于所述预设的匹配度阈值时,拒绝推荐所述目标推荐新闻。
[0036]可选地,在所述将所述推荐内容输入至所述目标新闻推荐模型中,得到目标推荐新闻之后,所述方法还包括:
[0037]识别所述目标推荐新闻是否为所述用户已点击新闻;
[0038]若所述目标推荐新闻为所述用户已点击新闻,拒绝推荐所述目标推荐新闻;
[0039]若所述目标推荐新闻不为所述用户已点击新闻,推荐所述目标推荐新闻。
[0040]本专利技术的第二方面提供一种基于人工智能的新闻推荐装置,所述装置包括:
[0041]构建模块,用于构建新闻训练集;
[0042]新闻编码模块,用于使用新闻内容编码器对所述新闻训练集中的新闻内容进行编码,得到每个用户对应的每条新闻的新闻编码向量;
[0043]用户编码模块,用于使用用户编码器对所述新闻训练集中的用户历史行为进行编码,得到每个用户的最终编码向量;
[0044]计算模块,用于计算所述每个用户对应的每条新闻的新闻编码向量和对应用户的最终编码向量之间的向量内积,得到对应用户的每条新闻的概率分值;
[0045]训练模块,用于基于每个用户的每条新闻的概率分值,使用逻辑回归的损失函数训练预设的新闻推荐模型,得到目标新闻推荐模型;
[0046]输入模块,用于接收用户输入的推荐内容,及将所述推荐内容输入至所述目标新闻推荐模型中,得到目标推荐新闻。
[0047]本专利技术的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的基于人工智能的新闻推荐方法。
[0048]本专利技术的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于人工智能的新闻推荐方法。
[0049]综上所述,本专利技术所述的基于人工智能的新闻推荐方法、装置、电子设备及介质,能够推动智慧城市的建设,应用于智慧建筑、智慧安防、智慧社区、智慧生活、物联网等领域。通过使用新闻内容编码器对所述新闻训练集中的新闻内容进行编码,得到每个用户对应的每条新闻的新闻编码向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的新闻推荐方法,其特征在于,所述方法包括:构建新闻训练集,其中,所述新闻训练集中包含有多个用户及每个用户的历史推荐列表,所述历史推荐列表中包含有至少一条新闻;使用新闻内容编码器对所述新闻训练集中的新闻内容进行编码,得到每个用户对应的每条新闻的新闻编码向量;使用用户编码器对所述新闻训练集中的用户历史行为进行编码,得到每个用户的最终编码向量;计算所述每个用户对应的每条新闻的新闻编码向量和对应用户的最终编码向量之间的向量内积,得到对应用户的每条新闻的概率分值;基于每个用户的每条新闻的概率分值,使用逻辑回归的损失函数训练预设的新闻推荐模型,得到目标新闻推荐模型;接收用户输入的推荐内容,及将所述推荐内容输入至所述目标新闻推荐模型中,得到目标推荐新闻。2.如权利要求1所述的基于人工智能的新闻推荐方法,其特征在于,所述构建新闻训练集包括:从多个预设的数据源获取预设时间段内多个用户及每个用户的历史推荐列表;从每个用户的历史推荐列表中,获取每条新闻的阅读参数;判断所述每条新闻的阅读参数是否满足构建训练集要求;将满足所述构建训练集要求的阅读参数对应的历史新闻,构建为新闻训练集。3.如权利要求1所述的基于人工智能的新闻推荐方法,其特征在于,所述使用新闻内容编码器对所述新闻训练集中的新闻内容进行编码,得到每个用户对应的每条新闻的新闻编码向量包括:对所述新闻训练集中的每个用户的每条新闻的新闻内容进行预处理;使用分词工具对预处理后的新闻内容中的每个句子进行分词,得到所述每个句子的多个分词;将所述每个句子的多个分词输入至预先训练的词袋模型中,得到每个用户对应的每条新闻的新闻编码向量。4.如权利要求1所述的基于人工智能的新闻推荐方法,其特征在于,所述使用用户编码器对所述新闻训练集中的用户历史行为进行编码,得到每个用户的最终编码向量包括:获取影响每个用户历史行为的多个指标,及每个指标的数据转换策略;基于所述多个指标对所述新闻训练集中的新闻内容进行划分,得到每个指标的数据集;将每个指标的数据集,按照对应的数据转换策略进行转换,得到所述每个用户的历史行为序列;使用用户编码器对所述历史行为序列进行编码,得到每个用户历史行为编码向量;将所述每个用户历史行为编码向量输入至GRU循环神经网络模型中进行用户兴趣预测,得到每个用户的最终编码向量。5.如权利要求1所述的基于人工智能的新闻推荐方法,其特征在于,所述基于每个用户的每条新闻的概率分值,使用逻辑回归的损失函数训练预设的新闻推荐模型,得到目标新
闻推荐模型包括:将每个用户的每条新闻的概率分值及对应...

【专利技术属性】
技术研发人员:陈浩
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1