一种基于用户偏好的个性化新闻标题生成方法技术

技术编号：37714382 阅读：9 留言：0更新日期：2023-06-02 00:09

本发明专利技术涉及大数据技术领域，提供一种基于用户偏好的个性化新闻标题生成方法，该方法包括：采集用户浏览记录，抽取所述浏览记录中的实体信息；抽取所述浏览记录中包括用户偏好的文字特征信息；将所述实体信息和所述文字特征信息融合并引入所需生成标题的新闻内容建模，获得生成模型，通过所述生成模型生成原始标题；强化学习所述生成模型，通过强化学习后的生成模型生成个性化标题。该方法能够基于用户偏好使用生成模型来为用户提供个性化的新闻标题，有效地利用了用户的偏好信息，同时平衡了个性化信息与标题，生成的标题更加符合用户的口味，另外也拥有了更高的准确率和流畅度。另外也拥有了更高的准确率和流畅度。另外也拥有了更高的准确率和流畅度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户偏好的个性化新闻标题生成方法

[0001]本专利技术涉及大数据
，尤其涉及一种基于用户偏好的个性化新闻标题生成方法。

技术介绍

[0002]现代社会之中，新闻已经成为人们获取信息的重要途径之一，也是人们了解社会、了解世界的重要方式之一。然而，由于新闻数量过多，且每个人的阅读兴趣不同，使得用户很难找到自己感兴趣的新闻。因此，如何为用户提供个性化的新闻推荐服务成为了一个研究热点。而新闻标题作为新闻的重要组成部分之一，不仅可以概括新闻的主题，还可以吸引用户的注意力。因此，如何生成符合用户口味的新闻标题也成为了一个研究热点。
[0003]目前，已有一些研究通过分析用户的行为、兴趣等信息，为用户提供个性化的新闻推荐服务。例如，可以根据用户的点击历史、搜索历史、社交网络历史等信息，推荐用户可能感兴趣的新闻。然而，这种方法并不能完全解决问题。首先，用户的点击、搜索和社交网络历史不能完全反映用户的兴趣，因为用户可能没有点击、搜索或分享他们真正感兴趣的新闻，或者用户的行为数据并不充分。其次，即使给用户推荐了一些新闻，如果新闻标题不能吸引用户的注意力，用户也不会去点击查看。因此，如何生成符合用户口味的新闻标题仍然是一个挑战。
[0004]在现有方法中，大部分方法未考虑用户的个性化信息，为所有用户产生一致的标题，该标题仅仅与新闻陈述的事实有关，概括了新闻的主要内容，而没有着重突出新闻中用户感兴趣的部分。仅有的部分考虑个性化标题生成任务的模型未能明确的捕捉到用户对新闻标题的偏好，这些方法统一建模了新闻事实与...

【技术保护点】

【技术特征摘要】
1.一种基于用户偏好的个性化新闻标题生成方法，其特征在于，包括如下步骤：S100：采集用户的浏览记录，抽取所述浏览记录中的实体信息；S200：抽取所述浏览记录中包括用户偏好的文字特征信息；S300：将所述实体信息和所述文字特征信息融合并引入所需生成标题的新闻内容建模，获得生成模型，通过所述生成模型生成原始标题；S400：强化学习所述生成模型，通过强化学习后的生成模型生成个性化标题。2.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，步骤S100包括：S111：采集用户浏览记录；S112：通过自然语言处理技术在所述浏览记录中分离实体词汇，生成实体信号；S113：计算所有所述实体信号的嵌入平均值，生成实体级别用户表征；S114：计算所述浏览记录中所述实体级别用户表征的平均值，生成实体信息。3.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，所述文字特征信息包括语法信息，抽取所述语法信息的步骤如下：S211：分离所述浏览记录中的语法结构，生成语法信号；S212：识别所述语法信号中各单词间的依赖关系，生成语法信息。4.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，所述文字特征信息包括语言风格信息，抽取所述语言风格信息的步骤如下：S221：分离所述浏览记录中的语言风格词汇；S222：基于语料库预训练语言风格分类模型，通过所述语言风格分类模型训练所述语言风格词汇，生...

【专利技术属性】
技术研发人员：张莹，于胜龙，郭文雅，袁晓洁，
申请(专利权)人：南开大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人