当前位置: 首页 > 专利查询>南开大学专利>正文

一种基于用户偏好的个性化新闻标题生成方法技术

技术编号:37714382 阅读:9 留言:0更新日期:2023-06-02 00:09
本发明专利技术涉及大数据技术领域,提供一种基于用户偏好的个性化新闻标题生成方法,该方法包括:采集用户浏览记录,抽取所述浏览记录中的实体信息;抽取所述浏览记录中包括用户偏好的文字特征信息;将所述实体信息和所述文字特征信息融合并引入所需生成标题的新闻内容建模,获得生成模型,通过所述生成模型生成原始标题;强化学习所述生成模型,通过强化学习后的生成模型生成个性化标题。该方法能够基于用户偏好使用生成模型来为用户提供个性化的新闻标题,有效地利用了用户的偏好信息,同时平衡了个性化信息与标题,生成的标题更加符合用户的口味,另外也拥有了更高的准确率和流畅度。另外也拥有了更高的准确率和流畅度。另外也拥有了更高的准确率和流畅度。

【技术实现步骤摘要】
一种基于用户偏好的个性化新闻标题生成方法


[0001]本专利技术涉及大数据
,尤其涉及一种基于用户偏好的个性化新闻标题生成方法。

技术介绍

[0002]现代社会之中,新闻已经成为人们获取信息的重要途径之一,也是人们了解社会、了解世界的重要方式之一。然而,由于新闻数量过多,且每个人的阅读兴趣不同,使得用户很难找到自己感兴趣的新闻。因此,如何为用户提供个性化的新闻推荐服务成为了一个研究热点。而新闻标题作为新闻的重要组成部分之一,不仅可以概括新闻的主题,还可以吸引用户的注意力。因此,如何生成符合用户口味的新闻标题也成为了一个研究热点。
[0003]目前,已有一些研究通过分析用户的行为、兴趣等信息,为用户提供个性化的新闻推荐服务。例如,可以根据用户的点击历史、搜索历史、社交网络历史等信息,推荐用户可能感兴趣的新闻。然而,这种方法并不能完全解决问题。首先,用户的点击、搜索和社交网络历史不能完全反映用户的兴趣,因为用户可能没有点击、搜索或分享他们真正感兴趣的新闻,或者用户的行为数据并不充分。其次,即使给用户推荐了一些新闻,如果新闻标题不能吸引用户的注意力,用户也不会去点击查看。因此,如何生成符合用户口味的新闻标题仍然是一个挑战。
[0004]在现有方法中,大部分方法未考虑用户的个性化信息,为所有用户产生一致的标题,该标题仅仅与新闻陈述的事实有关,概括了新闻的主要内容,而没有着重突出新闻中用户感兴趣的部分。仅有的部分考虑个性化标题生成任务的模型未能明确的捕捉到用户对新闻标题的偏好,这些方法统一建模了新闻事实与用户偏好,导致两类信息相互混淆,对生成标题的质量产生了影响。此外,当前的个性化标题生成技术仍存在一些挑战和问题,不能在生成过程中充分考虑用户的兴趣偏好和新闻内容的细节,同时也不能平衡标题生成的准确性和可读性,也无法保证生成的速度与质量。

技术实现思路

[0005]为此,本专利技术提供一种基于用户偏好的个性化新闻标题生成方法,利用用户的偏好信息,生成与用户偏好匹配的标题。
[0006]本专利技术提供一种基于用户偏好的个性化新闻标题生成方法,包括如下步骤:S100:采集用户的浏览记录,抽取所述浏览记录中的实体信息;S200:抽取所述浏览记录中包括用户偏好的文字特征信息;S300:将所述实体信息和所述文字特征信息融合并引入所需生成标题的新闻内容建模,获得生成模型,通过所述生成模型生成原始标题;S400:强化学习所述生成模型,通过强化学习后的生成模型生成个性化标题。
[0007]根据本专利技术提供的一种基于用户偏好的个性化新闻标题生成方法,步骤S100包括:
S111:采集用户浏览记录;S112:通过自然语言处理技术在所述浏览记录中分离实体词汇,生成实体信号;S113:计算所有所述实体信号的嵌入平均值,生成实体级别用户表征;S114:计算所述浏览记录中所述实体级别用户表征的平均值,生成实体信息。
[0008]根据本专利技术提供的一种基于用户偏好的个性化新闻标题生成方法,所述文字特征信息包括语法信息,抽取所述语法信息的步骤如下:S211:分离所述浏览记录中的语法结构,生成语法信号;S212:识别所述语法信号中各单词间的依赖关系,生成语法信息。
[0009]根据本专利技术提供的一种基于用户偏好的个性化新闻标题生成方法,所述文字特征信息包括语言风格信息,抽取所述语言风格信息的步骤如下:S221:分离所述浏览记录中的语言风格词汇;S222:基于语料库预训练语言风格分类模型,通过所述语言风格分类模型训练所述语言风格词汇,生成语言风格信号;S223:计算所述语言风格信号在用户阅读历史中占比平均值,生成语言风格信息。
[0010]根据本专利技术提供的一种基于用户偏好的个性化新闻标题生成方法,步骤S300中通过所述生成模型生成原始标题时还包括,使用非确定性的实体标签替换所述原始标题中的实体词汇。
[0011]根据本专利技术提供的一种基于用户偏好的个性化新闻标题生成方法,步骤S300中通过基于指针的生成式网络,将所述实体信息和所述文字特征信息融合。
[0012]根据本专利技术提供的一种基于用户偏好的个性化新闻标题生成方法,步骤S400中强化学习所述生成模型包括:S411:对所述原始标题进行质量评估,获得与所述原始标题对应的第一质量评估指标;S412:融合所述第一质量评估指标和所述文字特征信息,获得第二质量评估指标;S413:通过所述第二质量评估指标对所述生成模型生成的中间文本进行监督,通过监督反馈的信号,调整所述生成模型的参数,以获得所述生成模型最大化期望的总回报。
[0013]根据本专利技术提供的一种基于用户偏好的个性化新闻标题生成方法,步骤S413中,任一所述中间文本生成后,所述中间文本的个性化奖励表示如下:其中,为中间文本的个性化奖励,为通过实体信息和中间文本实体级别的相似度计算得到的奖励,为通过语法信息和中间文本语法结构的相似度计算得到的奖励,为通过语言风格信息和中间文本语言风格结构的相似度计算得到的奖励。
[0014]本专利技术提供的一种基于用户偏好的个性化新闻标题生成方法,通过抽取用户的浏览历史中对实体、语法和语言风格的偏好,基于用户偏好使用生成模型来为用户提供个性化的新闻标题,有效地利用了用户的偏好信息,同时平衡了个性化信息与标题,生成的标题更加符合用户的口味,另外也拥有了更高的准确率和流畅度。
[0015]本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0016]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本专利技术实施例提供的一种基于用户偏好的个性化新闻标题生成方法流程图。
具体实施方式
[0018]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。以下实施例用于说明本专利技术,但不能用来限制本专利技术的范围。
[0019]在本专利技术实施例的描述中,需要说明的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术实施例的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0020]在本专利技术实施例的描述中,需要说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户偏好的个性化新闻标题生成方法,其特征在于,包括如下步骤:S100:采集用户的浏览记录,抽取所述浏览记录中的实体信息;S200:抽取所述浏览记录中包括用户偏好的文字特征信息;S300:将所述实体信息和所述文字特征信息融合并引入所需生成标题的新闻内容建模,获得生成模型,通过所述生成模型生成原始标题;S400:强化学习所述生成模型,通过强化学习后的生成模型生成个性化标题。2.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法,其特征在于,步骤S100包括:S111:采集用户浏览记录;S112:通过自然语言处理技术在所述浏览记录中分离实体词汇,生成实体信号;S113:计算所有所述实体信号的嵌入平均值,生成实体级别用户表征;S114:计算所述浏览记录中所述实体级别用户表征的平均值,生成实体信息。3.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法,其特征在于,所述文字特征信息包括语法信息,抽取所述语法信息的步骤如下:S211:分离所述浏览记录中的语法结构,生成语法信号;S212:识别所述语法信号中各单词间的依赖关系,生成语法信息。4.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法,其特征在于,所述文字特征信息包括语言风格信息,抽取所述语言风格信息的步骤如下:S221:分离所述浏览记录中的语言风格词汇;S222:基于语料库预训练语言风格分类模型,通过所述语言风格分类模型训练所述语言风格词汇,生...

【专利技术属性】
技术研发人员:张莹于胜龙郭文雅袁晓洁
申请(专利权)人:南开大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1