System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 标题生成方法、装置、电子设备和存储介质制造方法及图纸_技高网

标题生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:40761499 阅读:3 留言:0更新日期:2024-03-25 20:13
本申请实施例提供一种标题生成方法、装置、电子设备和存储介质,所述方法包括:获取待生成标题的文档;从文档中抽取表达目标情感的目标文本;根据目标文本生成文档对应的标题。采用本申请实施例,可以提高生成表达目标情感的标题的成功率和效率。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及一种标题生成方法、装置、电子设备和存储介质


技术介绍

1、在一些内容分享平台中,存在大量的文档缺失标题信息,需要针对文档生成标题。标题所表达的情感是吸引用户注意的一个重要因素,举例来说,在广告场景中为了提升广告文档的成交量/曝光量,可以使广告文档的标题更具有惊喜感/积极情感,以吸引用户点击。

2、目前,生成表达某种目标情感的标题的方法,是先利用序列到序列的模型根据文档内容生成大量的标题,然后利用情感分类器对生成的标题进行情感分类,从中寻找具有目标情感类型的标题。然而,该方法需要多次生成标题再从中筛选,难以保证生成表达目标情感的标题的成功率和效率。


技术实现思路

1、本申请提供一种标题生成方法、装置、电子设备和存储介质,可以提高生成表达目标情感的标题的成功率和效率。

2、第一方面,本申请实施例提供了一种标题生成方法,所述方法包括:

3、获取待生成标题的文档;

4、从所述文档中抽取表达目标情感的目标文本;

5、根据所述目标文本生成所述文档对应的标题。

6、通过上述实施例,从文档中抽取表达目标情感的目标文本,根据目标文本可以直接生成表达目标情感的标题,而无需先根据文档内容生成大量标题再从中寻找表达目标情感的标题,有助于提高生成表达目标情感的标题的成功率和效率。

7、在一些可能的实施方式中,所述从所述文档中抽取表达目标情感的目标文本,包括:

8、从所述文档包含的词语中抽取表达目标情感的目标词语;

9、从所述文档包含的句子中抽取与所述目标词语匹配的目标句子;

10、其中,所述目标文本包括所述目标词语和所述目标句子。

11、通过上述实施方式,从文档中抽取表达目标情感的目标词语、以及与目标词语匹配的目标句子,结合目标词语和目标句子可以较为准确和全面地反映文档中的语义特征和情感特征,从而有助于成功生成表达目标情感的标题。

12、在一些可能的实施方式中,所述从所述文档包含的词语中抽取表达目标情感的目标词语,包括:

13、对所述文档包含的每个词语进行情感分类,获得每个所述词语的情感类型;

14、将情感类型为目标情感类型的词语,确定为所述目标词语。

15、通过上述实施方式,利用文档中每个词语的情感类型来确定目标词语,具体将文档中情感类型为目标情感类型的词语确定为目标词语,据此可以实现快速且准确地从文档中抽取表达目标情感的目标词语。

16、在一些可能的实施方式中,所述从所述文档包含的句子中抽取与所述目标词语匹配的目标句子,包括:

17、计算所述文档包含的每个句子与所述目标词语的文本相似度;

18、对每个所述句子进行情感分类,获得每个所述句子的情感类型;

19、将与所述目标词语的文本相似度大于或等于相似度阈值、且情感类型为目标情感类型的句子,确定为所述目标句子。

20、通过上述实施方式,结合文档中每个句子与目标词语的文本相似度、以及每个句子的情感类型来确定目标句子,具体将文档中与目标词语的文本相似度高于相似度阈值、且情感类型为目标情感类型的句子确定为目标句子,据此可以实现快速且准确地从文档中抽取与目标词语在文字维度和情感维度上均匹配的目标句子。

21、在一些可能的实施方式中,所述根据所述目标文本生成所述文档对应的标题,包括:

22、对所述目标词语的文本信息、位置信息以及情感信息进行编码,得到词语特征;

23、对所述目标句子的文本信息、位置信息以及情感信息进行编码,得到句子特征;

24、根据所述词语特征与所述句子特征,生成所述文档对应的标题。

25、通过上述实施方式,对目标词语的文本信息、位置信息以及情感信息进行编码得到的词语特征融合了目标词语在文本、位置以及情感维度的特征,对目标句子的文本信息、位置信息以及情感信息进行编码得到的句子特征融合了目标句子在文本、位置以及情感维度的特征,结合词语特征和句子特征可以较为准确且全面地反映文档中的语义特征和情感特征,从而有助于成功生成表达目标情感的标题。

26、在一些可能的实施方式中,所述根据所述词语特征与所述句子特征,生成所述文档对应的标题,包括:

27、将所述词语特征与所述句子特征进行融合,得到目标特征;

28、对所述目标特征进行解码,得到所述文档对应的标题。

29、通过上述实施方式,对词语特征与句子特征进行融合得到的目标特征,包含了更丰富的语义特征和情感特征,根据目标特征生成的标题具有更好的可读性并且能够表达目标情感。

30、在一些可能的实施方式中,所述根据所述目标文本生成所述文档对应的标题,包括:

31、利用标题生成模型,根据所述目标文本生成所述文档对应的标题;其中,所述标题生成模型通过以下方法训练获得:

32、获取样本文档,从所述样本文档中抽取表达目标情感的样本目标文本;

33、利用待训练标题生成模型,根据所述样本目标文本生成所述样本文档对应的样本标题;

34、根据所述样本标题的困惑度、以及所述样本标题的情感类型为目标情感类型的概率,计算损失值,基于所述损失值对所述待训练标题生成模型的参数进行优化,直至满足训练结束条件,获得所述标题生成模型。

35、通过上述实施方式,利用标题生成模型根据目标文本生成标题,标题生成模型的训练过程中考虑了生成的标题的困惑度和情感类型,使得生成的标题在可读性和情感性上都得到了优化。

36、第二方面,本申请实施例提供了一种标题生成装置,所述装置包括:

37、获取单元,用于获取待生成标题的文档;

38、抽取单元,用于从所述文档中抽取表达目标情感的目标文本;

39、生成单元,用于根据所述目标文本生成所述文档对应的标题。

40、在一些可能的实施方式中,所述抽取单元具体用于:从所述文档包含的词语中抽取表达目标情感的目标词语;从所述文档包含的句子中抽取与所述目标词语匹配的目标句子;其中,所述目标文本包括所述目标词语和所述目标句子。

41、在一些可能的实施方式中,所述抽取单元在从所述文档包含的词语中抽取表达目标情感的目标词语时,具体用于:对所述文档包含的每个词语进行情感分类,获得每个所述词语的情感类型;将情感类型为目标情感类型的词语,确定为所述目标词语。

42、在一些可能的实施方式中,所述抽取单元在从所述文档包含的句子中抽取与所述目标词语匹配的目标句子时,具体用于:计算所述文档包含的每个句子与所述目标词语的文本相似度;对每个所述句子进行情感分类,获得每个所述句子的情感类型;将与所述目标词语的文本相似度大于或等于相似度阈值、且情感类型为目标情感类型的句子,确定为所述目标句子。

43、在一些可能的实施方式中,所述生成单元具体用于:对所述目本文档来自技高网...

【技术保护点】

1.一种标题生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述从所述文档中抽取表达目标情感的目标文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述从所述文档包含的词语中抽取表达目标情感的目标词语,包括:

4.根据权利要求2所述的方法,其特征在于,所述从所述文档包含的句子中抽取与所述目标词语匹配的目标句子,包括:

5.根据权利要求2至4中任意一项所述的方法,其特征在于,所述根据所述目标文本生成所述文档对应的标题,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述词语特征与所述句子特征,生成所述文档对应的标题,包括:

7.根据权利要求1至4中任意一项所述的方法,其特征在于,所述根据所述目标文本生成所述文档对应的标题,包括:

8.一种标题生成装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7中任意一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7中任意一项所述的方法。

...

【技术特征摘要】

1.一种标题生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述从所述文档中抽取表达目标情感的目标文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述从所述文档包含的词语中抽取表达目标情感的目标词语,包括:

4.根据权利要求2所述的方法,其特征在于,所述从所述文档包含的句子中抽取与所述目标词语匹配的目标句子,包括:

5.根据权利要求2至4中任意一项所述的方法,其特征在于,所述根据所述目标文本生成所述文档对应的标题,包括:

6.根据权利要求5所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:汪自力
申请(专利权)人:小红书科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1