一种文章标题生成方法、装置及计算设备制造方法及图纸

技术编号:26342604 阅读:44 留言:0更新日期:2020-11-13 20:35
本发明专利技术公开了文章标题生成方法,该方法在计算设备中执行,该方法包括步骤:基于多种选取方式对目标文章进行段落选取,得到多个输入文本,每个输入文本包括目标文章的至少一个段落,其中,每种选取方式对应不同的输入文本;对多个输入文本中的每个输入文本,将该输入文本输入到训练好的文本生成模型进行处理,生成多个候选文章标题,其中,多个输入文本对应的所有候选文章标题构成候选标题集合;基于预定策略从所述候选标题集合中筛选出目标文章的最终标题。本发明专利技术还公开了相应的装置及计算设备。

An article title generation method, device and computing equipment

【技术实现步骤摘要】
一种文章标题生成方法、装置及计算设备
本专利技术涉及互联网信息
,特别涉及文章标题生成方法、装置及计算设备。
技术介绍
文本标题生成是自然语言处理领域中的核心问题之一。对一篇文章根据其内容自动生成对应的有吸引力的标题,不仅可以吸引读者阅读该文章,还可以减轻文章撰写者的工作量。目前,文本标题生成的实现方式可分为两种:一种是生成式的标题生成方法,另一种是从文章中抽取关键句。其中,生成式的标题生成方法基于深度学习技术,利用海量的文章及其标题数据,学习从文章中自动生成标题的模型,当有一篇没有标题的文章时,将该文章输入模型,可以根据模型学习的结果自动生成标题。而从文章中抽取关键句的方式,该关键句在一定程度上不仅可以概括文章内容,而且需要不受上下文的影响,能够独立成句。关键句抽取的方式由于标题的特殊性,不仅需要能够概括文章内容,而且还需要可以独立成句,可能会存在语意不通的情况,因此不能确保是否从文章中抽取出来的句子是否可以直接作为标题使用。通过深度学习自动生成标题的方法可以根据文章内容生成出多样性较强且和文章内容紧密的标题,但本文档来自技高网...

【技术保护点】
1.一种文章标题生成方法,在计算设备中执行,所述方法包括步骤:/n基于多种选取方式对目标文章进行段落选取,得到多个输入文本,每个输入文本包括目标文章的至少一个段落,其中,每种选取方式对应不同的输入文本;/n对所述多个输入文本中的每个输入文本,将该输入文本输入到训练好的文本生成模型进行处理,生成多个候选文章标题,其中,多个输入文本对应的所有候选文章标题构成候选标题集合;/n基于预定策略从所述候选标题集合中筛选出目标文章的最终标题。/n

【技术特征摘要】
1.一种文章标题生成方法,在计算设备中执行,所述方法包括步骤:
基于多种选取方式对目标文章进行段落选取,得到多个输入文本,每个输入文本包括目标文章的至少一个段落,其中,每种选取方式对应不同的输入文本;
对所述多个输入文本中的每个输入文本,将该输入文本输入到训练好的文本生成模型进行处理,生成多个候选文章标题,其中,多个输入文本对应的所有候选文章标题构成候选标题集合;
基于预定策略从所述候选标题集合中筛选出目标文章的最终标题。


2.如权利要求1所述的方法,所述基于多种选取方式对目标文章进行段落选取,包括步骤:
提取文章的关键词,根据目标文章中每个段落出现关键词的频次对段落进行打分,按照得分从高到底的顺序选取段落,以得到一个输入文本。


3.如权利要求1或2所述的方法,所述基于多种选取方式对目标文章进行段落选取,还包括步骤:
根据目标文章的段落顺序选取多个段落,以得到一个输入文本。


4.如权利要求1-3中任一项所述的方法,所述基于多种选取方式对目标文章进行段落选取,还包括步骤:
选取目标文章的首段和末段,然后根据目标文章的段落顺序选取多个段落,以得到一个输入文本。


5.如权利要求1-4中任一项所述的方法,所述将该输入文本输入到训练好的文本生成模型进行处理,包括步骤:
对所述输入文本进行分词处理,得到多个词汇;
将多个词汇中的每个词汇转化为词向量,得到词向量序列;
将词向量序列输入到所述文本生成模型进行处理。


6.如权利要求5所述的方法,所述对输入文本进行分词处理,包括步骤:
基于预定词库对...

【专利技术属性】
技术研发人员:胡阿沛
申请(专利权)人:车智互联北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1