标题生成方法及设备、存储介质、服务器技术

技术编号:18894510 阅读:27 留言:0更新日期:2018-09-08 10:58
本申请公开一种标题生成方法及设备、存储介质、服务器,其中该标题生成方法包括:对当前文章进行语义分析,以获得所述当前文章所属目标类别以及用于表示所述当前文章的内容的关键词;获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章;获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇;根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题。采用本申请的技术方案,可以提高当前文章的曝光率和阅读量。

Title generation method and device, storage medium, server

The present application discloses a title generation method and device, storage medium, and server, wherein the title generation method includes: semantic analysis of the current article to obtain the target category of the current article and the key words used to represent the content of the current article; and acquisition of the articles belonging to the said in the published history Target articles with target categories and popularity greater than the target threshold; obtain the syntactic structure of the title of the target article and the hot words in the target article; generate alternative titles for the current article according to the key words, the syntactic structure and the hot words. Adopting the technical proposal of this application can improve the exposure rate and reading volume of the current article.

【技术实现步骤摘要】
标题生成方法及设备、存储介质、服务器
本专利技术涉及计算机
,尤其涉及一种标题生成方法及设备、存储介质、服务器。
技术介绍
随着市场上新闻推荐类应用程序越来越多,新闻资讯的内容也越来越丰富。每天各种新闻推荐类应用程序会新产生上万篇文章,如何能够通过文章的标题就能快速吸引住用户的注意力,也是一大难题。比如,一位写手,擅长撰写科技类的文章,内容干货也很多,但可能由于文章的标题起的不是很好,就很可能会导致很多用户不会阅读这篇文章,进而导致这篇文章的曝光率和点击量下降,用户也不能发掘到很多优秀的文章。
技术实现思路
本专利技术实施例提供一种标题生成方法及设备、存储介质、服务器,可生成吸引用户注意力的备选标题,从而提高当前文章的曝光率和阅读量。第一方面,本专利技术实施例提供了一种标题生成方法,包括:对当前文章进行语义分析,以获得所述当前文章所属目标类别以及用于表示所述当前文章的内容的关键词;获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章;获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇;根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题。在一种可能的设计中,所述获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章,包括:获取历史库存储的文章中属于所述目标类别且优质度大于第一阈值的第一文章,所述优质度用于表示所述目标文章的优劣程度;获取至少一个社交平台发表的文章中属于所述目标类别且热度值大于第二阈值的第二文章,所述热度值用于表示所述目标文章的阅读数量。在一种可能的设计中,所述获取历史库存储的文章中属于所述目标类别且优质度大于第一阈值的第一文章,包括:获取历史库存储的文章中属于所述目标类别的至少一篇文章;根据对所述至少一篇文章中每篇文章的阅读数量以及互动特征,确定所述至少一篇文章中每篇文章的优质度,所述互动特征用于表征用户对所述文章的互动操作;从所述至少一篇文章中选择优质度大于所述第一阈值的第一文章。在一种可能的设计中,所述获取至少一个社交平台发表的文章中属于所述目标类别且热度值大于第二阈值的第二文章,包括:获取至少一个社交平台在距离当前时间之前目标时长范围内发表的文章中属于所述目标类别的至少一篇文章;将所述至少一篇文章划分为至少一个类别,属于同一个类别的文章的内容所针对的事件相同;针对每个所述类别,将属于所述类别的文章在所述至少一个社交平台的热度值累加,获得所述类别对应的热度值;从所述至少一个类别中选择目标类别,并将属于所述目标类别的文章确定为热度值大于所述第二阈值的第二文章,所述目标类别对应的热度值大于所述第二阈值。在一种可能的设计中,所述获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇,包括:获取所述第一文章的标题,并获取所述标题的句式结构;获取所述第二文章中出现频率大于第三阈值的热点词汇。在一种可能的设计中,所述句式结构包括所述标题的至少两个分词的词性,所述关键词包括至少两个词语,所述根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题,包括:采用所述热点词汇替换所述至少两个词语中语义与所述热点词汇相同的词语;根据所述句式结构中各个分词的词性,将替换处理后的所述至少两个词语组装成所述当前文章的备选标题。第二方面,本专利技术实施例提供一种标题生成设备,包括:语义分析单元,用于对当前文章进行语义分析,以获得所述当前文章所属目标类别以及用于表示所述当前文章的内容的关键词;第一获取单元,用于获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章;第二获取单元,用于获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇;标题生成单元,用于根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题。在一种可能的设计中,所述第一获取单元包括:第一文章获取子单元,用于获取历史库存储的文章中属于所述目标类别且优质度大于第一阈值的第一文章,所述优质度用于表示所述目标文章的优劣程度;第二文章获取子单元,用于获取至少一个社交平台发表的文章中属于所述目标类别且热度值大于第二阈值的第二文章,所述热度值用于表示所述目标文章的阅读数量。在一种可能的设计中,所述第一文章获取子单元具体用于获取历史库存储的文章中属于所述目标类别的至少一篇文章;根据对所述至少一篇文章中每篇文章的阅读数量以及互动特征,确定所述至少一篇文章中每篇文章的优质度,所述互动特征用于表征用户对所述文章的互动操作;从所述至少一篇文章中选择优质度大于所述第一阈值的第一文章。在一种可能的设计中,所述第二文章获取子单元具体用于获取至少一个社交平台在距离当前时间之前目标时长范围内发表的文章中属于所述目标类别的至少一篇文章;将所述至少一篇文章划分为至少一个类别,属于同一个类别的文章的内容所针对的事件相同;针对每个所述类别,将属于所述类别的文章在所述至少一个社交平台的热度值累加,获得所述类别对应的热度值;从所述至少一个类别中选择目标类别,并将属于所述目标类别的文章确定为热度值大于所述第二阈值的第二文章,所述目标类别对应的热度值大于所述第二阈值。在一种可能的设计中,所述第二获取单元包括:句式结构获取子单元,用于获取所述第一文章的标题,并获取所述标题的句式结构;热点词汇获取子单元,用于获取所述第二文章中出现频率大于第三阈值的热点词汇。在一种可能的设计中,所述句式结构包括所述标题的至少两个分词的词性,所述关键词包括至少两个词语,所述标题生成单元包括:替换子单元,用于采用所述热点词汇替换所述至少两个词语中语义与所述热点词汇相同的词语;标题组装子单元,用于根据所述句式结构中各个分词的词性,将替换处理后的所述至少两个词语组装成所述当前文章的备选标题。第三方面,本专利技术实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行以下步骤:对当前文章进行语义分析,以获得所述当前文章所属目标类别以及用于表示所述当前文章的内容的关键词;获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章;获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇;根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题。第四方面,本专利技术实施例提供一种服务器,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行以下步骤:对当前文章进行语义分析,以获得所述当前文章所属目标类别以及用于表示所述当前文章的内容的关键词;获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章;获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇;根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题。本专利技术实施例中,获取当前文章所属目标类别以及用于表示当前文章的内容的关键词,进一步获取历史发表的文章中属于该目标类别且受欢迎程度大于目标阈值的目标文章,结合目标文章的标题的句式结构以及目标文章中的热点词汇,为当前文章生成吸引用户注意力的备选标题,从而提高当前文章的曝光率和阅读量。附图说明为了说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的本文档来自技高网...

【技术保护点】
1.一种标题生成方法,其特征在于,包括:对当前文章进行语义分析,以获得所述当前文章所属目标类别以及用于表示所述当前文章的内容的关键词;获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章;获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇;根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题。

【技术特征摘要】
1.一种标题生成方法,其特征在于,包括:对当前文章进行语义分析,以获得所述当前文章所属目标类别以及用于表示所述当前文章的内容的关键词;获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章;获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇;根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题。2.如权利要求1所述的方法,其特征在于,所述获取历史发表的文章中属于所述目标类别且受欢迎程度大于目标阈值的目标文章,包括:获取历史库存储的文章中属于所述目标类别且优质度大于第一阈值的第一文章,所述优质度用于表示所述目标文章的优劣程度;获取至少一个社交平台发表的文章中属于所述目标类别且热度值大于第二阈值的第二文章,所述热度值用于表示所述目标文章的阅读数量。3.如权利要求2所述的方法,其特征在于,所述获取历史库存储的文章中属于所述目标类别且优质度大于第一阈值的第一文章,包括:获取历史库存储的文章中属于所述目标类别的至少一篇文章;根据对所述至少一篇文章中每篇文章的阅读数量以及互动特征,确定所述至少一篇文章中每篇文章的优质度,所述互动特征用于表征用户对所述文章的互动操作;从所述至少一篇文章中选择优质度大于所述第一阈值的第一文章。4.如权利要求2所述的方法,其特征在于,所述获取至少一个社交平台发表的文章中属于所述目标类别且热度值大于第二阈值的第二文章,包括:获取至少一个社交平台在距离当前时间之前目标时长范围内发表的文章中属于所述目标类别的至少一篇文章;将所述至少一篇文章划分为至少一个类别,属于同一个类别的文章的内容所针对的事件相同;针对每个所述类别,将属于所述类别的文章在所述至少一个社交平台的热度值累加,获得所述类别对应的热度值;从所述至少一个类别中选择目标类别,并将属于所述目标类别的文章确定为热度值大于所述第二阈值的第二文章,所述目标类别对应的热度值大于所述第二阈值。5.如权利要求2-4任意一项所述的方法,其特征在于,所述获取所述目标文章的标题的句式结构和所述目标文章中的热点词汇,包括:获取所述第一文章的标题,并获取所述标题的句式结构;获取所述第二文章中出现频率大于第三阈值的热点词汇。6.如权利要求1所述的方法,其特征在于,所述句式结构包括所述标题的至少两个分词的词性,所述关键词包括至少两个词语,所述根据所述关键词、所述句式结构以及所述热点词汇,为所述当前文章生成备选标题,包括:采用所述热点词汇替换所述至少两个词语中语义与所述热点词汇的语义相同的词语;根据所述句式结构中各个分词的词性,将替换处理后的所述至少两个词语组装...

【专利技术属性】
技术研发人员:丁如敏叶方正赵田
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1