【技术实现步骤摘要】
文章的生成方法、装置、设备及存储介质
[0001]本申请涉及计算机数据处理
,具体涉及一种文章的生成方法、装置、设备及存储介质。
技术介绍
[0002]用户在网络上浏览时,通常会持续关注热门话题(例如体育赛事、社会热点、娱乐消息等),阅读热门话题相关的文章,并针对热门话题撰写实时评论。
[0003]随着计算机技术的发展,出现了基于实时评论生成热门话题相关的文章的技术,且广泛应用于各个在线视频、新闻网站中。
[0004]相关技术中,热门话题的文章的生成方法包括:获取对目标话题的实时评论;调用学习排序(learning to rank,LTR)模型对实时评论进行识别,得到实时评论中的重要评论;基于重要评论生成需要发表的文章。
[0005]然而,通过LTR模型识别生成得到的文章是基于实时评论中的重要评论合成得到的,由于实时评论和文章(例如体育新闻、文艺评论和社会评论等)的用语习惯不同,因此生成得到的文章的模拟准确度较差;同时,LTR模型的建立需要人为设定的特征(例如,体育比赛的评论中,篮球和足球的特征 ...
【技术保护点】
【技术特征摘要】
1.一种文章的生成方法,其特征在于,包括:获取至少两个阶段,所述阶段是每个时间阶段中的实时评论,所述实时评论是在目标话题的持续时间内对目标话题进行评论的文本信息,所述实时评论包括至少一个句子,所述持续时间包括至少两个所述时间阶段;调用循环神经网络对所述阶段进行处理,得到所述目标话题的候选句子;基于所述候选句子所属的时间阶段和所述候选句子的内容,对所述候选句子进行筛选,得到所述目标话题的文章。2.根据权利要求1所述的方法,其特征在于,所述获取至少两个时间阶段中的评论,包括:根据所述实时评论的时间戳,将所述实时评论归属于时间戳对应的时间段,汇总得到每个所述时间段的实时评论;将每个所述时间段的实时评论归属于所述时间段对应的时间阶段,汇总得到所述阶段。3.根据权利要求2所述的方法,其特征在于,对于所述至少两个阶段中的第t个阶段,其包括第t个时间段的评论至第t+ω个时间段的评论,t、ω为整数。4.根据权利要求3所述的方法,其特征在于,所述汇总得到每个所述时间段的实时评论,包括:根据每个时间段中包含的实时评论,通过以下公式汇总得到所述每个时间段的实时评论:其中,C
t
为第t个时间段的实时评论,l
t,i
为第t个时间段中的第i个句子,k
t
为所述第t个时间段中所包含的实时评论的句子总数,T
max
为所述目标话题的持续时间所包含的所述时间段的个数,i为整数,T
max
为正整数。5.根据权利要求4所述的方法,其特征在于,所述将每个所述时间段的实时评论归属于所述时...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。