摘要生成方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:23149249 阅读:96 留言:0更新日期:2020-01-18 13:32
本公开实施例提供了一种摘要生成方法、装置、电子设备及存储介质。所述方法包括:从数据源中筛选出具有热点属性的热搜词;从所述数据源获取与所述热搜词关联的内容文本;以及基于所述内容文本,生成与所述热搜词对应的摘要文本。本公开实施例能够挖掘出热搜词的摘要信息,可以使用户得知热搜词背后的具体信息,无需人工参与,节省了人力资源,进而减少了人力运营成本。

Generation method, device, electronic equipment and computer readable storage medium

【技术实现步骤摘要】
摘要生成方法、装置、电子设备及计算机可读存储介质
本公开的实施例涉及互联网
,尤其涉及一种摘要生成方法、摘要生成装置、电子设备及计算机可读存储介质。
技术介绍
随着科技水平的不断提升,人们通常会通过互联网搜索热点新闻事件,以关注最新动态。而在日常的搜索场景中,经常可见的是:大数据热门榜单或实时搜索热点排名模块等,为用户展示了距离当前一段时间内的热门事件或话题,然而仅展示搜索词的方式,导致展示的信息量比较匮乏,用户无法得知热搜词背后的具体信息。而通过人工从互联网中提取相关信息的方式,会耗费大量的人力资源,增加了人力运营成本。
技术实现思路
本公开实施例提供了一种摘要生成方法、装置、电子设备及计算机可读存储介质,用以挖掘出热搜词的摘要信息,可以使用户得知热搜词背后的具体信息,无需人工参与,节省了人力资源,进而减少了人力运营成本。根据本公开实施例的第一方面,提供了一种摘要生成方法,包括:从数据源中筛选出具有热点属性的热搜词;从所述数据源获取与所述热搜词关联的内容文本;以及基于所述内容文本,生成与所述热搜词对应的摘要文本。可选地,所述从数据源中筛选出具有热点属性的热搜词,包括:从数据源的热搜榜单中提取信息文本;以及从所述信息文本中,筛选出具有热点属性的热搜词。可选地,所述从数据源的热搜榜单中提取信息文本,包括:选定具有热搜榜单的数据源;解析所述数据源的网页元素配置,生成文本提取模板;以及在达到设定时间时,根据所述文本提取模板从所述数据源提取信息文本。可选地,所述从所述信息文本中,筛选出具有热点属性的热搜词,包括:对所述信息文本进行分词处理,得到多个分词文本;对多个所述分词文本进行通用词过滤处理,得到过滤信息文本;以及依据所述过滤信息文本,筛选出具有热点属性的热搜词。可选地,所述依据所述过滤信息文本,筛选出具有热点属性的热搜词,包括:从所述过滤信息文本中,获取距离当前时间的预设时间段内出现频度大于频度阈值的至少一个目标信息文本;以及获取所述至少一个目标信息文本对应的热度值,并将热度值为最大的目标信息文本作为热搜词。可选地,所述从数据源中筛选出具有热点属性的热搜词,包括:监听数据源中的热搜榜单;以及从所述数据源的热搜榜单中筛选出具有热点属性的热搜词。可选地,所述基于所述内容文本,生成与所述热搜词对应的摘要文本,包括:按照句格式对所述内容文本进行拆分,得到与所述内容文本对应的多个句子文本;其中,所述句格式是指按照特殊标点符号拆分文本的格式;将所述内容文本输入主题训练模型,获取与所述内容文本对应的主题词;以及基于与所述内容文本对应的主题词和多个句子文本,生成所述热搜词对应的摘要文本。可选地,在所述基于所述内容文本,生成与所述热搜词对应的摘要文本之后,还包括:将所述热搜词和所述摘要文本进行关联及展示。根据本公开实施例的第二方面,提供了一种摘要生成装置,包括:热搜词获取模块,用于从数据源中筛选出具有热点属性的热搜词;内容文本获取模块,用于从所述数据源获取与所述热搜词关联的内容文本;以及摘要文本生成模块,用于基于所述内容文本,生成与所述热搜词对应的摘要文本。可选地,所述热搜词获取模块包括:信息文本提取子模块,用于从数据源的热搜榜单中提取信息文本;以及热搜词获取子模块,用于从所述信息文本中,筛选出具有热点属性的热搜词。可选地,所述信息文本提取子模块包括:数据源选定子模块,用于选定具有热搜榜单的数据源;提取模板生成子模块,用于解析所述数据源的网页元素配置,生成文本提取模板;以及信息文本获取子模块,用于在达到设定时间时,根据所述文本提取模板从所述数据源提取信息文本。可选地,所述热搜词获取子模块包括:分词文本获取子模块,用于对所述信息文本进行分词处理,得到多个分词文本;过滤文本获取子模块,用于对多个所述分词文本进行通用词过滤处理,得到过滤信息文本;以及热搜词筛选子模块,用于依据所述过滤信息文本,筛选出具有热点属性的热搜词。可选地,所述热搜词筛选子模块包括:目标信息文本获取子模块,用于从所述过滤信息文本中,获取距离当前时间的预设时间段内出现频度大于频度阈值的至少一个目标信息文本;以及热搜词确定子模块,用于获取所述至少一个目标信息文本对应的热度值,并将热度值为最大的目标信息文本作为热搜词。可选地,所述热搜词获取模块包括:热搜榜单监听子模块,用于监听数据源中的热搜榜单;以及热搜词监听子模块,用于从所述数据源的热搜榜单中筛选出具有热点属性的热搜词。可选地,所述摘要文本生成模块包括:句子文本获取子模块,用于按照句格式对所述内容文本进行拆分,得到与所述内容文本对应的多个句子文本;其中,所述句格式是指按照特殊标点符号拆分文本的格式;主题词获取子模块,用于将所述内容文本输入主题训练模型,获取与所述内容文本对应的主题词;以及摘要文本生成子模块,用于基于与所述内容文本对应的主题词和多个句子文本,生成所述热搜词对应的摘要文本。可选地,还包括:摘要文本关联展示模块,用于将所述热搜词和所述摘要文本进行关联及展示。根据本公开实施例的第三方面,提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的摘要生成方法。根据本公开实施例的第四方面,提供了一种计算机可读存储介质,存储有计算机指令,当所述计算机指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的摘要生成方法。本公开实施例提供了一种摘要生成方法、装置、电子设备及计算机可读存储介质,通过从数据源中筛选出具有热点属性的热搜词,从数据源获取与热搜词关联的内容文本,并基于内容文本生成与热搜词对应的摘要文本。本公开实施例可以通过挖掘的热搜词自动提取出爆点信息,无需人工参与,节省了人力资源;并且,通过将挖掘的热搜词的爆点信息以摘要形势展现,可以使用户能够快速得知热搜词背后的具体信息,通过上述实现方式,能够解决仅展示搜索词的方式所导致展示的信息量比较匮乏的问题,且无需人工提取热搜词的相关信息,减少了人力运营成本。附图说明为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本公开实施例一提供的一种摘要生成方法的步骤流程图;图2是本公开实施例二提供的一种摘要生成方法的步骤流程图;图3是本公开实施例三提供的一种摘要生成装置的结构示意图;...

【技术保护点】
1.一种摘要生成方法,其特征在于,包括:/n从数据源中筛选出具有热点属性的热搜词;/n从所述数据源获取与所述热搜词关联的内容文本;以及/n基于所述内容文本,生成与所述热搜词对应的摘要文本。/n

【技术特征摘要】
1.一种摘要生成方法,其特征在于,包括:
从数据源中筛选出具有热点属性的热搜词;
从所述数据源获取与所述热搜词关联的内容文本;以及
基于所述内容文本,生成与所述热搜词对应的摘要文本。


2.根据权利要求1所述的方法,其特征在于,所述从数据源中筛选出具有热点属性的热搜词,包括:
从数据源的热搜榜单中提取信息文本;以及
从所述信息文本中,筛选出具有热点属性的热搜词。


3.根据权利要求2所述的方法,其特征在于,所述从数据源的热搜榜单中提取信息文本,包括:
选定具有热搜榜单的数据源;
解析所述数据源的网页元素配置,生成文本提取模板;以及
在达到设定时间时,根据所述文本提取模板从所述数据源提取信息文本。


4.根据权利要求2或3所述的方法,其特征在于,所述从所述信息文本中,筛选出具有热点属性的热搜词,包括:
对所述信息文本进行分词处理,得到多个分词文本;
对多个所述分词文本进行通用词过滤处理,得到过滤信息文本;以及
依据所述过滤信息文本,筛选出具有热点属性的热搜词。


5.根据权利要求4所述的方法,其特征在于,所述依据所述过滤信息文本,筛选出具有热点属性的热搜词,包括:
从所述过滤信息文本中,获取距离当前时间的预设时间段内出现频度大于频度阈值的至少一个目标信息文本;以及
获取所述至少一个目标信息文本对应的热度值,并将热度值为最大的目标信息文本作为热搜词...

【专利技术属性】
技术研发人员:余婷婷华镇兰田侯培旭张弓
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1