用于生成文章模板的方法、装置、设备和存储介质制造方法及图纸

技术编号:20866644 阅读:21 留言:0更新日期:2019-04-17 09:22
根据本公开的示例实施例,提供了用于生成文章模板的方法、装置、设备和计算机可读存储介质。用于生成文章模板的方法包括获取属于预定类别的目标文章。该方法还包括确定目标文章中的第一对象的属性信息,属性信息包括用于描述第一对象的属性和与属性相关联的属性值。该方法进一步包括至少基于第一对象的属性信息和目标文章,生成针对预定类别的文章模板,以用于构建预定类别的文章。以此方式,可以高效、自动地生成文章模板,以供后续文章生成使用。

【技术实现步骤摘要】
用于生成文章模板的方法、装置、设备和存储介质
本公开的实施例主要涉及计算机领域,并且更具体地,涉及用于生成文章模板的方法、装置、设备和计算机可读存储介质。
技术介绍
文章框架或文章模板是指文章的组织结构和脉络。随着人工智能技术的发展,自动生成文章的智能写作受到广泛的关注。对于智能写作,在当前实现中,多以人工配置模板的方式来确定文章的写作结构。然而,这种方法耗时耗力并且不能满足对文章结构多样性的需求。
技术实现思路
根据本公开的示例实施例,提供了一种用于生成文章模板的方案。在本公开的第一方面中,提供了一种生成文章模板的方法。该方法包括获取属于预定类别的目标文章。该方法还包括确定目标文章中的第一对象的属性信息,属性信息包括用于描述第一对象的属性和与属性相关联的属性值。该方法进一步包括至少基于第一对象的属性信息和目标文章,生成针对预定类别的文章模板,以用于构建预定类别的文章。在本公开的第二方面中,提供了一种用于生成文章模板的装置。该装置包括目标文章获取模块,被配置为获取属于预定类别的目标文章。该装置还包括属性信息确定模块,被配置为确定目标文章中的第一对象的属性信息,属性信息包括用于描述第一对象的属性和与属性相关联的属性值。该装置进一步包括文章模板生成模块,被配置为至少基于第一对象的属性信息和目标文章,生成针对预定类别的文章模板,以用于构建预定类别的文章。在本公开的第三方面中,提供了一种设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。在本公开的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。附图说明结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;图2示出了根据本公开的实施例的生成文章模板的过程的流程图;图3示出了根据本公开的一些实施例的获取目标文章的过程的流程图;图4示出了根据本公开的一些实施例的生成文章模板的过程的流程图;图5示出了根据本公开的一些实施例的生成文章模板的过程的流程图;图6示出了根据本公开的一些实施例的所生成的文章模板的示意图;图7示出了根据本公开的实施例的用于生成文章模板的装置的示意性框图;以及图8示出了能够实施本公开的多个实施例的计算设备的框图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。在本公开的实施例的描述中,术语“对象”包括实体和概念两者。“实体”指的是客观世界中存在的且可互相区分的事物。“实体”可以是具体的人、事、物等物体实物。例如,“实体”可以是某一植物(诸如荷花)、某一天体(诸如天王星)或某一物品(诸如水杯)。“概念”指的是对特征的独特组合而形成的知识单元。例如,“概念”可以是人工智能、自动驾驶等。在本公开的实施例的描述中,术语“对象的属性”包括实体的特征和概念的方面。例如,当对象为人时,“对象的属性”可以包括性别、身高、体重、职业、配偶等;当对象为山时,“对象的属性”可以包括别称、海拔、地理位置、开放时间、适宜游玩季节等。又如,当对象为人工智能时,“对象的属性”可以包括研究价值、发展阶段、发展简史、最新技术等。传统上,针对智能写作中的文章框架挖掘,普遍采用两种方案来解决。一种是全人工提取的方案。在这种方案中,人工例行浏览网页上的目标文章,总结出文章框架,以供后续智能写作使用。另一种是机器辅助提取的方案。在该方案中,首先由机器或计算设备来抓取指定来源的文章,并进行文章粒度的分析过滤,以缩小人工阅读的文章量。人工再基于机器筛选的文章来总结文章的框架。这两种传统方案均非常依赖人工,因为机器参与的程度不同,二者的问题及其严重程度也有所不同。第一种方案完全人工提取文章框架,全程无机器参与。由于互联网上内容繁杂,人工很难面面俱到,存在提取框架多样性差的问题,同时全人工的处理方式也需要耗费大量的人力。第二种方案采用机器辅助提取的方式,机器先对文章进行筛选过滤,这缩小了人工审核的范围,同时机器能够较为全面的获取到目标文章,因此第二种方案在一定程度上减轻人力耗费大和文章框架多样性差的问题,但该方案机器只参与了目标文章的筛选,并未参与文章框架的直接挖掘,仍然极度依赖人工。根据本公开的实施例,提出了一种生成文章模板的方案。在该方案中,首先获取属于预定类别的目标文章并且确定目标文章中的第一对象的属性信息。然后,至少基于第一对象的属性信息和目标文章,生成针对预定类别的文章模板。因此,本公开的方案能够有利地实现高效、自动地生成文章模板,以供后续文章生成使用。以下将参照附图来具体描述本公开的实施例。图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。在该示例环境100中,由计算设备102利用属于预定类别的目标文章101和存储库120中存储的数据来生成针对该预定类别的文章模板130。应当理解,图1中示出的环境仅是示例性的,还可以使用多个计算设备来生成文章模板130。目标文章110可以是由计算设备102从网络上获取的,也可以是以其他方式获取的,例如从存储文章的数据库中选择的。目标文章110可以属于不同的预定类别,例如旅游类、娱乐类、美食类等。由此生成的文章模板130可以用于构建该预定类别的文章。目标文章110的预定类别可以根据实际需求而预先确定。目标文章110可以描述一个或多个对象。在图1的示例中,目标文章110至少描述了对象“华山”(为便于讨论以下称为第一对象101)。目标文章110还可以描述其他对象,诸如衡山、兵马俑等。存储库130可以存储与包括第一对象101在内的各种对象相关联的结构化数据。这样的结构化数据可以指示对象的属性和与属性相关联的属性值。例如,对“华山”这一实体对象而言,结构化数据可以指示与属性“类别”相关联的属性值为“山”或“景点”,与属性“别名”相关联的属性值为“西岳”或“西岳华山”,与属性“地址”相关联的属性值为“陕西省西安市”等。因此,基于结构化数据,可以确定第一对象101的属性和与属性相对应的属性值。在一些实施例中,结构化数据可以包括知识图谱。计算设备102可以基于目标文章101和存储库120中的结构化数据来生成文章模板130。文章模本文档来自技高网
...

【技术保护点】
1.一种生成文章模板的方法,包括:获取属于预定类别的目标文章;确定所述目标文章中的第一对象的属性信息,所述属性信息包括用于描述所述第一对象的属性和与所述属性相关联的属性值;以及至少基于所述第一对象的属性信息和所述目标文章,生成针对所述预定类别的文章模板,以用于构建所述预定类别的文章。

【技术特征摘要】
1.一种生成文章模板的方法,包括:获取属于预定类别的目标文章;确定所述目标文章中的第一对象的属性信息,所述属性信息包括用于描述所述第一对象的属性和与所述属性相关联的属性值;以及至少基于所述第一对象的属性信息和所述目标文章,生成针对所述预定类别的文章模板,以用于构建所述预定类别的文章。2.根据权利要求1所述的方法,其中获取所述目标文章包括:确定与用户的搜索词相对应的搜索结果的统计信息;基于所述统计信息,从所述搜索结果中确定目标网页;以及响应于所述搜索词属于所述预定类别,从所述目标网页中提取所述目标文章的标题和正文。3.根据权利要求1所述的方法,其中确定所述第一对象的属性信息包括:获取针对所述第一对象的第一知识图谱;以及从所述第一知识图谱中确定所述第一对象的属性以及与所述属性相对应的属性值。4.根据权利要求1所述的方法,其中生成所述文章模板包括:确定所述目标文章中是否包括所述第一对象的属性值;响应于所述目标文章包括所述属性值,从所述目标文章中确定与所述属性值相关联的部分;以及基于所述目标文章的所述部分和与所述属性值相关联的属性,生成所述文章模板。5.根据权利要求4所述的方法,其中基于所述部分和所述属性生成所述文章模板包括:确定指示所述属性的属性标签;以及将所述目标文章的所述部分替换为所述属性标签。6.根据权利要求4所述的方法,其中基于所述部分和所述属性生成所述文章模板包括:确定指示所述属性的属性标签;确定所述目标文章的所述部分中是否包括所述属性值;以及响应于确定所述目标文章的所述部分中包括所述属性值,将所述目标文章的所述部分中的所述属性值替换为所述属性标签。7.根据权利要求1所述的方法,其中生成所述文章模板包括:获取针对所述第一对象的第一知识图谱;获取针对所述目标文章中的第二对象的第二知识图谱,所述第二对象与所述第一对象不同;基于所述第一知识图谱和所述第二知识图谱,确定所述第一对象和所述第二对象所具有的共同属性;响应于所述共同属性属于预定义属性集合,从所述目标文章中确定与所述第一对象相关联的第一部分和与所述第二对象相关联的第二部分;以及基于所述第一部分和所述第二部分,生成所述文章模板。8.根据权利要求7所述的方法,其中基于所述第一部分和所述第二部分生成所述文章模板包括:基于所述共同属性确定第一标签和第二标签;将所述目标文章的所述第一部分替换为所述第一标签;以及将所述目标文章的所述第二部分替换为所述第二标签,以便所述第一标签和所述第二标签各自指示的、具有所述共同属性的其他对象的信息分别被填充到所述第一部分和所述第二部分。9.根据权利要求1所述的方法,还包括:获取属于所述预定类别的素材;以及基于所述素材和所述文章模板,生成所述预定类别的文章。10.一种用于生成文章模板的装置,包括:目标文章获取模块,被配置为获取属于预定类别的目标文章;属性信息确定模块,被配置为确定所述目标文章中的第一对象的属性信息,所述属性信息包括用于描述所述第一对象的属性和与所述属性相关联的属性值;以及文章模板生成模块,被配置为至少基于所述第一对象的属性信息和所述目标文章,生成针对所述预定类别的文章模板,以用于构建所述预定类别的文章。11.根据权利要求10所述的装置,其中所述目标文章获取模块包括:统计信息确定模块,被配置为确定与用户的搜索词相对应的搜索结果的统...

【专利技术属性】
技术研发人员:陈思姣梁海金罗雨
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1