写作素材查询方法、装置、电子设备和存储介质制造方法及图纸

技术编号:31704015 阅读:13 留言:0更新日期:2022-01-01 11:05
本公开提供了一种写作素材查询方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及智能搜索、知识图谱等领域。具体实现方案为:对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题,并确定与第一主题关联的第二主题,之后,可确定与第一主题关联的各第一候选事件,并确定与第二主题关联的各第二候选事件,以根据各第一候选事件和各第二候选事件之间的关联性,构建事件图谱,并根据待写作的目标事件,查询事件图谱,以将目标事件相关的关联事件作为写作素材。由此,将与目标事件相关的关联事件作为写作素材,从而向用户展示上述写作素材,可以避免用户逐个查看并筛选素材,可以提升用户的写作效率。可以提升用户的写作效率。可以提升用户的写作效率。

【技术实现步骤摘要】
写作素材查询方法、装置、电子设备和存储介质


[0001]本公开涉及人工智能领域,具体涉及智能搜索、知识图谱等领域,尤其涉及写作素材查询方法、装置、电子设备和存储介质。

技术介绍

[0002]互联网成为信息社会的基本通信工具,尤其是在重大事件发生时,越来越多的用户通过互联网获取信息、发表看法、写作并发表文章等。比如,针对一些重大事件,记者或编辑会持续地编写新闻文章,进行一些列新闻专题报道,其中,媒体行业的新闻专题报道涉猎面较广,且形式多样。为了提升用户的写作效率,如何提供更具智能和结构化的辅助能力来帮助用户进行写作,是非常重要的。

技术实现思路

[0003]本公开提供了一种用于写作素材查询方法、装置、电子设备和存储介质。
[0004]根据本公开的一方面,提供了一种写作素材查询方法,包括:
[0005]对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题;
[0006]确定与所述第一主题关联的第二主题;
[0007]确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件;
[0008]根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱;
[0009]根据待写作的目标事件,查询所述事件图谱,以将所述目标事件相关的关联事件作为写作素材。
[0010]根据本公开的另一方面,提供了一种写作素材查询装置,包括:
[0011]聚类模块,用于对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题;
[0012]第一确定模块,用于确定与所述第一主题关联的第二主题;
[0013]第二确定模块,用于确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件;
[0014]构建模块,用于根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱;
[0015]查询模块,用于根据待写作的目标事件,查询所述事件图谱,以将所述目标事件相关的关联事件作为写作素材。
[0016]根据本公开的又一方面,提供了一种电子设备,包括:
[0017]至少一个处理器;以及
[0018]与所述至少一个处理器通信连接的存储器;其中,
[0019]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开上述一方面提出的写作素材查询
方法。
[0020]根据本公开的再一方面,提供了一种计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开上述一方面提出的写作素材查询方法。
[0021]根据本公开的还一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开上述一方面提出的写作素材查询方法。
[0022]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0024]图1是本公开实施例一所提供的写作素材查询方法的流程示意图;
[0025]图2为本公开实施例二所提供的写作素材查询方法的流程示意图;
[0026]图3为本公开实施例三所提供的写作素材查询方法的流程示意图;
[0027]图4为本公开实施例中的事件图谱示意图;
[0028]图5为本公开实施例四所提供的写作素材查询方法的流程示意图;
[0029]图6为本公开实施例五所提供的写作素材查询方法的流程示意图;
[0030]图7为本公开实施例六所提供的写作素材查询方法的流程示意图;
[0031]图8为本公开实施例七所提供的写作素材查询方法的流程示意图;
[0032]图9为本公开实施例八所提供的写作素材查询装置的结构示意图;
[0033]图10示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
[0034]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0035]目前可通过素材搜集和检索来辅助记者、编辑进行选题报道,但是往往还需要人工去逐个筛选素材和选题,辅助效果不佳。并且,现有的方案只是对某个专题主题相关的素材进行检索召回,是一种线性的方式,创作者需要逐个地查看召回结果并过滤,不利于进行思维发散和参考,无法带来创作效率和质量的提升。
[0036]其中,媒体行业的新闻专题报道涉猎面较广,形式多样,单一的主题素材搜集检索无法有效提升选题策划、采编效率。因此,如何提供更具智能和结构化的辅助能力来帮助新闻专题工作,是非常重要的。
[0037]下面参考附图描述本公开实施例的写作素材查询方法、装置、电子设备和存储介质。
[0038]图1为本公开实施例一所提供的写作素材查询方法的流程示意图。
[0039]本公开实施例以该写作素材查询方法被配置于写作素材查询装置中来举例说明,该写作素材查询装置可以应用于任一电子设备中,以使该电子设备可以执行写作素材查询功能。
[0040]其中,电子设备可以为任一具有计算能力的设备,例如可以为个人电脑、移动终端、服务器等,移动终端例如可以为车载设备、手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
[0041]如图1所示,该写作素材查询方法可以包括以下步骤:
[0042]步骤101,对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题。
[0043]在本公开实施例中,候选素材可以为新闻文本(比如资讯稿件),或者也可以为其他素材,比如为音视频数据,或者为其他文本数据,比如用户发表的文章等,本公开对此并不做限制。
[0044]在本公开实施例中,可以提取各候选素材的主题,比如可以通过主题模型,来提取各候选素材的主题,之后,可以对各候选素材所提取的主题进行聚类,得到多个聚簇,并从多个聚簇中确定目标聚簇,比如该目标聚簇可以为最大簇,之后可确定该目标聚簇所对应的第一主题。
[0045]步骤102,确定与第一主题关联的第二主题。
[0046]在本公开实施例中,可以确定与第一主题关联的主题,本公开中记为第二主题。
[0047]举例而言,以第一主题为“XX运动会”,第二主题可以为“运动员”、“志愿者”等与该“XX运动会”相关的主题。
[0048]步骤103,确定与第一主题关联的各第一候选事件,并确定与第二主题关联的各第二候选事件。
[0049]在本公开实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种写作素材查询方法,所述方法包括以下步骤:对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题;确定与所述第一主题关联的第二主题;确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件;根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱;根据待写作的目标事件,查询所述事件图谱,以将所述目标事件相关的关联事件作为写作素材。2.根据权利要求1所述的方法,其中,所述根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱,包括:分别识别各所述第一候选事件和各所述第二候选事件对应的事件类型;根据所述事件类型,确定各所述第一候选事件和各所述第二候选事件之间的关联性,以根据所述关联性,构建所述事件图谱。3.根据权利要求2所述的方法,其中,所述根据所述事件类型,确定各所述第一候选事件和各所述第二候选事件之间的关联性,以根据所述关联性,构建事件图谱,包括:分别从各所述第一候选事件和各所述第二候选事件中,确定与设定关系对中第一事件类型匹配的第一目标事件,及与所述设定关系对中第二事件类型匹配的第二目标事件;确定所述第一目标事件和所述第二目标事件之间存在关联关系;根据存在所述关联关系的所述第一目标事件和所述第二目标事件,生成所述事件图谱。4.根据权利要求1所述的方法,其中,所述根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱,包括:分别识别各所述第一候选事件和各所述第二候选事件中的论元;根据各所述第一候选事件的论元和各所述第二候选事件的论元,确定包含相同论元的第一候选事件和第二候选事件之间存在关联关系;根据存在所述关联关系的所述第一候选事件和所述第二候选事件,生成所述事件图谱。5.根据权利要求1所述的方法,其中,所述确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件,包括:对所述第一主题进行向量化,以得到所述第一主题的向量化表示;将所述第一主题的向量化表示与事件库中各参考事件的向量化表示进行匹配,以将与所述第一主题的向量化表示匹配的参考事件作为第一候选事件;对所述第二主题进行向量化,以得到所述第二主题的向量化表示;将所述第二主题的向量化表示与各所述参考事件的向量化表示进行匹配,以将与所述第二主题的向量化表示匹配的参考事件作为第二候选事件。6.根据权利要求1所述的方法,其中,所述确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件,包括:识别所述第一主题对应的事件论元,并识别所述第二主题对应的事件论元;将所述第一主题的事件论元与事件库中各参考事件的事件论元进行匹配,以将与所述
第一主题的事件论元匹配的参考事件,作为第一候选事件;将所述第二主题的事件论元与各所述参考事件的事件论元进行匹配,以将与所述第二主题的事件论元匹配的参考事件,作为第二候选事件。7.根据权利要求1所述的方法,其中,所述对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题,包括:搜索发布时间与当前时间处于设定范围内的素材,作为所述候选素材;针对每个所述候选素材,抽取所述候选素材中重要程度最高的第三主题;对各所述第三主题进行聚类,得到多个聚簇;从多个聚簇中确定所述目标聚簇,其中,所述目标聚簇中包含的第三主题的个数大于其他聚簇;将所述目标聚簇中处于聚簇中心的主题,作为所述第一主题。8.根据权利要求7所述的方法,其中,所述针对每个所述候选素材,抽取所述候选素材的第三主题之后,所述方法还包括:针对每个所述候选素材,抽取所述候选素材中的至少一个第四主题;其中,所述第四主题的重要程度低于所述第三主题;对各所述候选素材的第四主题进行聚类,以确定至少一个第五主题;确定与所述第五主题关联的第六主题;确定与所述第六主题关联的各第三候选事件。9.根据权利要求8所述的方法,其中,所述根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱,包括:根据各所述第一候选事件、各所述第二候选事件以及各所述第三候选事件之间的关联性,构建所述事件图谱。10.根据权利要求1所述的方法,其中,所述确定与所述第一主题关联的第二主题,包括:确定知识图谱中所述第一主题对应的目标节点;根据所述知识图谱中连接所述目标节点的边,以及所述目标节点的邻居节点,确定与所述第一主题关联的第二主题。11.根据权利要求1所述的方法,其中,所述确定与所述第一主题关联的第二主题,包括:确定与所述第一主题在同一候选素材中出现的候选主题;根据各所述候选主题与所述第一主题共同出现的次数,和/或,根据各所述候选主题与所述第一主题在同一候选素材中的位置信息,从各候选主题中确定所述第二主题。12.一种写作素材查询装置,所述装置包括:聚类模块,用于对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题;第一确定模块...

【专利技术属性】
技术研发人员:郑烨翰蔡远俊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1