【技术实现步骤摘要】
写作素材查询方法、装置、电子设备和存储介质
[0001]本公开涉及人工智能领域,具体涉及智能搜索、知识图谱等领域,尤其涉及写作素材查询方法、装置、电子设备和存储介质。
技术介绍
[0002]互联网成为信息社会的基本通信工具,尤其是在重大事件发生时,越来越多的用户通过互联网获取信息、发表看法、写作并发表文章等。比如,针对一些重大事件,记者或编辑会持续地编写新闻文章,进行一些列新闻专题报道,其中,媒体行业的新闻专题报道涉猎面较广,且形式多样。为了提升用户的写作效率,如何提供更具智能和结构化的辅助能力来帮助用户进行写作,是非常重要的。
技术实现思路
[0003]本公开提供了一种用于写作素材查询方法、装置、电子设备和存储介质。
[0004]根据本公开的一方面,提供了一种写作素材查询方法,包括:
[0005]对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题;
[0006]确定与所述第一主题关联的第二主题;
[0007]确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件;
[0008]根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱;
[0009]根据待写作的目标事件,查询所述事件图谱,以将所述目标事件相关的关联事件作为写作素材。
[0010]根据本公开的另一方面,提供了一种写作素材查询装置,包括:
[0011]聚类模块,用于对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一 ...
【技术保护点】
【技术特征摘要】
1.一种写作素材查询方法,所述方法包括以下步骤:对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题;确定与所述第一主题关联的第二主题;确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件;根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱;根据待写作的目标事件,查询所述事件图谱,以将所述目标事件相关的关联事件作为写作素材。2.根据权利要求1所述的方法,其中,所述根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱,包括:分别识别各所述第一候选事件和各所述第二候选事件对应的事件类型;根据所述事件类型,确定各所述第一候选事件和各所述第二候选事件之间的关联性,以根据所述关联性,构建所述事件图谱。3.根据权利要求2所述的方法,其中,所述根据所述事件类型,确定各所述第一候选事件和各所述第二候选事件之间的关联性,以根据所述关联性,构建事件图谱,包括:分别从各所述第一候选事件和各所述第二候选事件中,确定与设定关系对中第一事件类型匹配的第一目标事件,及与所述设定关系对中第二事件类型匹配的第二目标事件;确定所述第一目标事件和所述第二目标事件之间存在关联关系;根据存在所述关联关系的所述第一目标事件和所述第二目标事件,生成所述事件图谱。4.根据权利要求1所述的方法,其中,所述根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱,包括:分别识别各所述第一候选事件和各所述第二候选事件中的论元;根据各所述第一候选事件的论元和各所述第二候选事件的论元,确定包含相同论元的第一候选事件和第二候选事件之间存在关联关系;根据存在所述关联关系的所述第一候选事件和所述第二候选事件,生成所述事件图谱。5.根据权利要求1所述的方法,其中,所述确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件,包括:对所述第一主题进行向量化,以得到所述第一主题的向量化表示;将所述第一主题的向量化表示与事件库中各参考事件的向量化表示进行匹配,以将与所述第一主题的向量化表示匹配的参考事件作为第一候选事件;对所述第二主题进行向量化,以得到所述第二主题的向量化表示;将所述第二主题的向量化表示与各所述参考事件的向量化表示进行匹配,以将与所述第二主题的向量化表示匹配的参考事件作为第二候选事件。6.根据权利要求1所述的方法,其中,所述确定与所述第一主题关联的各第一候选事件,并确定与所述第二主题关联的各第二候选事件,包括:识别所述第一主题对应的事件论元,并识别所述第二主题对应的事件论元;将所述第一主题的事件论元与事件库中各参考事件的事件论元进行匹配,以将与所述
第一主题的事件论元匹配的参考事件,作为第一候选事件;将所述第二主题的事件论元与各所述参考事件的事件论元进行匹配,以将与所述第二主题的事件论元匹配的参考事件,作为第二候选事件。7.根据权利要求1所述的方法,其中,所述对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题,包括:搜索发布时间与当前时间处于设定范围内的素材,作为所述候选素材;针对每个所述候选素材,抽取所述候选素材中重要程度最高的第三主题;对各所述第三主题进行聚类,得到多个聚簇;从多个聚簇中确定所述目标聚簇,其中,所述目标聚簇中包含的第三主题的个数大于其他聚簇;将所述目标聚簇中处于聚簇中心的主题,作为所述第一主题。8.根据权利要求7所述的方法,其中,所述针对每个所述候选素材,抽取所述候选素材的第三主题之后,所述方法还包括:针对每个所述候选素材,抽取所述候选素材中的至少一个第四主题;其中,所述第四主题的重要程度低于所述第三主题;对各所述候选素材的第四主题进行聚类,以确定至少一个第五主题;确定与所述第五主题关联的第六主题;确定与所述第六主题关联的各第三候选事件。9.根据权利要求8所述的方法,其中,所述根据各所述第一候选事件和各所述第二候选事件之间的关联性,构建事件图谱,包括:根据各所述第一候选事件、各所述第二候选事件以及各所述第三候选事件之间的关联性,构建所述事件图谱。10.根据权利要求1所述的方法,其中,所述确定与所述第一主题关联的第二主题,包括:确定知识图谱中所述第一主题对应的目标节点;根据所述知识图谱中连接所述目标节点的边,以及所述目标节点的邻居节点,确定与所述第一主题关联的第二主题。11.根据权利要求1所述的方法,其中,所述确定与所述第一主题关联的第二主题,包括:确定与所述第一主题在同一候选素材中出现的候选主题;根据各所述候选主题与所述第一主题共同出现的次数,和/或,根据各所述候选主题与所述第一主题在同一候选素材中的位置信息,从各候选主题中确定所述第二主题。12.一种写作素材查询装置,所述装置包括:聚类模块,用于对多个候选素材所提取的主题进行聚类,以确定目标聚簇对应的第一主题;第一确定模块...
【专利技术属性】
技术研发人员:郑烨翰,蔡远俊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。