构建个人知识图谱的方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21453988 阅读:25 留言:0更新日期:2019-06-26 04:47
本申请揭示了一种构建个人知识图谱的方法、装置、计算机设备和存储介质,其中方法包括:接收用户输入的内容语音;将内容语音转换成内容文本文件;接收用户输入的语音命令,查找与语音命令对应的文件夹,并将内容文本文件存储到文件夹中,其中,文件夹设置有多个,不同的文件夹对应不同的语音命令;对文件夹中的内容文本文件进行关键内容抽取和相似内容聚类处理,得到整理后的知识内容;根据内容语音转换成内容文本文件的时间戳、以及文件夹的类别,将知识内容加入到用户的链表中对应类别的链条中,以更新用户的知识图谱。本申请用户可以通过语音播出的方式,对知识进行输出,无需用户手动打字,提高知识图谱建立的效率。

【技术实现步骤摘要】
构建个人知识图谱的方法、装置、计算机设备和存储介质
本申请涉及到知识图谱领域,特别是涉及到一种构建个人知识图谱的方法、装置、计算机设备和存储介质。
技术介绍
知识图谱(KnowledgeGraph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。构建个人的知识图谱的时候,一般需要获取用户个人的各种数据,如抓取用户网络浏览数据、日常撰写文件的输入数据等,将这些内容进行抽取和聚类,已形成用户的知识图谱,但是这样的知识图谱并不全面,用户的知识好多是存储在大脑中,然后通过语音交互的方式进行输出,这些知识并没有很好的接入到用户的个人知识图谱中,所以,提供一种基于用户语音内容构建知识图谱的方法,是有必要的。
技术实现思路
本申请的主要目的为提供一种构建个人知识图谱的方法、装置、计算机设备和存储介质,旨在解决现有技术中的个人知识图谱缺少用户语音输出的知识的问题。为了实现上述专利技术目的,本申请提出一种构建个人知识图谱的方法,括步骤:接收用户输入的内容语音;将所述内容语音转换成内容文本文件;接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中,其中,所述文件夹设置有多个,不同的文件夹对应不同的语音命令;对所述文件夹中的所述内容文本文件进行关键内容抽取和相似内容聚类处理,得到整理后的知识内容;根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱。进一步地,所述接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中的步骤,包括:接收所述用户输入的语音命令;将所述语音命令转换成语音文本;提取所述语音文本中的命令关键字;在预设的命令列表中查找与所述命令关键字对应的文件夹;将所述内容文本文件存储到所述文件夹中。进一步地,所述上接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中的步骤,包括:接收所述用户输入的语音命令;将所述语音命令与预设各类别的类别标准语音命令进行相似度比较;获取与所述语音命令相似度最大的类别标准语音命令对应的文件夹;将所述内容文本文件存储到所述文件夹中。进一步地,所述根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱的步骤之后,包括:接收用户输入的检索语音;将所述检索语音转换成检索文本文件;提取所述检索文本文件的检索关键字;根据所述检索关键字确定所述链表的检索链条,在所述检索链条中查找检索内容。进一步地,所述根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱的步骤之后,还包括:生成所述内容文本文件的知识内容摘要;将所述述内容文本文件的时间戳、存储内容文本文件的节点信息和知识内容摘要插入到预设的知识列表中,形成知识报表并展示。进一步地,所述根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱的步骤之后,还包括:对所述知识内容对应的链条进行标记。进一步地,所述根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱的步骤之后,还包括:遍历所述知识图谱的各链条上的节点,判断各节点上是否存在相同的知识内容;若存在,则提取相同的知识内容的知识关键词,并将所述知识关键词与各所述链条的类别进行相似度计算;保留与所述知识关键词相似度最高的类别对应的链条上的相同的知识内容,将其他的相同的知识内容清除。本申请还提供一种构建个人知识图谱的装置,包括:接收单元,用于接收用户输入的内容语音;第一转换单元,用于将所述内容语音转换成内容文本文件;接收存储单元,用于接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中,其中,所述文件夹设置有多个,不同的文件夹对应不同的语音命令;处理单元,用于对所述文件夹中的所述内容文本文件进行关键内容抽取和相似内容聚类处理,得到整理后的知识内容;更新单元,用于根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱。本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。本申请的构建个人知识图谱的方法、装置、计算机设备和存储介质,获取用户的语音信息,将其转换成内容文本文件,然后获取语音命令对内容文本文件进行初步的文件分类,提高分类速度,并方便关键内容抽取和相似内容聚类处理,得到整理后的知识内容,最后加入到知识图谱的链条中。本申请用户可以通过语音播出的方式,对知识进行输出,建立用户的知识图谱更加方便,无需用户手动打字,提高知识图谱建立的效率。附图说明图1为本申请一实施例的构建个人知识图谱的方法的流程示意图;图2为本申请一实施例的构建个人知识图谱的装置的结构示意框图;图3为本申请一实施例的计算机设备的结构示意框图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。参照图1,本申请提供一种构建个人知识图谱的方法,包括步骤:S1、接收用户输入的内容语音;S2、将所述内容语音转换成内容文本文件;S3、接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中,其中,所述文件夹设置有多个,不同的文件夹对应不同的语音命令;S4、对所述文件夹中的所述内容文本文件进行关键内容抽取和相似内容聚类处理,得到整理后的知识内容;S5、根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱。如上述步骤S1所述,接收用户输入语音的设备包括各种含有语音输入模块的智能电子设备,如智能手机、平板电脑、计算机等。上述用户输入的内容语音可以为用户独自输入的语音,也可以是用户与其他人进行语音交互时,用户与其他人共同产生的语音。在一个实施例中,内容语音是从用户与其他人进行语音交互时产生的综合语音中,通过声音分离技术,分离出的用户的语音。具体的,在上述综合语音中分离出与预设的用户声纹特征相同的语音,分离出的语音即为用户的内容语音。如上述步骤S2所述,即为通过语音转文字的技术将本文档来自技高网...

【技术保护点】
1.一种构建个人知识图谱的方法,其特征在于,包括步骤:接收用户输入的内容语音;将所述内容语音转换成内容文本文件;接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中,其中,所述文件夹设置有多个,不同的文件夹对应不同的语音命令;对所述文件夹中的所述内容文本文件进行关键内容抽取和相似内容聚类处理,得到整理后的知识内容;根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱。

【技术特征摘要】
1.一种构建个人知识图谱的方法,其特征在于,包括步骤:接收用户输入的内容语音;将所述内容语音转换成内容文本文件;接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中,其中,所述文件夹设置有多个,不同的文件夹对应不同的语音命令;对所述文件夹中的所述内容文本文件进行关键内容抽取和相似内容聚类处理,得到整理后的知识内容;根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱。2.根据权利要求1所述的构建个人知识图谱的方法,其特征在于,所述接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中的步骤,包括:接收所述用户输入的语音命令;将所述语音命令转换成语音文本;提取所述语音文本中的命令关键字;在预设的命令列表中查找与所述命令关键字对应的文件夹;将所述内容文本文件存储到所述文件夹中。3.根据权利要求1所述的构建个人知识图谱的方法,其特征在于,所述上接收用户输入的语音命令,查找与所述语音命令对应的文件夹,并将所述内容文本文件存储到所述文件夹中的步骤,包括:接收所述用户输入的语音命令;将所述语音命令与预设各类别的类别标准语音命令进行相似度比较;获取与所述语音命令相似度最大的类别标准语音命令对应的文件夹;将所述内容文本文件存储到所述文件夹中。4.根据权利要求1所述的构建个人知识图谱的方法,其特征在于,所述根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所述用户的知识图谱的步骤之后,包括:接收用户输入的检索语音;将所述检索语音转换成检索文本文件;提取所述检索文本文件的检索关键字;根据所述检索关键字确定所述链表的检索链条,在所述检索链条中查找检索内容。5.根据权利要求1所述的构建个人知识图谱的方法,其特征在于,所述根据所述内容语音转换成内容文本文件的时间戳、以及所述文件夹的类别,将所述知识内容加入到所述用户的链表中对应类别的链条中,以更新所...

【专利技术属性】
技术研发人员:吴壮伟
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1