【技术实现步骤摘要】
一种知识挖掘方法、平台、系统及存储介质
[0001]本专利技术涉及计算机软件
,具体涉及一种知识挖掘方法、平台、系统及存储介质。
技术介绍
[0002]在现有的智能问答机器人中,运营人员在准备准备机器人数据步骤繁琐,需要将大量结构不同的数据转化为机器人可用的数据结构,然后对转换后的数据进行挖掘处理。现有的挖掘平台在对大量数据源进行挖掘处理时效率低下,耗时长。面对新的项目的机器人,准备机器人数据速度慢,无法完成冷启动。
技术实现思路
[0003]针对现有技术中的技术缺陷,本专利技术实施例的目的在于提供一种知识挖掘方法、平台、系统及存储介质,以解决
技术介绍
中所提出的技术问题。
[0004]为实现上述目的,第一方面,本申请提供了一种知识挖掘方法,包括:
[0005]从不同的数据源获取外部数据,将外部数据的结构统一转换为预设的内部结构,构建第一数据集;
[0006]将所述第一数据集内的数据结构转换为挖掘节点的数据结构类型,构建第二数据集;
[0007]根据所述挖掘节点的任务类型, ...
【技术保护点】
【技术特征摘要】
1.一种知识挖掘方法,其特征在于,包括:从不同的数据源获取外部数据,将外部数据的结构统一转换为预设的内部结构,构建第一数据集;将所述第一数据集内的数据结构转换为挖掘节点的数据结构类型,构建第二数据集;根据所述挖掘节点的任务类型,同时执行N个相应的挖掘算法对所述第二数据集中的数据进行挖掘,生成知识结果集,N为大于等于1的正整数;对所述知识结果集中的知识结果进行去重处理。2.根据权利要求1所述的一种知识挖掘方法,其特征在于,通过数据下载软件从数据源获取外部数据。3.根据权利要求1所述的一种知识挖掘方法,其特征在于,所述挖掘节点的任务类型包括标准问语料扩写、构建知识图谱和挖掘日志聚类中的一种。4.根据权利要求1所述的一种知识挖掘方法,其特征在于,对所述知识结果集中的知识结果进行去重处理,具体包括:采用逐一比对的方法计算所述知识结果集中不同知识结果之间的相似度,去除所述知识结果集中相似度高于阈值的两条知识结果之一。5.根据权利要求4所述的一种知识挖掘方法,其特征在于,相似度高于阈值的两条知识结果包括重合的两条知识结果。6.根据权利要求1所述的一种知识挖掘方法,其特征在于,所述方法还包括:对去重处理后的所述知识结果集进行存储。7.根据权利要求6所述的一种知识挖掘方法,其特征在于,对去重处理后的所述...
【专利技术属性】
技术研发人员:简仁贤,许鹏,彭亮,张梦真,闫鸣宇,
申请(专利权)人:竹间智能科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。