基于人工智能的数据挖掘方法及服务器技术

技术编号:35708758 阅读:10 留言:0更新日期:2022-11-23 15:06
本申请实施例提供的基于人工智能的数据挖掘方法及服务器,通过将拟处理文本集合进行拆解得到多个拆解文本,对多个拆解文本分别进行离散文本表达知识挖掘和分布文本表达知识挖掘并进行表达知识碰撞,得到目标文本交融表达知识,接着获取多个拆解文本对应的文本表意知识,如此,令挖掘到的文本表意知识可以兼顾离散内容和分布内容,并且令挖掘到的文本表意知识可以尽可能维持文本初始特征,接着获取多个拆解文本对应的关键文本支持度,提升文本类型预测的精确度和可靠性,再从文本集合中确定多个文本序列,并确定对应的整合表意知识,从而获得相同文本序列集合,如此增加预测的精确度和可靠性和获得相同文本序列集合的精确度和可靠性。和可靠性。和可靠性。

【技术实现步骤摘要】
基于人工智能的数据挖掘方法及服务器


[0001]本申请涉及数据挖掘、人工智能领域,具体而言,涉及一种基于人工智能的数据挖掘方法及服务器。

技术介绍

[0002]随着互联网技术的发展,在文本领域,经常需要将一份较长的文本进行关键信息的整理合并。例如,针对于电商平台,电商日志文本包含较多的信息,需要从中挖掘出针对某一特定商品的信息,然后整合在一起形成针对该商品的信息,如商品评价;又如针对政企业务平台,需要在冗长的业务日志中挖掘出针对于某一指定事件的信息,再整合得到指定事件的关联信息。对于业务量庞大且对时效性要求高的平台而言,文本挖掘的准确性和效率是重要的考量要素,目前,对于上述类型的文本挖掘,其准确性和效率还不能满足要求。

技术实现思路

[0003]本专利技术的目的在于提供一种基于人工智能的数据挖掘方法及服务器,以改善上述的问题。
[0004]为了达到上述的目的,本申请实施例是这样实现的:本申请实施例第一方面提供了一种基于人工智能的数据挖掘方法,应用于服务器,所述方法包括:获取拟处理文本集合,将所述拟处理文本集合进行拆解,得到多个拆解文本;对所述多个拆解文本分别进行离散文本表达知识挖掘,得到所述多个拆解文本对应的离散文本表达知识,所述离散文本表达知识包括过渡离散文本表达知识和收束离散文本表达知识;对所述多个拆解文本分别进行分布文本表达知识挖掘,得到所述多个拆解文本对应的分布文本表达知识,所述分布文本表达知识包括过渡分布文本表达知识和收束分布文本表达知识;依据所述多个拆解文本对应的过渡离散文本表达知识和过渡分布文本表达知识进行表达知识碰撞,得到所述多个拆解文本对应的目标文本交融表达知识;依据所述多个拆解文本对应的收束离散文本表达知识、收束分布文本表达知识和目标文本交融表达知识进行表意知识挖掘,得到所述多个拆解文本对应的文本表意知识,并依据所述文本表意知识进行文本类型预测,得到所述多个拆解文本对应的关键文本支持度;依据所述关键文本支持度从所述拟处理文本集合中确定多个文本序列,并依据所述文本表意知识确定所述多个文本序列对应的整合表意知识;依据所述多个文本序列对应的整合表意知识进行文本序列类型预测,得到相同文本序列集合。
[0005]进一步地,所述依据所述多个文本序列对应的整合表意知识进行文本序列类型预测,得到相同文本序列集合,包括:依据所述多个文本序列对应的整合表意知识进行隐藏映射,得到隐藏映射知识;通过所述隐藏映射知识和所述多个拆解文本对应的关键文本支持度进行还原映射,得到所述多个文本序列对应的目标整合表意知识;依据所述多个文本序列对应的目标整合表意知识对所述多个文本序列进行类型预测,得到所述相同文本序列集合。
[0006]进一步地,所述依据所述多个文本序列对应的整合表意知识进行隐藏映射,得到隐藏映射知识,包括:提取所述多个拆解文本各自对应的初始文本表达知识,从所述多个拆解文本各自对应的初始文本表达知识中确定所述多个文本序列对应的文本序列初始表达知识;将所述多个文本序列对应的文本序列初始表达知识分别与对应的整合表意知识进行融合,得到所述多个文本序列对应的目标文本融合表达知识;将所述多个文本序列对应的目标文本融合表达知识加载至映射网络的隐藏模块中进行处理,获得目标隐藏映射知识。
[0007]进一步地,所述依据所述多个文本序列对应的目标整合表意知识对所述多个文本序列进行类型预测,得到所述相同文本序列集合,包括:通过所述多个文本序列对应的目标整合表意知识确定所述多个文本序列之间的共性度量结果;依据所述多个文本序列之间的共性度量结果进行划簇,得到所述相同文本序列集合。
[0008]进一步地,所述对所述多个拆解文本分别进行离散文本表达知识挖掘,得到所述多个拆解文本对应的离散文本表达知识,所述离散文本表达知识包括过渡离散文本表达知识和收束离散文本表达知识,包括:对所述多个拆解文本分别进行离散知识提取操作,得到所述多个拆解文本对应的多个过渡线性知识和收束线性知识;将所述多个过渡线性知识进行分布维数统一处理,得到所述多个拆解文本对应的多个过渡离散文本表达知识;将所述收束线性知识进行分布维数统一处理,得到所述多个拆解文本对应的收束离散文本表达知识。
[0009]进一步地,所述对所述多个拆解文本分别进行分布文本表达知识挖掘,得到所述多个拆解文本对应的分布文本表达知识,所述分布文本表达知识包括过渡分布文本表达知识和收束分布文本表达知识,包括:提取所述多个拆解文本各自对应的初始文本表达知识;对所述多个拆解文本各自对应的初始文本表达知识进行分布知识提取操作,得到所述多个拆解文本对应的多个过渡分布文本表达知识和收束分布文本表达知识。
[0010]进一步地,所述过渡离散文本表达知识包括多个,所述过渡分布文本表达知识包括多个;所述依据所述多个拆解文本对应的过渡离散文本表达知识和过渡分布文本表达知识进行表达知识碰撞,得到所述多个拆解文本对应的目标文本交融表达知识,包括:将所述多个过渡离散文本表达知识中第一过渡离散文本表达知识与所述多个过渡分布文本表达知识中对应的第一过渡分布文本表达知识进行融合,得到第一文本融合表达知识,依据所述第一文本融合表达知识进行知识提取操作,得到第一文本交融表达知识;将所述第一文本交融表达知识、所述多个过渡离散文本表达知识中第二过渡离散文本表达知识与所述多个过渡分布文本表达知识中对应的第二过渡分布文本表达知识进行融合,得到第二文本融合表达知识,依据所述第二文本融合表达知识进行知识提取操作,得到第二文本交融表达知识;当所述多个过渡离散文本表达知识和所述多个过渡分布文本表达知识均执行完毕,获得目标文本交融表达知识。
[0011]进一步地,所述依据所述多个拆解文本对应的收束离散文本表达知识、收束分布文本表达知识和目标文本交融表达知识进行表意知识挖掘,得到所述多个拆解文本对应的文本表意知识,并依据所述文本表意知识进行文本类型预测,得到所述多个拆解文本对应的关键文本支持度,包括:将所述多个拆解文本对应的收束离散文本表达知识、收束分布文本表达知识和目标文本交融表达知识进行融合,得到所述多个拆解文本对应的目标文本融合表达知识;依据所述多个拆解文本对应的目标文本融合表达知识进行知识提取操作,得
到所述多个拆解文本对应的线性表达知识;依据所述多个拆解文本对应的线性表达知识确定所述线性表达知识中每个维数下对应的知识向量最大值和知识向量均值;对所述知识向量最大值和所述知识向量均值进行和运算,得到所述线性表达知识中每个维数下对应的表意挖掘知识向量,依据所述线性表达知识中每个维数下对应的表意挖掘知识向量,得到所述多个拆解文本对应的表意挖掘知识;将所述多个拆解文本对应的表意挖掘知识进行激活,得到所述多个拆解文本对应的文本表意知识;通过所述多个拆解文本对应的文本表意知识进行关键文本和非关键文本类型预测,得到所述多个拆解文本对应的关键文本支持度。
[0012]进一步地,所述方法还包括:将所述拟处理文本集合加载至文本类型预测模块中,通过所述文本类型预测模块将所述拟处理文本集合进行拆解,得到多个拆解文本;通过所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的数据挖掘方法,其特征在于,应用于服务器,所述方法包括:获取拟处理文本集合,将所述拟处理文本集合进行拆解,得到多个拆解文本;对所述多个拆解文本分别进行离散文本表达知识挖掘,得到所述多个拆解文本对应的离散文本表达知识,所述离散文本表达知识包括过渡离散文本表达知识和收束离散文本表达知识;对所述多个拆解文本分别进行分布文本表达知识挖掘,得到所述多个拆解文本对应的分布文本表达知识,所述分布文本表达知识包括过渡分布文本表达知识和收束分布文本表达知识;依据所述多个拆解文本对应的过渡离散文本表达知识和过渡分布文本表达知识进行表达知识碰撞,得到所述多个拆解文本对应的目标文本交融表达知识;依据所述多个拆解文本对应的收束离散文本表达知识、收束分布文本表达知识和目标文本交融表达知识进行表意知识挖掘,得到所述多个拆解文本对应的文本表意知识,并依据所述文本表意知识进行文本类型预测,得到所述多个拆解文本对应的关键文本支持度;依据所述关键文本支持度从所述拟处理文本集合中确定多个文本序列,并依据所述文本表意知识确定所述多个文本序列对应的整合表意知识;依据所述多个文本序列对应的整合表意知识进行文本序列类型预测,得到相同文本序列集合。2.根据权利要求1所述的方法,其特征在于,所述依据所述多个文本序列对应的整合表意知识进行文本序列类型预测,得到相同文本序列集合,包括:依据所述多个文本序列对应的整合表意知识进行隐藏映射,得到隐藏映射知识;通过所述隐藏映射知识和所述多个拆解文本对应的关键文本支持度进行还原映射,得到所述多个文本序列对应的目标整合表意知识;依据所述多个文本序列对应的目标整合表意知识对所述多个文本序列进行类型预测,得到所述相同文本序列集合。3.根据权利要求2所述的方法,其特征在于,所述依据所述多个文本序列对应的整合表意知识进行隐藏映射,得到隐藏映射知识,包括:提取所述多个拆解文本各自对应的初始文本表达知识,从所述多个拆解文本各自对应的初始文本表达知识中确定所述多个文本序列对应的文本序列初始表达知识;将所述多个文本序列对应的文本序列初始表达知识分别与对应的整合表意知识进行融合,得到所述多个文本序列对应的目标文本融合表达知识;将所述多个文本序列对应的目标文本融合表达知识加载至映射网络的隐藏模块中进行处理,获得目标隐藏映射知识。4.根据权利要求2所述的方法,其特征在于,所述依据所述多个文本序列对应的目标整合表意知识对所述多个文本序列进行类型预测,得到所述相同文本序列集合,包括:通过所述多个文本序列对应的目标整合表意知识确定所述多个文本序列之间的共性度量结果;依据所述多个文本序列之间的共性度量结果进行划簇,得到所述相同文本序列集合。5.根据权利要求1所述的方法,其特征在于,所述对所述多个拆解文本分别进行离散文本表达知识挖掘,得到所述多个拆解文本对应的离散文本表达知识,所述离散文本表达知
识包括过渡离散文本表达知识和收束离散文本表达知识,包括:对所述多个拆解文本分别进行离散知识提取操作,得到所述多个拆解文本对应的多个过渡线性知识和收束线性知识;将所述多个过渡线性知识进行分布维数统一处理,得到所述多个拆解文本对应的多个过渡离散文本表达知识;将所述收束线性知识进行分布维数统一处理,得到所述多个拆解文本对应的收束离散文本表达知识。6.根据权利要求1所述的方法,其特征在于,所述对所述多个拆解文本分别进行分布文本表达知识挖掘,得到所述多个拆解文本对应的分布文本表达知识,所述分布文本表达知识包括过渡分布文本表达知识和收束分布文本表达知识,包括:提取所述多个拆解文本各自对应的初始文本表达知识;对所述多个拆解文本各自对应的初始文本表达知识进行分布知识提取操作,得到所述多个拆解文本对应的多个过渡分布文本表达知识和收束分布文本表达知识。7.根据权利要求1所述的方法,其特征在于,所述过渡离散文本表达知识包括多个,所述过渡分布文本表达知识包括多个;所述依据所述多个拆解文本对应的过渡离散文本表达知识和过渡分布文本表达知识进行表达知识碰撞,得到所述多个拆解文本对应的目标文本交融表达知识,包括:将所述多个过渡离散文本表达知识中第一过渡离散文本表达知识与所述多个过渡分布文本表达知识中对应的第一过渡分布文本表达知识进行融合,得到第...

【专利技术属性】
技术研发人员:张志华
申请(专利权)人:江苏益柏锐信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1