当前位置: 首页 > 专利查询>张立峰专利>正文

结合人工智能和大数据的信息挖掘方法及系统技术方案

技术编号:33708199 阅读:47 留言:0更新日期:2022-06-06 08:35
本申请公开了结合人工智能和大数据的信息挖掘方法及系统,通过确定多个日志记录事项中每个日志记录事项对应的日志记录事项描述集;日志记录事项描述集包括日志记录事项在多种互动状态层面下的描述;多种互动状态层面至少包括承载内容层面和潜在画像层面;基于每个日志记录事项对应的日志记录事项描述集,生成每个日志记录事项对应的潜在画像事项描述;潜在画像事项描述用于表达日志记录事项对应的潜在画像信息;根据每个日志记录事项对应的潜在画像事项描述,确定待挖掘业务项目日志中的潜在画像项目日志和潜在画像项目日志的潜在画像种类。可以提高潜在画像挖掘过程中的潜在画像项目日志及潜在画像种类获取的准确度和可信度。可信度。可信度。

【技术实现步骤摘要】
结合人工智能和大数据的信息挖掘方法及系统


[0001]本申请涉及人工智能和大数据
,尤其涉及一种结合人工智能和大数据的信息挖掘方法及系统。

技术介绍

[0002]现目前,大数据(big Data)和人工智能(Artificial Intelligence,AI)密不可分。大数据为人工智能提供了关键的数据基础和大数据计算环境,是人工智能的驱动力。相应的,人工智能反过来为大数据提供了算法分析基础,可以理解为大数据技术的“大脑”。近年来,大数据和人工智能的不断成熟,“大数据智能”在不同业务领域的应用越来越广泛。
[0003]在实际的业务应用中,通常需要借助大数据和人工智能进行用户画像识别、挖掘和分析以服务于业务应用,然而相关的用户画像挖掘技术存在效率低下的问题。

技术实现思路

[0004]本申请实施例提供了一种结合人工智能和大数据的信息挖掘方法及系统,能够提高潜在画像挖掘过程中的潜在画像项目日志及潜在画像种类获取的准确度和可信度。
[0005]有鉴于此,本申请一方面提供一种结合人工智能和大数据的信息挖掘方法,应用于信息挖掘系统,所述方法包括:获取待挖掘业务项目日志的多个日志记录事项;确定所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集;所述日志记录事项描述集包括所述日志记录事项在多种互动状态层面下的描述;所述多种互动状态层面至少包括承载内容层面和潜在画像层面;基于每个所述日志记录事项对应的日志记录事项描述集,生成每个所述日志记录事项对应的潜在画像事项描述;所述潜在画像事项描述用于表达所述日志记录事项对应的潜在画像信息;根据每个所述日志记录事项对应的潜在画像事项描述,确定所述待挖掘业务项目日志中的潜在画像项目日志和所述潜在画像项目日志的潜在画像种类。
[0006]本申请另一方面提供一种信息挖掘系统,包括:存储器,用于存储可执行的指令;处理器,用于根据所述可执行的指令的控制,运行所述信息挖掘系统执行如第一方面任一项所述的方法。
[0007]从以上技术方案可以看出,本申请实施例具有以下优点:通过确定多个日志记录事项中每个日志记录事项对应的日志记录事项描述集;日志记录事项描述集包括日志记录事项在多种互动状态层面下的描述;多种互动状态层面至少包括承载内容层面和潜在画像层面;基于每个日志记录事项对应的日志记录事项描述集,生成每个日志记录事项对应的潜在画像事项描述;潜在画像事项描述用于表达日志记录事项对应的潜在画像信息;根据每个日志记录事项对应的潜在画像事项描述,确定待挖掘业务项目日志中的潜在画像项目日志和潜在画像项目日志的潜在画像种类。可以提高潜在画像挖掘过程中的潜在画像项目
日志及潜在画像种类获取的准确度和可信度。
附图说明
[0008]图1是示出可以实现本申请的实施例的信息挖掘系统的一种硬件配置的框图。
[0009]图2是示出可以实现本申请的实施例的信息挖掘系统的另一种硬件配置的框图。
[0010]图3是示出可以实现本申请的实施例的结合人工智能和大数据的信息挖掘方法的流程图。
[0011]图4是示出可以实现本申请的实施例的结合人工智能和大数据的信息挖掘方法的应用场景的架构示意图。
具体实施方式
[0012]<硬件配置>图1是示出可以实现本申请的实施例的信息挖掘系统100的一种硬件配置的框图,信息挖掘系统100可以包括处理器110和存储器120,存储器120用于存储可执行的指令,处理器110用于根据可执行的指令的控制,运行信息挖掘系统100执行本申请中的结合人工智能和大数据的信息挖掘方法。
[0013]图2是示出可以实现本申请的实施例的信息挖掘系统100的另一种硬件配置的框图,信息挖掘系统100可以包括处理器110、存储器120和结合人工智能和大数据的信息挖掘装置400,结合人工智能和大数据的信息挖掘装置400包括至少一个可以软件或固件(firmware)的形式储存于所述存储器120中的软件功能模块,所述处理器110通过运行存储在存储器120内的软件程序以及模块,例如本申请实施例中的结合人工智能和大数据的信息挖掘装置400,从而执行各种功能应用以及数据处理,即实现本申请实施例中的结合人工智能和大数据的信息挖掘方法。
[0014]<方法实施例>图3是示出可以实现本申请的实施例的结合人工智能和大数据的信息挖掘方法的流程图,结合人工智能和大数据的信息挖掘方法可以通过图1或图2所示的信息挖掘系统100实现,进一步可以包括以下步骤所描述的技术方案。
[0015]在步骤301中,获取待挖掘业务项目日志的多个日志记录事项。
[0016]以一些示例性的角度来看待,其中,待挖掘业务项目日志是指待挖掘的业务项目日志信息。比如,话题业务项目日志、支付业务项目日志、办公业务项目日志,等等。该待挖掘业务项目日志中可以多个按照次序排列的日志记录事项。该日志记录事项包括但不限于是各类消息中的文本、符号等等。其中,还可以按照业务环境类别的差异,将该待挖掘业务项目日志分为支付环境、会话环境、在线教育环境和企业服务环境等多个业务环境的业务项目日志数据。该待挖掘业务项目日志还可以是用户较为关注的内容业务项目日志,例如,用户关注、转发、评论或点赞的内容业务项目日志。
[0017]以一些示例性的角度来看待,获取上述待挖掘业务项目日志的方式可以有多种。比如,可以直接获取业务用户在业务互动设备上传入的待挖掘业务项目日志,也可以通过网络从云数据库或者关系型数据库中获取待挖掘业务项目日志,还可以由其他智能设备转换获得,等等。比如,可以获取目标业务用户的不同种类的业务互动数据,并将这些业务互
动数据转换为业务项目日志种类的待挖掘业务项目日志。
[0018]例如,可以获得目标业务用户的语音业务咨询申请,并对该语音业务咨询申请进行声纹识别处理,得到该语音业务咨询申请对应的待挖掘业务项目日志。还可以获得目标业务用户的可视化业务互动信息,并采用可视化信息转换的方式提取该可视化业务互动信息中的重要内容,从而根据该重要内容得到对应的待挖掘业务项目日志。
[0019]以一些可独立实施的设计思路角度来看,待挖掘业务项目日志的获取可以依据相关业务场景下的主题型互动事件确定,比如通过主题型互动事件定位待挖掘业务项目日志的项目类别,然后结合上述方式确定对应的待挖掘业务项目日志。
[0020]对于一些可独立实施的技术方案而言,主题型互动事件可以通过以下内容获取:从多样化互动事件集的第一智慧业务互动事件提取第一显著性事件描述信息,并从所述多样化互动事件集的第二智慧业务互动事件提取第二显著性事件描述信息;将所述第一显著性事件描述信息拆解为多个第一层次化关键描述信息,并将所述第二显著性事件描述信息拆解为多个第二层次化关键描述信息;基于所述多个第一层次化关键描述信息和所述多个第二层次化关键描述信息,确定所述第一智慧业务互动事件和所述第二智慧业务互动事件之间的量化共性评价;根据所述第一智慧本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合人工智能和大数据的信息挖掘方法,其特征在于,应用于信息挖掘系统,所述方法包括:获取待挖掘业务项目日志的多个日志记录事项;确定所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集;所述日志记录事项描述集包括所述日志记录事项在多种互动状态层面下的描述;所述多种互动状态层面至少包括承载内容层面和潜在画像层面;基于每个所述日志记录事项对应的日志记录事项描述集,生成每个所述日志记录事项对应的潜在画像事项描述;所述潜在画像事项描述用于表达所述日志记录事项对应的潜在画像信息;根据每个所述日志记录事项对应的潜在画像事项描述,确定所述待挖掘业务项目日志中的潜在画像项目日志和所述潜在画像项目日志的潜在画像种类。2.根据权利要求1所述的方法,其特征在于,所述日志记录事项描述集包括所述日志记录事项对应的事项主题描述;所述获取所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集,包括:将所述待挖掘业务项目日志传入预先设置的第一神经网络模型中,通过所述第一神经网络模型获取所述每个所述日志记录事项对应的事项主题描述;所述事项主题描述包括所述日志记录事项对应的日志记录事项描述、事项内容分布描述和局部化信息描述。3.根据权利要求2所述的方法,其特征在于,所述日志记录事项描述集还包括所述日志记录事项对应的事项场景描述;所述获取所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集,还包括:提取所述待挖掘业务项目日志中的至少一个待挖掘场景的场景约束信息;基于所述至少一个待挖掘场景的场景约束信息,生成每个所述日志记录事项对应的事项场景描述。4.根据权利要求3所述的方法,其特征在于,所述事项场景描述包括所述承载内容约束描述;所述提取所述待挖掘业务项目日志中的至少一个待挖掘场景的场景约束信息,包括:对所述待挖掘业务项目日志进行场景划分,得到所述待挖掘业务项目日志中的至少一个待挖掘承载内容的承载内容约束信息;所述基于所述至少一个待挖掘场景的场景约束信息,生成每个所述日志记录事项对应的事项场景描述,包括:基于所述至少一个待挖掘承载内容的承载内容约束信息,生成每个所述日志记录事项对应的承载内容约束描述;所述承载内容约束描述用于表达所述日志记录事项在与所述日志记录事项对应的待挖掘承载内容中的事项内容分布。5.根据权利要求4所述的方法,其特征在于,所述事项场景描述还包括所述潜在画像约束描述;所述提取所述待挖掘业务项目日志中的至少一个待挖掘场景的场景约束信息,还包括:根据预先设置的潜在画像数据库,获取所述待挖掘业务项目日志中的至少一个待挖掘潜在画像的潜在画像拆分信息;所述基于所述至少一个待挖掘场景的场景约束信息,生成每个所述日志记录事项对应的事项场景描述,还包括:基于所述至少一个待挖掘承载内容的潜在画像拆分信息,生成每个所述日志记录事项对应的潜在画像约束描述;所述潜在画像约束描述用于表达所述日志记录事项在与所述日志记录事项对应的待挖掘承载内容中的事项内容分布;
相应的,所述基于每个所述日志记录事项对应的日志记录事项描述集,生成每个所述日志记录事项对应的潜在画像事项描述,包括:将每个所述日志记录事项对应的日志记录事项描述集传入至预先设置的第二神经网络模型中,得到所述第二神经网络模型输出的每个所述日志记录事项对应的潜在画像事项描述。6.根据权利要求5所述的方法,其特征在于,所述将每个所述日志记录事项对应的日志记录事项描述集传入至预先设置的第二神经网络模型中,得到所述第二神经网络模型输出的每个所述日志记录事项对应的潜在画像事项描述,包括:获取所述日志记录事项描述集对应的重要程度信息;所述重要程度信息包括所述日志记录事项描述集中每个所述层面对应的重要程度;根据每个所述层面对应的重要程度,对所述日志记录事项在不同层面下的日志记录事项描述进行合并,得到待输入日志记录事项描述;将每个所述日志记录事项对应的待输入日志记录事项描述传入至预先设置的第二神经网络模型中,得到所述第二神经网络模型输出的每个所述日志记录事项对应的潜在画像事项描述。7.根据权利要求5所述的方法,其特征在于,所述根据每个所述日志记录事项对应的潜在画像事项描述,从所述待挖掘业务项目日志中提取潜在画像项目日志,包括:根据每个所述日志记录事项对应的潜在画像事...

【专利技术属性】
技术研发人员:张立峰
申请(专利权)人:张立峰
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1