文本挖掘方法、装置、设备及存储介质制造方法及图纸

技术编号:38142006 阅读:14 留言:0更新日期:2023-07-08 09:57
本发明专利技术涉及人工智能,提供一种文本挖掘方法、装置、设备及存储介质。该方法当监测到挖掘模板在操作界面中被成功触发时,根据正向输入词汇生成目标词汇,根据目标词汇在操作界面中的输入位置识别出挖掘关系,根据模板词汇、负向输入词汇、挖掘关系及目标词汇的词间距离生成搜索语句,根据模板类型在预设微服务架构中的文本数量,调用搜索线程执行搜索语句,高效并准确的得到搜索文本,进而生成挖掘详情界面。此外,本发明专利技术还涉及区块链技术,所述挖掘详情界面可存储于区块链中。情界面可存储于区块链中。情界面可存储于区块链中。

【技术实现步骤摘要】
文本挖掘方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种文本挖掘方法、装置、设备及存储介质。

技术介绍

[0002]在当下的大数据时代,金融等行业都积累了海量数据,这些数据包括结构化文本和非结构化文本。随着企业与客户的交互方式的增多,许多有价值的信息隐藏在这些海量交互数据中,因此,各企业对文本挖掘的需求与日俱增。
[0003]在人工智能领域中存在相关的文本挖掘方案,然而,在这些方案中,由于缺少结构化标签(如客户标签、坐席画像、经营信息等)辅助挖掘范围的锁定,导致无法高效并精准的在海量信息中挖掘出有价值的文本信息。

技术实现思路

[0004]鉴于以上内容,有必要提供一种文本挖掘方法、装置、设备及存储介质,能够解决无法高效并精准的在海量信息中挖掘出有价值的文本信息的技术问题。
[0005]一方面,本专利技术提出一种文本挖掘方法,所述文本挖掘方法包括:
[0006]当接收到文本挖掘请求时,根据所述文本挖掘请求在操作界面中显示挖掘模板;
[0007]当监测到所述挖掘模板在所述操作界面中被成功触发时,根据所述操作界面中的正向输入词汇生成目标词汇,所述目标词汇包括所述正向输入词汇、所述正向输入词汇所对应的联想词汇中的关键词汇;
[0008]根据所述目标词汇在所述操作界面中的输入位置识别出挖掘关系;
[0009]根据所述挖掘模板中的模板词汇、所述操作界面中的负向输入词汇、所述挖掘关系及所述目标词汇的词间距离,生成搜索语句;
[0010]根据所述挖掘模板所对应的模板类型在预设微服务架构中的文本数量,调用预设搜索引擎中的搜索线程执行所述搜索语句,得到搜索文本;
[0011]根据所述文本数量及所述搜索文本生成挖掘详情界面。
[0012]根据本专利技术优选实施例,在根据所述操作界面中的正向输入词汇生成目标词汇之前,所述文本挖掘方法还包括:
[0013]识别所述挖掘模板在所述操作界面上的起始显示时刻;
[0014]基于所述起始显示时刻,获取所述操作界面的操作日志;
[0015]从所述操作界面中识别出与所述挖掘模板相关联的关联按钮的按钮位置,并识别出所述操作界面中文本框的框位置;
[0016]检测所述操作日志是否包括所述按钮位置及所述框位置;
[0017]若所述操作日志中包括所述按钮位置及/或所述框位置,则确定所述挖掘模板在所述操作界面中被成功触发。
[0018]根据本专利技术优选实施例,所述框位置包括正向位置及负向位置,所述根据所述操
作界面中的正向输入词汇生成目标词汇包括:
[0019]从所述正向位置中获取所述正向输入词汇;
[0020]基于预先训练完成的近义词预测模型,生成所述正向输入词汇所对应的联想词汇;
[0021]检测所述联想词汇是否被成功触发;
[0022]将触发成功的联想词汇确定为所述关键词汇;
[0023]根据所述正向输入词汇及所述关键词汇生成所述目标词汇所述框位置包括正向位置及负向位置,所述根据所述操作界面中的正向输入词汇生成目标词汇包括:
[0024]从所述正向位置中获取所述正向输入词汇;
[0025]基于预先训练完成的近义词预测模型,生成所述正向输入词汇所对应的联想词汇;
[0026]检测所述联想词汇是否被成功触发;
[0027]将触发成功的联想词汇确定为所述关键词汇;
[0028]根据所述正向输入词汇及所述关键词汇生成所述目标词汇。
[0029]根据本专利技术优选实施例,所述近义词预测模型包括语义分析网络及预测输出网络,所述语义分析网络包括正向特征提取网络及反向特征提取网络,所述基于预先训练完成的近义词预测模型,生成所述正向输入词汇所对应的联想词汇包括:
[0030]对所述正向输入词汇进行编码处理,得到输入向量;
[0031]基于所述正向特征提取网络对所述输入向量进行特征提取,得到第一特征;
[0032]基于所述反向特征提取网络对所述输入向量进行特征提取,得到第二特征;
[0033]根据所述第一特征及所述第二特征生成所述正向输入词汇的语义向量;
[0034]基于所述语义向量,从所述预测输出网络中获取对应的词汇作为所述联想词汇。
[0035]根据本专利技术优选实施例,所述根据所述挖掘模板中的模板词汇、所述操作界面中的负向输入词汇、所述挖掘关系及所述目标词汇的词间距离,生成搜索语句包括:
[0036]识别出所述模板词汇在所述挖掘模板中的词汇类型,并识别出所述模板词汇在所述挖掘模板中的词汇关系;
[0037]将所述词汇类型为负向类型的模板词汇及所述负向输入词汇生成负向搜索词汇;
[0038]将所述词汇类型为正向类型的模板词汇及所述目标词汇生成正向搜索词汇;
[0039]将所述词汇关系、所述负向搜索词汇、所述正向搜索词汇、所述挖掘关系及所述词间距离写入预设查询语句中,得到所述搜索语句。
[0040]根据本专利技术优选实施例,所述根据所述文本数量及所述搜索文本生成挖掘详情界面包括:
[0041]统计所述搜索文本的搜索数量;
[0042]根据所述搜索数量与所述文本数量的比值生成搜索比值;
[0043]统计所述搜索文本中每个正向搜索词汇出现的频次;
[0044]根据所述频次计算所述搜索文本与所述搜索语句的匹配度;
[0045]根据所述匹配度,从多个所述搜索文本中筛选出目标文本;
[0046]将所述文本数量、所述搜索数量、所述搜索比值、所述频次及所述目标文本写入预设界面,得到所述挖掘详情界面。
[0047]根据本专利技术优选实施例,所述根据所述挖掘模板所对应的模板类型在预设微服务架构中的文本数量,调用预设搜索引擎中的搜索线程执行所述搜索语句,得到搜索文本包括:
[0048]基于所述模板类型,对所述预设微服务架构中存储的舆情文本进行量化,得到所述文本数量;
[0049]从所述预设搜索引擎中获取闲置线程的处理速率;
[0050]从所述文本挖掘请求中提取挖掘时长需求;
[0051]将取值最小的处理速率确定为目标速率;
[0052]根据所述文本数量、所述挖掘时长需求及所述目标速率,计算出线程数量;
[0053]根据所述线程数量及所述处理速率,从多个所述闲置线程中筛选出所述搜索线程;
[0054]调用所述搜索线程,将所述搜索语句与所述舆情文本进行比较,并将与所述搜索语句匹配成功的舆情文本确定为所述搜索文本。
[0055]另一方面,本专利技术还提出一种文本挖掘装置,所述文本挖掘装置包括:
[0056]显示单元,用于当接收到文本挖掘请求时,根据所述文本挖掘请求在操作界面中显示挖掘模板;
[0057]生成单元,用于当监测到所述挖掘模板在所述操作界面中被成功触发时,根据所述操作界面中的正向输入词汇生成目标词汇,所述目标词汇包括所述正向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本挖掘方法,其特征在于,所述文本挖掘方法包括:当接收到文本挖掘请求时,根据所述文本挖掘请求在操作界面中显示挖掘模板;当监测到所述挖掘模板在所述操作界面中被成功触发时,根据所述操作界面中的正向输入词汇生成目标词汇,所述目标词汇包括所述正向输入词汇、所述正向输入词汇所对应的联想词汇中的关键词汇;根据所述目标词汇在所述操作界面中的输入位置识别出挖掘关系;根据所述挖掘模板中的模板词汇、所述操作界面中的负向输入词汇、所述挖掘关系及所述目标词汇的词间距离,生成搜索语句;根据所述挖掘模板所对应的模板类型在预设微服务架构中的文本数量,调用预设搜索引擎中的搜索线程执行所述搜索语句,得到搜索文本;根据所述文本数量及所述搜索文本生成挖掘详情界面。2.如权利要求1所述的文本挖掘方法,其特征在于,在根据所述操作界面中的正向输入词汇生成目标词汇之前,所述文本挖掘方法还包括:识别所述挖掘模板在所述操作界面上的起始显示时刻;基于所述起始显示时刻,获取所述操作界面的操作日志;从所述操作界面中识别出与所述挖掘模板相关联的关联按钮的按钮位置,并识别出所述操作界面中文本框的框位置;检测所述操作日志是否包括所述按钮位置及所述框位置;若所述操作日志中包括所述按钮位置及/或所述框位置,则确定所述挖掘模板在所述操作界面中被成功触发。3.如权利要求2所述的文本挖掘方法,其特征在于,所述框位置包括正向位置及负向位置,所述根据所述操作界面中的正向输入词汇生成目标词汇包括:从所述正向位置中获取所述正向输入词汇;基于预先训练完成的近义词预测模型,生成所述正向输入词汇所对应的联想词汇;检测所述联想词汇是否被成功触发;将触发成功的联想词汇确定为所述关键词汇;根据所述正向输入词汇及所述关键词汇生成所述目标词汇。4.如权利要求3所述的文本挖掘方法,其特征在于,所述近义词预测模型包括语义分析网络及预测输出网络,所述语义分析网络包括正向特征提取网络及反向特征提取网络,所述基于预先训练完成的近义词预测模型,生成所述正向输入词汇所对应的联想词汇包括:对所述正向输入词汇进行编码处理,得到输入向量;基于所述正向特征提取网络对所述输入向量进行特征提取,得到第一特征;基于所述反向特征提取网络对所述输入向量进行特征提取,得到第二特征;根据所述第一特征及所述第二特征生成所述正向输入词汇的语义向量;基于所述语义向量,从所述预测输出网络中获取对应的词汇作为所述联想词汇。5.如权利要求1所述的文本挖掘方法,其特征在于,所述根据所述挖掘模板中的模板词汇、所述操作界面中的负向输入词汇、所述挖掘关系及所述目标词汇的词间距离,生成搜索语句包括:识别出所述模板词汇在所述挖掘模板中的词汇类型,并识别出所述模板词汇在所述挖
掘模板中的词汇关系;将所述词汇类型为负向类型的模板词汇及所述负向输入词汇生成负向搜索词汇...

【专利技术属性】
技术研发人员:刘伊诺毛星越李婷陈贝妮沈皓辰
申请(专利权)人:深圳平安综合金融服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1