【技术实现步骤摘要】
文本挖掘方法、装置、设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种文本挖掘方法、装置、设备及存储介质。
技术介绍
[0002]在当下的大数据时代,金融等行业都积累了海量数据,这些数据包括结构化文本和非结构化文本。随着企业与客户的交互方式的增多,许多有价值的信息隐藏在这些海量交互数据中,因此,各企业对文本挖掘的需求与日俱增。
[0003]在人工智能领域中存在相关的文本挖掘方案,然而,在这些方案中,由于缺少结构化标签(如客户标签、坐席画像、经营信息等)辅助挖掘范围的锁定,导致无法高效并精准的在海量信息中挖掘出有价值的文本信息。
技术实现思路
[0004]鉴于以上内容,有必要提供一种文本挖掘方法、装置、设备及存储介质,能够解决无法高效并精准的在海量信息中挖掘出有价值的文本信息的技术问题。
[0005]一方面,本专利技术提出一种文本挖掘方法,所述文本挖掘方法包括:
[0006]当接收到文本挖掘请求时,根据所述文本挖掘请求在操作界面中显示挖掘模板;
[0007]当监测到所述挖掘模板在所述操作界面中被成功触发时,根据所述操作界面中的正向输入词汇生成目标词汇,所述目标词汇包括所述正向输入词汇、所述正向输入词汇所对应的联想词汇中的关键词汇;
[0008]根据所述目标词汇在所述操作界面中的输入位置识别出挖掘关系;
[0009]根据所述挖掘模板中的模板词汇、所述操作界面中的负向输入词汇、所述挖掘关系及所述目标词汇的词间距离,生成搜索语句;
...
【技术保护点】
【技术特征摘要】
1.一种文本挖掘方法,其特征在于,所述文本挖掘方法包括:当接收到文本挖掘请求时,根据所述文本挖掘请求在操作界面中显示挖掘模板;当监测到所述挖掘模板在所述操作界面中被成功触发时,根据所述操作界面中的正向输入词汇生成目标词汇,所述目标词汇包括所述正向输入词汇、所述正向输入词汇所对应的联想词汇中的关键词汇;根据所述目标词汇在所述操作界面中的输入位置识别出挖掘关系;根据所述挖掘模板中的模板词汇、所述操作界面中的负向输入词汇、所述挖掘关系及所述目标词汇的词间距离,生成搜索语句;根据所述挖掘模板所对应的模板类型在预设微服务架构中的文本数量,调用预设搜索引擎中的搜索线程执行所述搜索语句,得到搜索文本;根据所述文本数量及所述搜索文本生成挖掘详情界面。2.如权利要求1所述的文本挖掘方法,其特征在于,在根据所述操作界面中的正向输入词汇生成目标词汇之前,所述文本挖掘方法还包括:识别所述挖掘模板在所述操作界面上的起始显示时刻;基于所述起始显示时刻,获取所述操作界面的操作日志;从所述操作界面中识别出与所述挖掘模板相关联的关联按钮的按钮位置,并识别出所述操作界面中文本框的框位置;检测所述操作日志是否包括所述按钮位置及所述框位置;若所述操作日志中包括所述按钮位置及/或所述框位置,则确定所述挖掘模板在所述操作界面中被成功触发。3.如权利要求2所述的文本挖掘方法,其特征在于,所述框位置包括正向位置及负向位置,所述根据所述操作界面中的正向输入词汇生成目标词汇包括:从所述正向位置中获取所述正向输入词汇;基于预先训练完成的近义词预测模型,生成所述正向输入词汇所对应的联想词汇;检测所述联想词汇是否被成功触发;将触发成功的联想词汇确定为所述关键词汇;根据所述正向输入词汇及所述关键词汇生成所述目标词汇。4.如权利要求3所述的文本挖掘方法,其特征在于,所述近义词预测模型包括语义分析网络及预测输出网络,所述语义分析网络包括正向特征提取网络及反向特征提取网络,所述基于预先训练完成的近义词预测模型,生成所述正向输入词汇所对应的联想词汇包括:对所述正向输入词汇进行编码处理,得到输入向量;基于所述正向特征提取网络对所述输入向量进行特征提取,得到第一特征;基于所述反向特征提取网络对所述输入向量进行特征提取,得到第二特征;根据所述第一特征及所述第二特征生成所述正向输入词汇的语义向量;基于所述语义向量,从所述预测输出网络中获取对应的词汇作为所述联想词汇。5.如权利要求1所述的文本挖掘方法,其特征在于,所述根据所述挖掘模板中的模板词汇、所述操作界面中的负向输入词汇、所述挖掘关系及所述目标词汇的词间距离,生成搜索语句包括:识别出所述模板词汇在所述挖掘模板中的词汇类型,并识别出所述模板词汇在所述挖
掘模板中的词汇关系;将所述词汇类型为负向类型的模板词汇及所述负向输入词汇生成负向搜索词汇...
【专利技术属性】
技术研发人员:刘伊诺,毛星越,李婷,陈贝妮,沈皓辰,
申请(专利权)人:深圳平安综合金融服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。