【技术实现步骤摘要】
本申请涉及文本处理领域,尤其涉及一种文本数据的信息挖掘方法、装置、电子设备及存储介质。
技术介绍
1、文本数据的信息挖掘是指使用计算机系统阅读和理解人类编写的文本以便获得业务洞察的流程。
2、现有的文本数据的信息挖掘方式基于文本摘要的方法实现,其中包括抽取式摘要和生成式摘要。抽取式摘要通过计算文本的关键词及其之间的关系,从中抽取出重要的句子作为摘要。由于只是抽取句子中的关键词,而忽略了上下文和语义信息,因此可能会出现信息不准确或缺失的情况。生成式摘要则通过对文档内容进行编码和解码,生成一段新的摘要文本,但是生成式摘要也容易出现重复信息和信息不准确的问题,需要对生成式摘要的深度学习模型进行细致的调参和优化才能达到较好的效果。
3、由此可见,目前亟需一种新型的文本数据的信息挖掘方式。
技术实现思路
1、本申请提供了一种文本数据的信息挖掘方法、装置、电子设备及存储介质,以解决目前的文本数据的信息挖掘方式容易出现信息不准确或缺失的问题。
2、第一方面,本申请提供
...【技术保护点】
1.一种文本数据的信息挖掘方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述文本挖掘结果Si从所述目标文本数据中获取第i+1层级的待挖掘文本数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述从所述目标文本数据中获取所述文本挖掘结果Si对应的源文本数据,包括:
4.根据权利要求1所述的方法,其特征在于,所述对所述目标文本数据进行深度信息挖掘,得到第i层级的文本挖掘结果Si,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述文本挖掘结果Si对所述第i+1层级的待挖掘
...【技术特征摘要】
1.一种文本数据的信息挖掘方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述文本挖掘结果si从所述目标文本数据中获取第i+1层级的待挖掘文本数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述从所述目标文本数据中获取所述文本挖掘结果si对应的源文本数据,包括:
4.根据权利要求1所述的方法,其特征在于,所述对所述目标文本数据进行深度信息挖掘,得到第i层级的文本挖掘结果si,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述文本挖掘结果si对所述第i+1层级的待挖掘文本数据进行信息挖掘,得到第i+1层级的文本挖掘结果si+1,包括:
6.根据权利要求1所述的方法,其特征在于,在所述得到第...
【专利技术属性】
技术研发人员:黄达一,熊龙飞,李明威,
申请(专利权)人:珠海金山办公软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。