智能文本数据处理方法和装置、计算设备、存储介质制造方法及图纸

技术编号：22531922 阅读：16 留言：0更新日期：2019-11-13 09:12

本发明专利技术实施例公开了一种智能文本数据处理方法和装置、计算设备、存储介质，该智能文本数据处理方法包括：显示语料文本导入界面；当检测到所述语料文本导入界面触发的语料导入指令时，获取导入的语料文本数据；在语料文本分类界面上展示对所述语料文本数据进行分类得到的语料分类结果，所述语料分类结果包括语料聚类集合和所述语料聚类集合对应的词条标识。本发明专利技术实施例能实现文本数据的自动处理。

Intelligent text data processing methods and devices, computing equipment, storage media

The embodiment of the invention discloses an intelligent text data processing method and device, a computing device and a storage medium. The intelligent text data processing method includes: displaying the corpus text import interface; acquiring the imported corpus text data when the corpus text import instruction triggered by the corpus text import interface is detected; displaying the corpus text on the corpus text classification interface The corpus classification results obtained by data classification include the corpus clustering set and the corresponding term identification of the corpus clustering set. The embodiment of the invention can realize the automatic processing of text data.

全部详细技术资料下载

【技术实现步骤摘要】
智能文本数据处理方法和装置、计算设备、存储介质
本专利技术涉及计算机
，具体涉及一种智能文本数据处理方法和装置、计算设备、存储介质。
技术介绍
随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。传统的客服机器人上线之前一般需要运营人员对大量的语料进行知识梳理，并在经过不断的修改优化后，将知识录入系统，知识录入完成后，运营人员还要对每一个知识点进行语料标注。上述技术方案存在以下不足之处：一、知识梳理和录入需要耗费大量的人力。二、由于标注量大，耗时长，客服机器人从立项到上线平均需要一个月(配备两个运营人员)。三、无法将海量的工单数据利用起来，所利用的语料有限。四、不同的运营人员存在认知差异，容易造成所梳理、录入、标注的知识不统一。综上，上述传统的技术方案无法实现文本数据的自动处理，因此需要耗费大量的人力和时间。故，有必要提出一种新的技术方案，以解决上述技术问题。
技术实现思路
本专利技术的目的在于提供一种智能文本数据处理方法和装置、计算设备、存储介质，其能实现文本数据的自动处理。为解决上述问题，本专利技术实施例的技术方案如下：第一方面，提供一种智能文本数据处理方法，包括：显示语料文本导入界面；当检测到所述语料文本导入界面触发的语料导入指令时，获取导入的语料文本数据；在语料文本分类界面上展示对所述语料文本数据进行分类得到的语料分类结果，所述语料分...

【技术保护点】
1.一种智能文本数据处理方法，其特征在于，包括：显示语料文本导入界面；当检测到所述语料文本导入界面触发的语料导入指令时，获取导入的语料文本数据；在语料文本分类界面上展示对所述语料文本数据进行分类得到的语料分类结果，所述语料分类结果包括语料聚类集合和所述语料聚类集合对应的词条标识。

【技术特征摘要】
1.一种智能文本数据处理方法，其特征在于，包括：显示语料文本导入界面；当检测到所述语料文本导入界面触发的语料导入指令时，获取导入的语料文本数据；在语料文本分类界面上展示对所述语料文本数据进行分类得到的语料分类结果，所述语料分类结果包括语料聚类集合和所述语料聚类集合对应的词条标识。2.根据权利要求1所述的智能文本数据处理方法，其特征在于，在语料文本分类界面上展示对所述语料文本数据进行分类得到的语料分类结果之后，还包括：当检测到所述语料文本分类界面触发的编辑指令时，展示针对所述语料分类结果进行编辑的编辑结果。3.根据权利要求2所述的智能文本数据处理方法，其特征在于，所述语料文本分类界面包括第一输入控件，所述第一输入控件为编辑所述词条标识的名称的控件；当检测到所述语料文本分类界面触发的编辑指令时，展示针对所述语料分类结果进行编辑的编辑结果，包括：当检测到所述第一输入控件触发的名称编辑指令时，展示所输入的所述词条标识的名称。4.根据权利要求2所述的智能文本数据处理方法，其特征在于，所述语料文本分类界面包括第二输入控件，所述第二输入控件为编辑所述语料聚类集合的答复信息的控件；当检测到所述语料文本分类界面触发的编辑指令时，展示针对所述语料分类结果进行编辑的编辑结果，包括：当检测到所述第二输入控件触发的答复信息编辑指令时，展示所输入的所述语料聚类集合的答复信息。5.根据权利要求4所述的智能文本数据处理方法，其特征在于，所述语料文本分类界面包括第三输入控件，所述第三输入控件为编辑所述答复信息的统一资源定位符的控件；当检测到所述语料文本分类界面触发的编辑指令时，展示针对所述语料分类结果进行编辑的编辑结果，包括：当检测到所述第三输入控件触发的统一资源定位符编辑指令时，展示所输入的所述统一资源定位符。6.根据权利要求2所述的智能文本数据处理方法，其特征在于，所述语料文本分类界面包括目录转移控件，所述目录转移控件为转移所述语料聚类集合中的问题所对应的目录的控件；当检测到所述语料文本分类界面触发的编辑指令时，展示针对所述语料分类结果进行编辑的编辑结果，包括：当检测到所述目录转移控件触发的目录转移指令时，展示所述语料聚类集合中的问题所转移的目标目录。7.根据权利要求2所述的智能文本数据处理方法，其特征在于，所述语料文本分类界面包括删除控件，所述删除控件为删除所述语料聚类集合中的问题的控件；当检测到所述语料文本分类界面触发的编辑指令时，展示针对所述语料分类结果进行编辑的编辑结果，包括：当检...

【专利技术属性】
技术研发人员：童丽霞，马鸣，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人