【技术实现步骤摘要】
数据处理方法、装置、电子设备及计算机可读存储介质
[0001]本申请涉及人工智能、自然语言处理、云
,具体而言,本申请涉及一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]随着科学技术的发展,在线学习(online learning)已经逐渐成为一个热门的深度学习研究领域。
[0003]相关技术中,通常直接基于训练好的模型,对线上数据进行识别,以得到线上数据的分类结果,虽然该方式能够在一定程度上实现对线上数据的分类处理,但是目前的识别效果仍不够理想,不能够满足实用需求。
技术实现思路
[0004]本申请实施例提供了一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够更好地对待检测文本进行识别,避免对待检测文本造成误判,更好地满足了实用需求。
[0005]根据本申请实施例的一个方面,提供了一种数据处理方法,该方法包括:
[0006]获取待检测文本;
[0007]基于预设文本库对待检测文本进行检测,其中,预设文 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取待检测文本;基于预设文本库对所述待检测文本进行检测,所述预设文本库包括标记为属于预定误判类型的文本对应的文本数据;确定所述待检测文本属于预定误判类型的文本,将所述预定误判类型确定为所述待检测文本的分类结果;确定所述待检测文本不属于预定误判类型的文本,基于深度学习模型,确定所述待检测文本的分类结果;其中,所述属于预定误判类型的文本,是通过所述深度学习模型确定的文本分类结果存在误判可能的文本。2.根据权利要求1所述的方法,其特征在于,所述文本数据包括目标关键词库或目标文本库中的至少一项,所述基于预设文本库对所述待检测文本进行检测,包括:基于所述文本数据,对所述待检测文本进行检测;确定所述待检测文本满足以下至少一项:所述待检测文本中包括所述目标关键词库中的任一目标关键词;所述待检测文本与所述目标文本库中的任一目标文本相匹配;将所述待检测文本确定为属于预定误判类型的文本。3.根据权利要求2所述的方法,其特征在于,所述目标文本库包括至少一个目标文本的文本向量,确定所述待检测文本与所述目标文本库中的任一目标文本相匹配,包括:根据所述待检测文本,生成所述待检测文本对应的文本向量;基于所述目标文本库,对所述待检测文本对应的文本向量进行文本向量的相似度匹配;确定所述待检测文本对应的文本向量与所述目标文本库中的任一目标文本对应的文本向量的相似度大于或等于预定相似度阈值,则确定所述待检测文本与所述目标文本库中的任一目标文本相匹配。4.根据权利要求1所述的方法,其特征在于,若确定所述待检测文本属于预定误判类型的文本,所述方法还包括:将所述待检测文本以及所述待检测文本的分类结果存储至语料库,得到更新后的语料库;基于所述更新后的语料库,更新训练所述深度学习模型,得到更新后的深度学习模型。5.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:若接收到针对所述待检测文本的分类结果属于误判的反馈信息,则对所述待检测文本进行解析,确定所述待检测文本中的关键词;将所述待检测文本中的关键词存储至所述目标关键词库中,更新所述目标关键词库;将所述待检测文本存储至所述目标文本库,更新所述目标文本库。6.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:获取所述待检测文本的文本场景信息;基于所述待检测文本的分类结果以及所述待检测文本的文本场景信息,得到融合结果,以根据所述融合结果对所述待检测文本执行相对应的处理。
7.根据权利要求1所述的方法,其特征在于,所述深度学习模型是通过以下方式训练得到的;获取训练样本,所述训练样本包括至少一个样本数据以及各样本数据的真实分类结果;基于所述训练样本,对第一深度学习模型进行迭代训练,直至满足预设的训练结束条件,得到所述深度学习模型。8.根据权利要求7所述的方法,其特征在于,所述基于所述训练样本,对第一深度学习模型进...
【专利技术属性】
技术研发人员:黎志宙,刘卓,何方,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。