文本处理方法和装置、以及电子设备和可读存储介质制造方法及图纸

技术编号:22330155 阅读:41 留言:0更新日期:2019-10-19 12:17
本公开提供了一种文本处理方法,包括:获取待处理文本;确定待处理文本中包括的属于多个预定类型词库中每个预定类型词库的词汇量;以及根据词汇量,利用预测模型得到待处理文本的预测价值度。本公开还提供了一种文本处理装置、一种电子设备和一种计算机可读存储介质。

Text processing methods and devices, electronic devices and readable storage media

【技术实现步骤摘要】
文本处理方法和装置、以及电子设备和可读存储介质
本公开涉及计算机
,更具体地,涉及一种文本处理方法和装置、以及一种电子设备和计算机可读存储介质。
技术介绍
随着互联网的快速发展,通过线上渠道获取客户问题留言,并对此留言进行深入分析已经成为提升产品满意度和客户体验的重要方式。在实现本公开构思的过程中,专利技术人发现现有技术中至少存在如下问题:对于客户问题留言内容的快速、精准分析尚无法离开人工处理。但人工处理成本较高,效率难以得到有效提升。其中,导致上述问题的原因主要包括:客户问题留言的数量增长迅速,从而导致人工分析的工作量大幅增加。客户问题留言通常具有较强的主观性,获取的问题留言中包含了相当一部分价值较低的信息,这部分价值较低的信息严重影响了分析效率。客户留言时所使用的语言不规范,进一步阻碍了分析效率。
技术实现思路
有鉴于此,本公开提供了一种能够分析问题价值度,从而提高分析效率的文本处理方法和装置,以及一种电子设备和计算机可读存储介质。本公开的一个方面提供了一种文本处理方法,该方法包括:获取待处理文本;确定待处理文本的文本长度,以及待处理文本包括的属于多个预定类型词库中每个预定类型词库的词汇量;以及根据文本长度及词汇量,利用预测模型得到待处理文本的预测价值度。可选地,上述文本处理方法还包括获取预测模型,其中,获取预测模型包括循环执行以下第一循环操作,直至多个第二已处理文本的相关值大于等于预定相关值:获取与多个第一已处理文本一一对应的多个第一样本数据;根据多个第一样本数据及原始预测模型,调整原始预测模型以得到待优化预测模型;以及利用待优化预测模型处理与多个第二已处理文本对应的多个第二样本数据,得到针对多个第二已处理文本中每个第二已处理文本的预测价值度。其中,在针对多个第二已处理文本的相关值大于等于预定相关值的情况下,确定待优化预测模型为预测模型;其中,每个第二已处理文本的相关值包括每个第二已处理文本的预测价值度与每个第二已处理文本的实际价值度的相关值。可选地,上述调整原始预测模型以得到待优化预测模型包括:利用原始预测模型得到每个第一已处理文本的第一初始预测价值度;以及以原始预测模型作为初始预测模型,循环执行以下第二循环操作,直至第一初始预测价值度与第二初始预测价值度的差值小于等于预定差值:采用预定策略调整初始预测模型,得到调整后初始预测模型;利用调整后初始预测模型得到每个第一已处理文本的第二初始预测价值度;以及在第一初始预测价值度与第二初始预测价值度的差值大于预定差值的情况下,更改预定策略,并以调整后初始预测模型作为初始预测模型,以第二初始预测价值度作为第一初始预测价值度,返回重新调整初始预测模型。其中,在第一初始预测价值度与第二初始预测价值度的差值小于等于预定差值的情况下,确定初始预测模型为待优化预测模型。可选地,在获取多个第一样本数据之前,第一循环操作还包括:根据预定抽样比,从已处理文本库中获取多个第一已处理文本。在得到针对多个第二已处理文本中每个第二已处理文本的预测价值度之前,第一循环操作还包括:从已处理文本库中获取多个第二已处理文本,以及获取多个第二已处理文本中每个第二已处理文本的实际价值度。第一循环操作还包括:调整预定抽样比;和/或增加多个预定类型词库中至少一个预定类型词库的词汇量。可选地,上述获取每个第二已处理文本的实际价值度包括:获取每个第二已处理文本的内容详细度和功能定位准确度;以及根据内容详细度和功能定位准确度,确定每个第二已处理文本的实际价值度。可选地,上述相关值包括Pearson相关值。可选地,上述文本处理方法还包括:根据多个待处理文本的预测价值度,确定多个待处理文本的预测价值度的数值分布;根据数值分布,确定预测价值度阈值;以及展示预测价值度大于等于预测价值度阈值的待处理文本。本公开的另一个方面提供了一种文本处理装置,该装置包括:文本获取模块,用于获取待处理文本;词汇确定模块,用于确定待处理文本的文本长度,以及待处理文本包括的属于多个预定类型词库中每个预定类型词库的词汇量;价值度预测模块,用于根据文本长度及词汇量,利用预测模型得到待处理文本的预测价值度。可选地,上述文本处理装置还包括:输入单元,用于输入原始预测模型;以及预测模型获取模块,用于获取所述预测模型,具体用于执行以下第一循环操作,直至多个第二已处理文本的相关值大于等于预定相关值:获取与多个第一已处理文本一一对应的多个第一样本数据;根据多个第一样本数据及原始预测模型,调整原始预测模型以得到待优化预测模型;以及利用待优化预测模型处理与多个第二已处理文本对应的多个第二样本数据,得到针对多个第二已处理文本中每个第二已处理文本的预测价值度。其中,在针对多个第二已处理文本的相关值大于等于预定相关值的情况下,确定待优化预测模型为预测模型;其中,每个第二已处理文本的相关值包括每个第二已处理文本的预测价值度与每个第二已处理文本的实际价值度的相关值。可选地,在获取多个样本数据之前,上述第一循环操作还包括:根据预定抽样比,从已处理文本库中获取多个第一已处理文本。在得到针对多个第二已处理文本中每个第二已处理文本的预测价值度之前,第一循环操作还包括:从已处理文本库中获取多个第二已处理文本,以及获取多个第二已处理文本中每个第二已处理文本的实际价值度。上述输入单元还用于响应于用户操作:调整预定抽样比;和/或增加多个预定类型词库中至少一个预定类型词库的词汇量。本公开的另一方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个指令,其中,当所述一个或多个指令被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的文本处理方法。本公开的另一方面提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现如上所述的文本处理方法。本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。根据本公开的实施例,通过建立价值度预测模型,能够根据待处理文本属于预定类型词库的词汇量来确定文本的预测价值度。用户根据预测价值度即可选择性的确定是否对该待处理文本进行答复,而无需再人工分析待处理文本价值度。因此可以缩减人工分析成本,并因此提高答复效率。附图说明通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:图1示意性示出了根据本公开实施例的文本处理方法和装置、以及电子设备和计算机可读存储介质的应用场景;图2示意性示出了根据本公开实施例的文本处理方法的流程图;图3示意性示出了根据本公开另一实施例的文本处理方法的流程图;图4示意性示出了根据本公开实施例的获取预测模型的流程图;图5示意性示出了根据本公开实施例的调整原始预测模型得到待优化预测模型的流程图;图6示意性示出了根据本公开另一实施例的获取预测模型的流程图;图7示意性示出了根据本公开实施例的获取每个第二已处理文本的实际价值度的流程图;图8示意性示出了根据本公开实施例的文本处理装置的结构框图;图9示意性示出了根据本公开另一实施例的文本处理装置的结构框图;以及图10示意性示出了根据本公开实施例的适于执行文本处理方法的电子设备的框图。具体实施方式以下,将参照附图来描本文档来自技高网...

【技术保护点】
1.一种文本处理方法,包括:获取待处理文本;确定所述待处理文本的文本长度,以及所述待处理文本中包括的属于多个预定类型词库中每个预定类型词库的词汇量;以及根据所述文本长度及所述词汇量,利用预测模型得到所述待处理文本的预测价值度。

【技术特征摘要】
1.一种文本处理方法,包括:获取待处理文本;确定所述待处理文本的文本长度,以及所述待处理文本中包括的属于多个预定类型词库中每个预定类型词库的词汇量;以及根据所述文本长度及所述词汇量,利用预测模型得到所述待处理文本的预测价值度。2.根据权利要求1所述的方法,还包括获取所述预测模型;其中,所述获取所述预测模型包括循环执行以下第一循环操作,直至多个第二已处理文本的相关值大于等于预定相关值:获取与多个第一已处理文本一一对应的多个第一样本数据;根据所述多个第一样本数据及原始预测模型,调整所述原始预测模型以得到待优化预测模型;以及利用所述待优化预测模型处理与所述多个第二已处理文本对应的多个第二样本数据,得到针对所述多个第二已处理文本中每个第二已处理文本的预测价值度,其中,在针对所述多个第二已处理文本的相关值大于等于所述预定相关值的情况下,确定所述待优化预测模型为所述预测模型;其中,每个第二已处理文本的相关值包括每个第二已处理文本的预测价值度与所述每个第二已处理文本的实际价值度的相关值。3.根据权利要求2所述的方法,其中,调整所述原始预测模型以得到待优化预测模型包括:利用所述原始预测模型得到所述每个第一已处理文本的第一初始预测价值度;以及以所述原始预测模型作为初始预测模型,循环执行以下第二循环操作,直至所述第一初始预测价值度与第二初始预测价值度的差值小于等于预定差值:采用预定策略调整所述初始预测模型,得到调整后初始预测模型;利用所述调整后初始预测模型得到所述每个第一已处理文本的第二初始预测价值度;以及在所述第一初始预测价值度与所述第二初始预测价值度的差值大于预定差值的情况下,更改所述预定策略,并以所述调整后初始预测模型作为初始预测模型,以所述第二初始预测价值度作为所述第一初始预测价值度,返回重新调整所述初始预测模型,其中,在所述第一初始预测价值度与所述第二初始预测价值度的差值小于等于预定差值的情况下,确定所述初始预测模型为所述待优化预测模型。4.根据权利要求2所述的方法,其中:在获取所述多个第一样本数据之前,所述第一循环操作还包括:根据预定抽样比,从已处理文本库中获取所述多个第一已处理文本;在得到针对所述多个第二已处理文本中每个第二已处理文本的预测价值度之前,所述第一循环操作还包括:从已处理文本库中获取所述多个第二已处理文本,以及获取所述多个第二已处理文本中每个第二已处理文本的实际价值度,所述第一循环操作还包括:调整所述预定抽样比;和/或增加所述多个预定类型词库中至少一个预定类型词库的词汇量。5.根据权利要求4所述的方法,其中,获取所述每个第二已处理文本的实际价值度...

【专利技术属性】
技术研发人员:李嘉淳张培
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1