筛选方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:25479635 阅读:17 留言:0更新日期:2020-09-01 23:00
本申请提供了一种筛选方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:获取在线服务过程中的工单数据,并对工单数据进行分词处理;对工单数据中的每个备选关键词进行目标处理,得到至少一个新工单数据;利用目标分类模型对工单数据和至少一个新工单数据进行分类处理,得到分类处理结果;分类处理结果用于表征工单数据和新工单数据是否为安全类工单;基于分类处理结果在备选关键词中确定目标关键词;目标关键词用于表征工单数据不是安全类工单。本申请实施例能够通过机器学习的方式对工单数据进行筛选,以确定工单数据是否为安全类工单,从而缓解在通过现有技术筛选紧急安全类工单时,筛选效率较低,且准确性差的技术问题。

【技术实现步骤摘要】
筛选方法、装置、电子设备及计算机可读存储介质
本申请涉及数据处理的
,具体而言,涉及一种筛选方法、装置、电子设备及计算机可读存储介质。
技术介绍
在网约车平台的客户服务系统中存在一种在线服务方式,在线服务方式主要以文本信息的方式在线解决用户的问题,例如,用户可以通过在线服务的方式反映各类服务问题,客服人员针对用户反映的问题在线进行解答和处理。为了保证网约车的服务质量,网约车平台通常基于用户向客服反馈的安全类问题,从大量的工单中筛查出异常工单。而当前网约车平台异常工单的筛查方式主要是人工方式。随着服务工单数量的持续增长,这种人工筛查方式的效率和准确性均较低,无法满足实际需求。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种筛选方法、装置、电子设备及计算机可读存储介质,能够通过机器学习的方式对工单数据进行筛选,以确定待处理的工单数据是否为安全类工单,从而缓解在通过现有技术筛选紧急安全类工单时,筛选效率较低,且准确性差的技术问题。根据本申请的一个方面,提供一种电子设备,可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可读指令。当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行所述机器可读指令,以执行一个或多个以下操作:获取在线服务过程中的工单数据,并对所述工单数据进行分词处理;每个所述工单数据包括会话服务提供方与目标对象之间的会话数据,所述目标对象包括订单服务提供方和/或订单服务请求方;对所述工单数据中的每个备选关键词进行目标处理,得到至少一个新工单数据;所述目标处理为删除或将备选关键词替换为无用词汇,所述备选关键词为对工单数据进行分词处理之后得到的词汇;利用目标分类模型对所述工单数据和所述至少一个新工单数据进行分类处理,得到分类处理结果;所述分类处理结果用于表征所述工单数据和所述新工单数据是否为安全类工单;基于所述分类处理结果在所述备选关键词中确定目标关键词;所述目标关键词用于表征所述工单数据不是安全类工单。在本申请较佳的实施例中,利用目标分类模型对所述工单数据和所述至少一个新工单数据进行分类处理包括:若所述备选关键词的数量超过预设数量,则对所述至少一个新工单数据进行处理,得到至少一个待批处理数据,其中,每个待批处理数据中包含多个新工单数据和一个所述工单数据;利用目标分类模型对每个所述待批处理数据中的新工单数据和所述工单数据进行分类处理,得到所述分类处理结果。在本申请较佳的实施例中,对所述至少一个新工单数据进行处理,得到至少一个待批处理数据包括:获取候选关键词集;其中,所述候选关键词集中包含多个用于表征工单数据不是安全类工单的关键词,且所述候选关键词集中每个关键词包含权重值,所述权重值用于表征关键词的重要程度;基于所述候选关键词集对所述至少一个新工单数据进行处理,得到所述至少一个待批处理数据。在本申请较佳的实施例中,基于所述候选关键词集对所述至少一个新工单数据进行处理,得到至少一个待批处理数据包括:在所述备选关键词中确定第一目标备选关键词,其中,所述第一目标备选关键词为包含在所述候选关键词集中的关键词;按照所述第一目标备选关键词的权重值对所述第一目标备选关键词进行排序,得到第一排序结果;基于所述第一排序结果和第二排序结果确定目标排序结果,其中,所述第一排序结果位于所述第二排序结果之前,且所述第二排序结果为对第二目标备选关键词进行排序之后得到的结果,所述第二目标备选关键词为所述备选关键词中除所述第一目标备选关键词之外的其他关键词;按照所述目标排序结果中的排序顺序,对所述目标排序结果中每个关键词所对应的新工单数据进行分类处理,得到所述至少一个待批处理数据。在本申请较佳的实施例中,通过以下方式确定所述候选关键词集,具体包括:获取历史工单数据,其中,所述历史工单数据为会话服务提供方根据与目标对象之间的会话数据,所述目标对象包括订单服务提供方和服务请求方;基于所述历史工单数据确定候选关键词集。在本申请较佳的实施例中,基于所述历史工单数据确定候选关键词集包括:对每个所述历史工单数据进行分词处理,得到分词结果,其中,所述分词结果中包含多个分词;在所述分词结果中确定目标分词,其中,所述目标分词为各个所述历史工单数据的分词结果中出现频率高于预设阈值的分词;将所述目标分词转换成one-hot形式的目标数据,其中,所述目标数据中包括多个向量组,每个向量组中的向量值表征所述目标分词是否在各个历史工单数据中出现;利用所述目标数据确定所述候选关键词集。在本申请较佳的实施例中,利用所述目标数据确定所述候选关键词集包括:基于所述目标数据确定训练样本和测试样本;利用所述训练样本对初始分类预测模型进行训练,得到目标分类预测模型;利用所述目标分类预测模型对所述测试样本进行处理,得到各个目标分词的权重值;基于所述各个目标分词的权重值确定所述候选关键词集。在本申请较佳的实施例中,对每个所述历史工单数据进行分词处理,得到分词结果包括:确定预设分词模板;通过分词器按照所述预设分词模板对每个所述历史工单数据进行分词处理,得到分词结果。在本申请较佳的实施例中,所述方法还包括:根据每个所述历史工单数据的分词结果和每个所述历史工单数据的标签信息构建训练样本,其中,所述标签信息用于表征历史工单数据是否为安全类工单;利用所述训练样本训练所述目标分类模型的初始模型,得到所述目标分类模型。在本申请较佳的实施例中,利用目标分类模型对所述工单数据和所述至少一个新工单数据进行分类处理还包括:若所述备选关键词的数量未超过所述预设数量,则将所述至少一个新工单数据和所述工单数据作为一个待批处理数据;利用目标分类模型对所述待批处理数据中的新工单数据和所述工单数据进行分类处理,得到所述分类处理结果。在本申请较佳的实施例中,对所述工单数据中的每个备选关键词进行目标处理包括:将所述工单数据中的备选关键词Ai替换为预设数据,得到与所述备选关键词Ai相对应的新工单数据,其中,i依次取1至I,I所述备选关键词的数量,所述预设数据为无用词汇。在本申请较佳的实施例中,对所述工单数据中的每个备选关键词进行目标处理包括:将所述工单数据中的备选关键词Ai删除,得到与所述备选关键词Ai相对应的新工单数据,其中,i依次取1至I,I所述备选关键词的数量。在本申请较佳的实施例中,所述分类处理结果包括多个子处理结果,所述多个子处理结果包括第一子处理结果和第二子处理结果,其中,工单数据的分类处理结果为所述第一子处理结果,每个新工单数据对应一个第二子处理结果。在本申请较佳的实施例中,基于所述分类处理结果在所述备选关键词中确定目标关键词包括:计算每个所述第二子处理结果与所述第一子处理结果之间的变化值,得到多个变化值;基于所述多个变化值确定所述目标关键词。在本申请较佳的实施例中,基于所述多个变化值确定所述目标关键词包括:在所述多个变化值中确定第一目标变化值,其中,所述第一目标变化值为所述多个变化值中前N个最大的变化值,N为大于零的正本文档来自技高网...

【技术保护点】
1.一种筛选方法,其特征在于,包括:/n获取在线服务过程中的工单数据,并对所述工单数据进行分词处理;每个所述工单数据包括会话服务提供方与目标对象之间的会话数据,所述目标对象包括订单服务提供方和/或订单服务请求方;/n对所述工单数据中的每个备选关键词进行目标处理,得到至少一个新工单数据;所述目标处理为删除或将备选关键词替换为无用词汇,所述备选关键词为对工单数据进行分词处理之后得到的词汇;/n利用目标分类模型对所述工单数据和所述至少一个新工单数据进行分类处理,得到分类处理结果;所述分类处理结果用于表征所述工单数据和所述新工单数据是否为安全类工单;/n基于所述分类处理结果在所述备选关键词中确定目标关键词;所述目标关键词用于表征所述工单数据不是安全类工单。/n

【技术特征摘要】
1.一种筛选方法,其特征在于,包括:
获取在线服务过程中的工单数据,并对所述工单数据进行分词处理;每个所述工单数据包括会话服务提供方与目标对象之间的会话数据,所述目标对象包括订单服务提供方和/或订单服务请求方;
对所述工单数据中的每个备选关键词进行目标处理,得到至少一个新工单数据;所述目标处理为删除或将备选关键词替换为无用词汇,所述备选关键词为对工单数据进行分词处理之后得到的词汇;
利用目标分类模型对所述工单数据和所述至少一个新工单数据进行分类处理,得到分类处理结果;所述分类处理结果用于表征所述工单数据和所述新工单数据是否为安全类工单;
基于所述分类处理结果在所述备选关键词中确定目标关键词;所述目标关键词用于表征所述工单数据不是安全类工单。


2.根据权利要求1所述的方法,其特征在于,利用目标分类模型对所述工单数据和所述至少一个新工单数据进行分类处理包括:
若所述备选关键词的数量超过预设数量,则对所述至少一个新工单数据进行处理,得到至少一个待批处理数据,其中,每个待批处理数据中包含多个新工单数据和一个所述工单数据;
利用目标分类模型对每个所述待批处理数据中的新工单数据和所述工单数据进行分类处理,得到所述分类处理结果。


3.根据权利要求2所述的方法,其特征在于,对所述至少一个新工单数据进行处理,得到至少一个待批处理数据包括:
获取候选关键词集;其中,所述候选关键词集中包含多个用于表征工单数据不是安全类工单的关键词,且所述候选关键词集中每个关键词包含权重值,所述权重值用于表征关键词的重要程度;
基于所述候选关键词集对所述至少一个新工单数据进行处理,得到所述至少一个待批处理数据。


4.根据权利要求3所述的方法,其特征在于,基于所述候选关键词集对所述至少一个新工单数据进行处理,得到至少一个待批处理数据包括:
在所述备选关键词中确定第一目标备选关键词,其中,所述第一目标备选关键词为包含在所述候选关键词集中的关键词;
按照所述第一目标备选关键词的权重值对所述第一目标备选关键词进行排序,得到第一排序结果;
基于所述第一排序结果和第二排序结果确定目标排序结果,其中,所述第一排序结果位于所述第二排序结果之前,且所述第二排序结果为对第二目标备选关键词进行排序之后得到的结果,所述第二目标备选关键词为所述备选关键词中除所述第一目标备选关键词之外的其他关键词;
按照所述目标排序结果中的排序顺序,对所述目标排序结果中每个关键词所对应的新工单数据进行分类处理,得到所述至少一个待批处理数据。


5.根据权利要求3所述的方法,其特征在于,通过以下方式确定所述候选关键词集,具体包括:
获取历史工单数据,其中,所述历史工单数据为会话服务提供方根据与目标对象之间的会话数据,所述目标对象包括订单服务提供方和服务请求方;
基于所述历史工单数据确定候选关键词集。


6.根据权利要求5所述的方法,其特征在于,基于所述历史工单数据确定候选关键词集包括:
对每个所述历史工单数据进行分词处理,得到分词结果,其中,所述分词结果中包含多个分词;
在所述分词结果中确定目标分词,其中,所述目标分词为各个所述历史工单数据的分词结果中出现频率高于预设阈值的分词;
将所述目标分词转换成one-hot形式的目标数据,其中,所述目标数据中包括多个向量组,每个向量组中的向量值表征所述目标分词是否在各个历史工单数据中出现;
利用所述目标数据确定所述候选关键词集。


7.根据权利要求6所述的方法,其特征在于,利用所述目标数据确定所述候选关键词集包括:
基于所述目标数据确定训练样本和测试样本;
利用所述训练样本对初始分类预测模型进行训练,得到目标分类预测模型;
利用所述目标分类预测模型对所述测试样本进行处理,得到各个目标分词的权重值;
基于所述各个目标分词的权重值确定所述候选关键词集。


8.根据权利要求6所述的方法,其特征在于,对每个所述历史工单数据进行分词处理,得到分词结果包括:
确定预设分词模板;
通过分词器按照所述预设分词模板对每个所述历史工单数据进行分词处理,得到分词结果。


9.根据权利要求6所述的方法,其特征在于,所述方法还包括:
根据每个所述历史工单数据的分词结果和每个所述历史工单数据的标签信息构建训练样本,其中,所述标签信息用于表征历史工单数据是否为安全类工单;
利用所述训练样本训练所述目标分类模型的初始模型,得到所述目标分类模型。


10.根据权利要求2所述的方法,其特征在于,利用目标分类模型对所述工单数据和所述至少一个新工单数据进行分类处理还包括:
若所述备选关键词的数量未超过所述预设数量,则将所述至少一个新工单数据和所述工单数据作为一个待批处理数据;
利用目标分类模型对所述待批处理数据中的新工单数据和所述工单数据进行分类处理,得到所述分类处理结果。


11.根据权利要求1所述的方法,其特征在于,对所述工单数据中的每个备选关键词进行目标处理包括:
将所述工单数据中的备选关键词Ai替换为预设数据,得到与所述备选关键词Ai相对应的新工单数据,其中,i依次取1至I,I所述备选关键词的数量,所述预设数据为无用词汇。


12.根据权利要求1所述的方法,其特征在于,对所述工单数据中的每个备选关键词进行目标处理包括:
将所述工单数据中的备选关键词Ai删除,得到与所述备选关键词Ai相对应的新工单数据,其中,i依次取1至I,I所述备选关键词的数量。


13.根据权利要求1所述的方法,其特征在于,所述分类处理结果包括多个子处理结果,所述多个子处理结果包括第一子处理结果和第二子处理结果,其中,工单数据的分类处理结果为所述第一子处理结果,每个新工单数据对应一个第二子处理结果。


14.根据权利要求13所述的方法,其特征在于,基于所述分类处理结果在所述备选关键词中确定目标关键词包括:
计算每个所述第二子处理结果与所述第一子处理结果之间的变化值,得到多个变化值;
基于所述多个变化值确定所述目标关键词。


15.根据权利要求14所述的方法,其特征在于,基于所述多个变化值确定所述目标关键词包括:
在所述多个变化值中确定第一目标变化值,其中,所述第一目标变化值为所述多个变化值中前N个最大的变化值,N为大于零的正整数;
确定所述第一目标变化值所对应的新工单数据;
根据所述对应的新工单数据中替换或者删除之后的第三目标备选关键词确定所述目标关键词。


16.根据权利要求15所述的方法,其特征在于,根据所述对应的新工单数据中替换或者删除之后的第三目标备选关键词确定所述目标关键词包括:
若所述第三目标备选关键词中包含M个未记录在候选关键词集中的关键词,且第四目标备选关键词中包含记录在候选关键词集中的关键词,则在第四目标备选关键词中确定前M个权重值最大的关键词;所述候选关键词集中包含多个用于表征工单数据是否为安全类工单的关键词,且所述候选关键词集中每个关键词包含权重值,所述权重值用于表征关键词的重要程度,所述第四目标备选关键词为所述多个变化值中除所述第三目标备选关键词之外的关键词;
将确定出的前M个权重值最大的关键词和所述第三目标备选关键词中包含在所述候选关键词集中的关键词确定为所述目标关键词。


17.根据权利要求16所述的方法,其特征在于,将所述对应的新工单数据中替换或者删除之后的备选关键词作为所述目标关键词还包括:
若所述第三目标备选关键词中包含M个未记录在候选关键词集中的关键词,且第四目标备选关键词中不包含记录在候选关键词集中的关键词,则将所述对应的新工单数据中替换或者删除之后的第三目标备选关键词确定为所述目标关键词。


18.一种筛选装置,其特征在于,包括:
获取单元,...

【专利技术属性】
技术研发人员:冯浩吴康康徐江王鹏李奘
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1