【技术实现步骤摘要】
客户特征提取方法、装置、电子设备及存储介质
[0001]本申请涉及自然语言处理
,具体涉及一种客户特征提取方法、装置、电子设备及存储介质。
技术介绍
[0002]自然语言处理(NLP,Natural Language Processing)技术是一门融合了语言学、计算机科学和机器学习的前沿技术。利用NLP技术提取有特定特征的信息,尤其是在销售领域,能够提取不同客户的特征信息,使得销售人员更快速准确的根据客户的特征信息,为客户提供服务。然而,在实践中发现,现有的客户特征提取方法仍然存在准确性较低的问题。
技术实现思路
[0003]本申请实施例公开了一种客户特征提取方法、装置、电子设备及存储介质,极大提高提取客户特征的准确性。
[0004]本申请实施例公开一种客户特征提取方法,其特征在于,所述方法包括:通过训练完成的双向语言模型对所述目标服务记录文本进行语义识别,得到第一语义向量;通过所述双向语言模型对多个客户特征中每个客户特征分别对应的种子句子进行语义识别,得到与各个种子句子的第二语义向量;根据所述第一语义向量及所述各个种子句子的第二语义向量,确定所述目标服务记录文本与所述各个种子句子的相似度;根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征。
[0005]在一个实施例中,在所述将目标服务记录文本输入到训练完成的双向语言模型之前,所述方法还包括:从待输入的目标服务记录文本中选取出第一短文本;以及,所述通过训练完成 ...
【技术保护点】
【技术特征摘要】
1.一种客户特征提取方法,其特征在于,所述方法包括:通过训练完成的双向语言模型对目标服务记录文本进行语义识别,得到第一语义向量;通过所述双向语言模型对多个客户特征中每个客户特征分别对应的种子句子进行语义识别,得到与各个种子句子的第二语义向量;根据所述第一语义向量及所述各个种子句子的第二语义向量,确定所述目标服务记录文本与所述各个种子句子的相似度;根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征。2.根据权利要求1所述方法,其特征在于,在所述通过训练完成的双向语言模型对目标服务记录文本进行语义识别,得到第一语义向量之前,所述方法还包括:从待输入的目标服务记录文本中选取出第一短文本;以及,所述通过训练完成的双向语言模型对所述目标服务记录文本进行语义识别,得到第一语义向量,包括:将所述第一短文本输入至训练完成的双向语言模型;通过所述双向语言模型对所述第一短文本进行语义识别,得到第一语义向量。3.根据权利要求2所述方法,其特征在于,从待输入的目标服务记录文本中选取出第一短文本,包括:将待输入的目标服务记录文本与多个客户特征分别对应的关键词进行匹配,从所述目标服务记录文本中筛选出与所述关键词匹配的第一短文本。4.根据权利要求3所述方法,其特征在于,所述将待输入的目标服务记录文本与多个客户特征分别对应的关键词进行匹配,包括:对待输入的目标服务记录文本进行分句处理和文本清洗处理,得到多个第二短文本;将所述多个第二短文本与多个客户特征分别对应的关键词进行匹配。5.根据权利要求1所述方法,其特征在于,所述多个客户特征包括:第一客户特征;以及,所述根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征,包括:当所述目标服务记录文本与所述第一客户特征对应的种子句子的相似度的最大值大于设置的第一阈值时,将所述第一客户特征确定为与所述目标服务记录文本对应的目标客户特征。6.根据权利要求1所述方法,其特征在于,所述多个客户特征包括:第二客户特征;以及,所述根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征,包括:当所述第二客户特征对应的多个种子句子中,与所述目标服务记录文本的相似度大于第二阈值的种子句子的数量,大于第三阈值时,将所述第二客户特征确定为与所述目标服务记录文本对应的目标客户特征。7.根据权利要求1
‑
6任一项所述的方法,其特征在于,所述双向语言模式是利用与所述多个客户特征分别对应的样本短文本进行训练得到的;与每个客户特征对应的样本短文本是从样本记录文本中筛选出的,并且满足与所述客户特征相对应的专家规则;与每个客户
特征对应的专家规则,是基于与每个客户特征对应的种子句子制定的。8.一种模型训练方法,其特征在于,所述方法包括:从样本服务记录文本中选取出与多个客户特征中每个客户特征分别对应的种子句子;根据与多个客户特征对应的专家规则,从所述样本服务记录文本中筛选出满足所述专家规则的样本短文本,以得到与所述多个客户特征分别对应的样本短文本;每个客户特征对应的专家规则是基于所述客户特征对应的种子句子制定的;每次向待训练的双向语言模型输入两个样本短文本,并通过所述待训练的双向语言模型对输入的所述两个样本短文本进行语义识别...
【专利技术属性】
技术研发人员:梁成扬,
申请(专利权)人:广州小鹏汽车科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。