一种基于权值词向量的文本匹配方法、系统、介质及设备技术方案

技术编号:37556663 阅读:9 留言:0更新日期:2023-05-15 07:40
本申请实施例公开了一种基于权值词向量的文本匹配方法、系统、介质及设备,其中,方法包括:接收客户端发送的待匹配文本,生成所述待匹配文本对应的目标分词向量列表;将所述目标分词向量列表转换为目标句向量列表;将所述目标句向量列表输入至训练完成的文本分类模型中,得到所述待匹配文本对应的分类结果;根据所述分类结果,得到所述待匹配文本对应的应答信息,并将所述应答信息发送至所述客户端。通过采用本申请实施例,可以通过计算机在线解答客户问题,进而减小了客服服务的成本。进而减小了客服服务的成本。进而减小了客服服务的成本。

【技术实现步骤摘要】
一种基于权值词向量的文本匹配方法、系统、介质及设备


[0001]本申请涉及信息处理领域,具体涉及一种基于权值词向量的文本匹配方法、系统、介质及设备。

技术介绍

[0002]传统客服多是依托人工提供相应的咨询和业务服务,各行业企业都存在对客服人员的需求。随着人工智能、5G等技术的普及,越来越多的企业选择通过互联网线上客服的方式服务客户,业务渠道也从单一的电话咨询转变为由QQ、微信、微博、网页等多渠道转变。但是当客户的访问量过大时,企业需要大量的客服人员在线上为客户解答相关问题,并且还需要客服人员拥有一定的专业水平,导致人工成本较大。

技术实现思路

[0003]本申请提供一种基于权值词向量的文本匹配方法、系统、介质及设备。可以通过计算机在线解答客户问题,进而减小了客服服务的成本。
[0004]在本申请的第一方面提供了一种基于权值词向量的文本匹配方法,包括:接收客户端发送的待匹配文本,生成所述待匹配文本对应的目标分词向量列表;将所述目标分词向量列表转换为目标句向量列表;将所述目标句向量列表输入至训练完成的文本分类模型中,得到所述待匹配文本对应的分类结果;根据所述分类结果以及所述分类结果对应的结构化数据对企业信息进行匹配,得到所述待匹配文本对应的应答信息,并将所述应答信息发送至所述客户端。
[0005]通过采用上述技术方案,可以将客户端发送的待匹配文本转换为目标句向量,并代入根据企业信息训练完成的文本分类模型中,匹配得到对应的分类结果,并根据分类结果匹配得到对应于待匹配文本的应答信息,只需通过计算机便可在线解答客户的问题,进而减小了客服服务的成本。
[0006]可选的,所述生成所述待匹配文本对应的目标分词向量列表,包括:根据分词算法,将所述待匹配文本转换为分词列表,所述分词列表包括所述待匹配文本中的各个分词;根据skipgram算法,将所述分词列表中的各个分词转换为分词向量,得到目标分词向量列表。
[0007]通过采用上述技术方案,根据分词算法将待匹配文本转换为分词列表,再通过skipgram算法将分词列表中的各个分词转换为分词向量进行表达,skipgram算法只需要确定二维数组,可以有效减小计算机的计算量。
[0008]可选的,所述目标分词向量列表中包括至少一个分词向量,所述将所述目标分词向量列表转换为目标句向量列表,包括:获取所述目标分词向量列表中各所述分词向量对应的权重;
将所有所述分词向量乘以对应的权重,再除以所述目标分词向量列表中分词向量的数量之商作为句向量;将所有句向量组合得到所述目标句向量列表。
[0009]通过采用上述技术方案,将目标分词向量列表中转换为目标句向量列表,可以更好的表征待匹配文本的语义,更适用于处理大规模的文本相似度比较。
[0010]可选的,所述将所述目标句向量列表输入至训练完成的文本分类模型中,得到所述待匹配文本对应的分类结果,包括:将所述目标句向量列表输入所述训练完成的文本分类模型中,根据所述目标句向量列表中的每个句向量的类别匹配所述目标文本分类模型中对应的句向量,并计算对应的匹配概率,所述目标句向量中所有句向量的匹配概率之和为1;将所述匹配概率大于概率阈值的句向量确定为所述待匹配文本对应的分类结果。
[0011]通过采用上述技术方案,将目标句向量列表输入至文本分类模型中进行匹配,将匹配结果中大于概率阈值的句向量确定为分类结果,可以提高分类结果的准确性。
[0012]可选的,所述在接收客户端发送的待匹配文本,根据所述待匹配文本,生成目标分词向量之前,还包括:将目标企业的企业信息进行预处理,得到所述企业信息对应的第一文本分类模型;根据SVM算法,对所述第一文本分类模型进行训练,得到第二文本分类模型;判断所述第二文本分类模型是否通过验证,得到判断结果;若所述判断结果为第二文本分类模型通过验证,则将所述第二文本分类模型确定为目标文本分类模型;若所述判断结果为第二文本分类模型不通过验证,则将所述第二文本分类模型作为第一文本分类模型,并执行根据SVM算法,对所述第一文本分类模型进行训练,得到第二文本分类模型的步骤,直至所述第二本文分类模型通过验证。
[0013]通过采用上述技术方案,将企业信息进行预处理得到第一文本分类模型,并对第一文本分类模型进行训练以及验证,得到较为准确的目标文本分类模型,可以为提升分类结果匹配的准确性。
[0014]可选的,所述将目标企业的企业信息进行预处理,得到所述企业信息对应的的第一文本分类模型,包括:根据所述企业信息中所有语句的类别,将所述企业信息拆分成至少一个第一语句;将所有所述第一语句转换为第一句向量;根据所有第一句向量以及对应的语句类别,生成所述第一文本分类模型。
[0015]通过采用上述技术方案,根据企业信息中的所有语句类别生成句向量以及对应的第一文本分类模型,当客户对该企业进行信息咨询时,通过企业信息生成的文本分类模型对客户的问题进行匹配,准确性更高。
[0016]可选的,所述判断所述第二文本分类模型是否通过验证,得到判断结果,包括将所述企业信息中的多个语句代入所述第二文本分类模型中进行匹配,得到第二匹配结果;判断所述第二匹配结果是否大于判断阈值;
若所述匹配结果大于所述判断阈值,则得到所述判断结果为所述第二文本分类模型通过验证;若所述匹配结果小于所述判断阈值,则得到所述判断结果为所述第二文本分类模型不通过验证。
[0017]通过采用上述技术方案,通过匹配结果与判断阈值进行比较,对第二文本信息进行进一步验证,可以有效提高生成文本分类模型的准确性。
[0018]在本申请的第二方面提供了一种基于权值词向量的文本匹配系统,所述系统包括:目标分词向量列表生成模块,用于接收客户端发送的待匹配文本,生成所述待匹配文本对应的目标分词向量列表;目标句向量列表转换模块,用于将所述目标分词向量列表转换为目标句向量列表;分类结果匹配模块,用于将所述目标句向量列表输入至训练完成的文本分类模型中,得到所述待匹配文本对应的分类结果;应答信息发送模块,用于根据所述分类结果,得到所述待匹配文本对应的应答信息,并将所述应答信息发送至所述客户端。
[0019]在本申请的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
[0020]在本申请的第四方面提供了一种电子设备,包括:处理器、存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
[0021]综上所述,本申请包括以下至少一种有益效果:通过采用本申请技术方案,可以将客户端发送的待匹配文本转换为目标句向量,并待入根据企业信息训练完成的文本分类模型中,匹配得到对应的分类结果,并根据分类结果匹配得到对应于待匹配文本的应答信息,只需通过计算机便可在线解答客户的问题,进而减小了客服服务的成本。
附图说明
[0022]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于权值词向量的文本匹配方法,其特征在于,包括:接收客户端发送的待匹配文本,生成所述待匹配文本对应的目标分词向量列表;将所述目标分词向量列表转换为目标句向量列表;将所述目标句向量列表输入至训练完成的文本分类模型中,得到所述待匹配文本对应的分类结果;根据所述分类结果以及所述分类结果对应的结构化数据对企业信息进行匹配,得到所述待匹配文本对应的应答信息,并将所述应答信息发送至所述客户端。2.根据权利要求1所述的基于权值词向量的文本匹配方法,其特征在于,所述生成所述待匹配文本对应的目标分词向量列表,包括:根据分词算法,将所述待匹配文本转换为分词列表,所述分词列表包括所述待匹配文本中的各个分词;根据skipgram算法,将所述分词列表中的各个分词转换为分词向量,得到目标分词向量列表。3.根据权利要求1所述的基于权值词向量的文本匹配方法,其特征在于,所述目标分词向量列表中包括至少一个分词向量,所述将所述目标分词向量列表转换为目标句向量列表,包括:获取所述目标分词向量列表中各所述分词向量对应的权重;将所有所述分词向量乘以对应的权重,再除以所述目标分词向量列表中分词向量的数量之商作为句向量;将所有句向量组合得到所述目标句向量列表。4.根据权利要求1所述的基于权值词向量的文本匹配方法,其特征在于,所述将所述目标句向量列表输入至训练完成的文本分类模型中,得到所述待匹配文本对应的分类结果,包括:将所述目标句向量列表输入所述训练完成的文本分类模型中,根据所述目标句向量列表中的每个句向量的类别匹配所述目标文本分类模型中对应的句向量,并计算对应的匹配概率,所述目标句向量中所有句向量的匹配概率之和为1;将所述匹配概率大于概率阈值的句向量确定为所述待匹配文本对应的分类结果。5.根据权利要求1所述的基于权值词向量的文本匹配方法,其特征在于,所述在接收客户端发送的待匹配文本,根据所述待匹配文本,生成目标分词向量之前,还包括:将目标企业的企业信息进行预处理,得到所述企业信息对应的第一文本分类模型;根据SVM算法,对所述第一文本分类模型进行训练,得到第二文本分类模型;判断所述第二文本分类模型是否通过验证,得到判断结果;若所述判断结果为第二文本分类模型通过...

【专利技术属性】
技术研发人员:彭勇郑峰李玲
申请(专利权)人:上海井星信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1