语义匹配方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:26891380 阅读:38 留言:0更新日期:2020-12-29 16:09
本申请涉及一种语义匹配方法、装置、计算机设备和存储介质。所述方法包括:获取待匹配语句;确定待匹配语句对应的文本相似语句;统计文本相似语句与待匹配语句之间的语义相似度;在文本相似语句中选取目标语句;目标语句为语义相似度符合预设条件的文本相似语句;根据目标语句的语义,得到待匹配语句的语义。采用本方法可以在缩小的数据范围基础上结合语义相似性进行语义匹配,降低语义匹配的运算量和减小耗时。

【技术实现步骤摘要】
语义匹配方法、装置、计算机设备和存储介质
本申请涉及自然语言处理
,特别是涉及一种语义匹配方法、装置、计算机设备和存储介质。
技术介绍
随着自然语言处理技术的发展,出现了文本匹配技术,传统的文本匹配技术有BoW(Bag-ofWords,词袋)、VSM(VectorSpaceModel,向量空间模型)、TF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文本频率)、BM25(BestMatching-25,最佳匹配)、Jaccord(杰卡德)、SimHash(局部敏感哈希)等算法,文本匹配基于词汇相似度进行匹配,可以解决词汇层面的匹配问题,但是在语义层面容易受到词义、句法结构、知识认知等方面的局限,难以实现准确的语义匹配,例如,“的士”和“出租车”虽然字面上不相似,但实际为同一种交通工具,“机器学习”和“学习机器”虽然词汇完全重合,但表达不同的语义。语义匹配问题可以利用深度语义匹配模型来解决,例如,DSSM(DeepStructuredSemanticModels,深度结构化语义模型)本文档来自技高网...

【技术保护点】
1.一种语义匹配方法,其特征在于,所述方法包括:/n获取待匹配语句;/n确定所述待匹配语句对应的文本相似语句;/n统计所述文本相似语句与所述待匹配语句之间的语义相似度;/n在所述文本相似语句中选取目标语句;所述目标语句为所述语义相似度符合预设条件的文本相似语句;/n根据所述目标语句的语义,得到所述待匹配语句的语义。/n

【技术特征摘要】
1.一种语义匹配方法,其特征在于,所述方法包括:
获取待匹配语句;
确定所述待匹配语句对应的文本相似语句;
统计所述文本相似语句与所述待匹配语句之间的语义相似度;
在所述文本相似语句中选取目标语句;所述目标语句为所述语义相似度符合预设条件的文本相似语句;
根据所述目标语句的语义,得到所述待匹配语句的语义。


2.根据权利要求1所述的方法,其特征在于,所述确定所述待匹配语句对应的文本相似语句,包括:
对所述待匹配语句进行切词处理,得到待匹配语句切词;
去除所述待匹配语句切词中的停用词,得到待匹配语句字段;
通过预训练的文本匹配模型,确定所述待匹配语句字段对应的文本相似字段;
根据所述文本相似字段,得到所述待匹配语句对应的文本相似语句。


3.根据权利要求2所述的方法,其特征在于,所述统计所述文本相似语句与所述待匹配语句之间的语义相似度,包括:
获取所述文本相似语句的文本相似语句编码;
对所述待匹配语句字段进行文本转序列编码,得到待匹配语句编码;
通过预训练的语义匹配模型,得到所述待匹配语句编码与所述文本相似语句编码之间的语义相似度。


4.根据权利要求1所述的方法,其特征在于,所述在所述文本相似语句中选取目标语句,包括:
通过选取所述语义相似度中的最大值,得到最大相似度;
根据所述最大相似度对应的文本相似语句,得到所述目标语句。


5.根据权利要求2所述的语义匹配方法,其特征在于,所述方法还包括:
获取语句样本;
对所述语句样本进行切词处理,得到语句切词样本;
去除所述语句切词样本中的停用词,得到语句字段样本;
基于所述语句字段样本的字段样本集合,对待训练的文...

【专利技术属性】
技术研发人员:夏海兵毛宇佘丽丽林昊詹维典
申请(专利权)人:招联消费金融有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1