文本匹配方法、设备、存储介质及产品组成比例

技术编号:34128331 阅读:52 留言:0更新日期:2022-07-14 14:46
本申请提供一种文本匹配方法、设备、存储介质及产品,该方法包括:获取待匹配的第一文本数据和第二文本数据,分别提取第一文本数据及第二文本数据的关键特征,采用与关键特征相匹配的文本模板将关键特征转化为对应的自然语言文本片段,采用自注意力机制的深度神经网络模型将第一文本数据和第二文本数据分别对应的自然语言文本片段进行匹配,以获得第一文本数据和第二文本数据的匹配结果。本申请的方法可以应用在政府政策法规与相关企业的智能匹配场景中,利用深度神经网络的高阶特征抽取能力,可以实现对政府政策法规文本数据和企业文本数据自然语言文本的语义理解及匹配,从而无需人为基于文本特征构建构造特征,提高了匹配结果的准确度。配结果的准确度。配结果的准确度。

Text matching methods, equipment, storage media and products

【技术实现步骤摘要】
文本匹配方法、设备、存储介质及产品


[0001]本申请涉及人工智能技术,尤其涉及一种文本匹配方法、设备、存储介质及产品。

技术介绍

[0002]随着人工智能技术的发展,人工智能技术应用在多个领域。其中,人工智能在文本匹配领域的应用,是数据搜索引擎的基础保障。
[0003]目前在进行文本匹配时,一般是获取两个文本的原始文本特征后,人为根据原始文本特征构建进行匹配时的构造特征,并采用对应的文本匹配算法根据构造特征进行匹配。所以匹配结果的好坏很大程度上依赖于构造特征的优劣,导致匹配结果的准确度较低,并且在构造特征发生改变时,需要适应性的去调整文本匹配算法,使文本匹配算法的通用性较差。

技术实现思路

[0004]本申请提供一种文本匹配方法、设备、存储介质及产品,用以解决现有技术中采用依赖于构造特征的文本匹配方法进行文本匹配,匹配结果的准确度较低,且需要根据构造特征的变化适应性调整文本匹配算法,文本匹配算法通用性较差的问题。
[0005]第一方面,本申请实施例提供一种文本匹配方法,包括:
[0006]获取待匹配的第本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括:获取待匹配的第一文本数据和第二文本数据;分别提取所述第一文本数据及所述第二文本数据的关键特征;采用与关键特征相匹配的文本模板将所述关键特征转化为对应的自然语言文本片段;采用自注意力机制的深度神经网络模型将第一文本数据和第二文本数据分别对应的自然语言文本片段进行匹配,以获得第一文本数据和第二文本数据的匹配结果。2.根据权利要求1所述的方法,其特征在于,所述采用与关键特征相匹配的文本模板将所述关键特征转化为对应的自然语言文本片段,包括:确定所述关键特征的特征类型;根据所述特征类型确定所述关键特征相匹配的文本模板;按照所述相匹配的文本模板的格式将关键特征转化为对应的自然语言文本片段。3.根据权利要求2所述的方法,其特征在于,所述关键特征的特征类型为定值特征;所述根据所述特征类型确定所述关键特征相匹配的文本模板,包括:根据所述定值特征确定所述关键特征相匹配的文本模板为键值对格式模板;所述按照所述相匹配的文本模板的格式将关键特征转化为对应的自然语言文本片段,包括:按照所述相匹配的文本模板的键值对格式将相匹配的关键特征转化为对应的自然语言文本片段。4.根据权利要求2所述的方法,其特征在于,所述关键特征的特征类型为布尔特征;所述根据所述特征类型确定所述关键特征相匹配的文本模板,包括:根据所述布尔特征确定所述关键特征相匹配的文本模板为真值格式模板;所述按照所述相匹配的文本模板的键值对格式将相匹配的关键特征转化为对应的自然语言文本片段,包括:若确定所述关键特征为真值,则按照所述相匹配的文本模板的真值格式将相匹配的关键特征转化为对应的自然...

【专利技术属性】
技术研发人员:韩宇张跃伟王浩
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1