一种多粒度捕获匹配特征的文本匹配方法组成比例

技术编号:23149901 阅读:44 留言:0更新日期:2020-01-18 13:47
本发明专利技术公开一种多粒度捕获匹配特征的文本匹配方法,属于计算机自然语言处理领域。基于传统模型的文本匹配效果较差。本发明专利技术方法的步骤为:(1)构建表示模型(2)构建交互模型(3)捕获匹配特征(4)计算文本相似度。该方法主要用于答案选择和释义识别任务中文本匹配应用。

A text matching method for capturing matching features with multi granularity

【技术实现步骤摘要】
一种多粒度捕获匹配特征的文本匹配方法
本专利技术属于计算机自然语言处理领域,具体涉及一种采用多粒度捕获匹配特征模式进行文本匹配的方法。
技术介绍
自然语言处理是计算机科学,人工智能和语言学的交叉领域,目标是让计算机能够理解自然语言,代替人类执行语言翻译和问题回答等任务。自然语言处理受深度神经网络启发,神经网络被广泛用于句子建模,深度学习模型可以将句子表示为语义空间上的向量矩阵,利用向量之间的距离更准确的描述两个句子之间的语义关系,卷积神经网络善于提取句子中的抽象特征,循环神经网络善于保持并利用长距离信息。文本匹配研究是自然语言处理中的一个核心问题,对于复述问题可以归结为句子对或文本对之间是否匹配;对于自动问答问题可以归结为问题和候选答案的匹配。自然语言句子具有复杂的结构,既有顺序结构,也有层次结构,这些结构对理解自然语言句子至关重要。因此,一个成功的句子匹配算法不仅需要捕捉句子的内部结构,还需要捕捉句子之间丰富的交互模式。2014年Hu参考了Kim使用卷积神经网络来建模句子表示的思想提出了ARC-I模型和ARC-II模型。ARC本文档来自技高网...

【技术保护点】
1.一种多粒度捕获匹配特征的文本匹配方法,其特征在于包括以下步骤:/n(1)构建表示模型:预处理后的文本通过卷积构建文本在多个粒度下的表示,使用最大池化筛选更合理可靠的表示;/n(2)构建交互模型:构建多个粒度下的匹配矩阵;/n(3)捕获匹配特征:利用卷积神经网络捕获每个粒度中的匹配特征;/n(4)计算文本相似度:将捕获的匹配特征输入到全连接神经网络,减少信息损失,得出匹配的相似度。/n

【技术特征摘要】
1.一种多粒度捕获匹配特征的文本匹配方法,其特征在于包括以下步骤:
(1)构建表示模型:预处理后的文本通过卷积构建文本在多个粒度下的表示,使用最大池化筛选更合理可靠的表示;
(2)构建交互...

【专利技术属性】
技术研发人员:曹小鹏金亮
申请(专利权)人:西安邮电大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1