【技术实现步骤摘要】
一种多粒度捕获匹配特征的文本匹配方法
本专利技术属于计算机自然语言处理领域,具体涉及一种采用多粒度捕获匹配特征模式进行文本匹配的方法。
技术介绍
自然语言处理是计算机科学,人工智能和语言学的交叉领域,目标是让计算机能够理解自然语言,代替人类执行语言翻译和问题回答等任务。自然语言处理受深度神经网络启发,神经网络被广泛用于句子建模,深度学习模型可以将句子表示为语义空间上的向量矩阵,利用向量之间的距离更准确的描述两个句子之间的语义关系,卷积神经网络善于提取句子中的抽象特征,循环神经网络善于保持并利用长距离信息。文本匹配研究是自然语言处理中的一个核心问题,对于复述问题可以归结为句子对或文本对之间是否匹配;对于自动问答问题可以归结为问题和候选答案的匹配。自然语言句子具有复杂的结构,既有顺序结构,也有层次结构,这些结构对理解自然语言句子至关重要。因此,一个成功的句子匹配算法不仅需要捕捉句子的内部结构,还需要捕捉句子之间丰富的交互模式。2014年Hu参考了Kim使用卷积神经网络来建模句子表示的思想提出了ARC-I模型和AR ...
【技术保护点】
1.一种多粒度捕获匹配特征的文本匹配方法,其特征在于包括以下步骤:/n(1)构建表示模型:预处理后的文本通过卷积构建文本在多个粒度下的表示,使用最大池化筛选更合理可靠的表示;/n(2)构建交互模型:构建多个粒度下的匹配矩阵;/n(3)捕获匹配特征:利用卷积神经网络捕获每个粒度中的匹配特征;/n(4)计算文本相似度:将捕获的匹配特征输入到全连接神经网络,减少信息损失,得出匹配的相似度。/n
【技术特征摘要】
1.一种多粒度捕获匹配特征的文本匹配方法,其特征在于包括以下步骤:
(1)构建表示模型:预处理后的文本通过卷积构建文本在多个粒度下的表示,使用最大池化筛选更合理可靠的表示;
(2)构建交互...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。