基于组合距离的语义相似度计算方法技术

技术编号:24252012 阅读:27 留言:0更新日期:2020-05-22 23:49
本发明专利技术涉及基于组合距离的语义相似度计算方法,其特征在于,包括以下步骤:步骤S10:input layer输出层:是上下文单词的one‑hot形式的词向量;步骤S20:隐藏层的神经元数量设为

Semantic similarity calculation method based on combination distance

【技术实现步骤摘要】
基于组合距离的语义相似度计算方法
本专利技术涉及于组合距离的语义相似度计算
,具体为一种基于组合距离的语义相似度计算方法。
技术介绍
自然语言处理(NLP),是指用计算机技术对人类自然语言形式的形、音、义等信息进行自动化处理加工的过程。自然语言处理技术就是对字、词、句、篇章等形式输入信息,进行识别、分析、理解、转换、生成等的操作和加工的计算机领域的科学技术。自然语言处理与图像识别、语音识别并列为当前人工智能领域三大最热门技术,是人工智能研究的重要组成部分。自然语言处理所涉及的研究领域包括:机器翻译、文本摘要、文本分类、文本校对、语义分析、信息抽取、信息检索、文本翻译、语音合成和语音识别等。语义分析(SemanticAnalysis)是指运用各种机器学习方法,学习与理解一段文本所表示的语义内容。一段文本通常由词、句子、篇章构成,根据理解对象的语言单位不同,语义分析又可以进一步分成:词汇级语义分析,句子级语义分析和篇章级语义分析。一般来说:词汇级语义分析以单词或词组为单位,它关注的是如何获取和区别单词或词组之间的语义,句子级语义分析则本文档来自技高网...

【技术保护点】
1.一种基于组合距离的语义相似度计算方法,其特征在于,包括以下步骤:/n步骤S10:input layer输出层:是上下文单词的one-hot形式的词向量;/n步骤S20:隐藏层的神经元数量设为

【技术特征摘要】
1.一种基于组合距离的语义相似度计算方法,其特征在于,包括以下步骤:
步骤S10:inputlayer输出层:是上下文单词的one-hot形式的词向量;
步骤S20:隐藏层的神经元数量设为,权值共享矩阵为,的大小为,并且初始化;
步骤S30:在中间层进行数据计算;
步骤S40:hiddenlayer的输出数据的结果;
步骤S50:hiddenlayer与作乘积计算后得到的输出结果;
步骤S60:损失函数和反向传播优化计算。


2.根据权利要求1所述基于组合距离的语义相似度计算方法,其特征在于:S10步骤中,假设单词向量空间的维度为V,即整个训练语料词典大小为V,上下文单词窗口的大小为C。


3.根据权利要求1所述基于组合距离的语义相似度计算方法,其特征在于:S30步骤中,个大小的向量分别跟同一个大小的权值共享矩阵相乘,得到的是个大小的隐层hiddenlayer。

<...

【专利技术属性】
技术研发人员:罗明林建何罗志鹏
申请(专利权)人:珠海横琴极盛科技有限公司
类型:发明
国别省市:广东;44

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1