一种神经网络训练方法、语义检索方法及系统技术方案

技术编号：33350874 阅读：13 留言：0更新日期：2022-05-08 09:56

本发明专利技术公开一种神经网络训练方法，包括步骤：S1:对句子进行标注；S2:将标注好的句子输入神经网络模型；S3:设置损失函数；S4:根据损失函数的损失值，对神经网络进行训练。本发明专利技术采取的技术方案使用的神经网络训练方法得到的模型参数少，检索速度快，能够获取文本的语义信息，从而提高了检索的准确率。从而提高了检索的准确率。从而提高了检索的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络训练方法、语义检索方法及系统

[0001]本专利技术涉及信息检索
，尤其涉及一种神经网络训练方法、语义检索方法及系统。

技术介绍

[0002]海量的信息中，信息搜索是重要的技术之一，由于语言的特点，同一个意思，都会有较多的相同以及相似的词汇进行表达，为了更进一步检索到想要的信息，有的还基于句子的意思进行概括和总结。
[0003]随着自然语言处理技术的发展，语义搜索作为信息搜索搜得到了快速的发展，语音搜索能从海量的文本中，根据用户输入的词语或者句子，能够搜索出语义相同或者相似的语句，由于其具有深度的信息检索和挖掘能力，在文献搜索、智能客户、智能问答、推荐系统等领域得到了广泛的应用。
[0004]现有技术中，有的语义搜索技术已经结合深度神经网络来进行探索，现有的检索算法主要是基于文本相似度bm2.5和tf
‑
idf(term frequency
–
inverse document frequency)来实现，其技术缺陷在于，只能能够计算词的词频特征，检索的词在文本中出现才可以被检索到。只能获取词频信息，但是很难获取文本的语义信息，如果不出现，但是语义相近的词无法被检索到。导致其检索准确率不高。

技术实现思路

[0005]本专利技术为解决现有技术中存在的技术问题，提供一种神经网络训练方法，包括步骤：
[0006]S1:对句子进行标注；
[0007]S2:将标注好的句子输入神经网络模型；
[0008]S3:设置损失函

【技术保护点】

【技术特征摘要】
1.一种神经网络训练方法，其特征是，包括步骤：S1:对句子进行标注；S2:将标注好的句子输入神经网络模型；S3:设置损失函数；S4:根据损失函数的损失值，对神经网络进行训练。2.如权利要求1所述的神经网络训练方法，其特征是，步骤S1:对句子进行标注为：sentenceA，sentenceB，Score。3.如权利要求1所述的神经网络训练方法，其特征是，步骤S3:设置损失函数中的损失函数公式为：其中，m为训练的样本数量，label为人工标注的sentenceA和sentenceB的相似度，EsentenceA和EsentenceB为神经网络模型中抽取出来的句向量，cos为余弦相似度。4.如权利要求1所述的神经网络训练方法，其特征是，S2:将标注好的句子输入神经网络模型包括步骤：将字向量、位置编码、字所在的句子信息均设置为128维；将上述各向量乘以矩阵，得到768维的向量；输入神经网络，得到句子特征F，句子特征维度为：输入句子个数*最长句子长度*768；将句子特征F输入至卷积神经网络，对句子的每个字的特征进行加权求和。5.如权利要求1所述的神经网络训练方法，其特征是，所述神经网络结构为依次串联的6对...

【专利技术属性】
技术研发人员：曾祥云，朱姬渊，
申请(专利权)人：上海易康源医疗健康科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人