一种语言模型问题回答优化方法及其系统技术方案

技术编号:39324672 阅读:9 留言:0更新日期:2023-11-12 16:03
本发明专利技术涉及一种语言模型问题回答优化方法,方法为:对未训练过的内容进行分词生成文本,再生成文本的词向量,保存在本地词向量库;输入问题,本地词向量库根据输入的问题生成问题词向量;通过词向量余弦算法获取本地词向量库中句子的向量与问题词向量之间的相似度,选取相似度最高的若干个句子;将相似度最高的若干个句子和问题发送给语言模型;语言模型接收若干个句子和问题,经过处理返回正确率最高的答案,能够提高回答语言模型中未训练过的内容的问题的准确性,对于未训练过的内容,只需把未训练过的内容的段落拆分开,只提取出和问题最相关的片段给语言模型,就能回答问题,一定程度上解决字数限制的问题。程度上解决字数限制的问题。程度上解决字数限制的问题。

【技术实现步骤摘要】
一种语言模型问题回答优化方法及其系统


[0001]本专利技术涉及计算机领域,特别是一种语言模型问题回答优化方法及其系统。

技术介绍

[0002]语言模型通过对句子的上下文特征进行数学建模,来回答一个问题:出现的句子是否合理,语言模型是自然语言的基础,广泛应用于机器翻译语音识别、拼写纠错、输入法、手写体识别等。
[0003]目前使用语言模型进行提问回答,由于很多语言模型都是训练好的,在使用时候都有字数限制,对于未训练过的内容,语言模型无法很好的回答问题。目前只能通过对语言模型进行额外训练才能解决。

技术实现思路

[0004]为克服现有语言模型有字数限制,并且在回答未训练过的问题时,输出答案准确率低的问题,本专利技术的目的是提供一种语言模型问题回答优化方法及其系统,能够提高回答语言模型中不存在的内容的问题的准确性,并且解决字数限制的问题。
[0005]本专利技术采用以下方案实现:
[0006]一种语言模型问题回答优化方法,所述方法步骤如下:
[0007]步骤1:对未训练过的内容进行分词生成文本,再生成文本的词向量,保存在本地词向量库;
[0008]步骤2:输入问题,根据输入的问题生成问题词向量;
[0009]步骤3:通过词向量余弦算法获取本地词向量库中句子与问题词向量之间的相似度,选取相似度最高的若干个句子;
[0010]步骤4:将相似度最高的若干个句子和问题发送给语言模型;
[0011]步骤5:语言模型接收若干个句子和问题,经过处理返回正确率最高的答案。
[0012]进一步的,步骤1进一步具体为:通过jieba分词工具对未训练过的内容进行分词,通过word2vec库将文本转为词向量,保存在本地词向量库。
[0013]进一步的,步骤2进一步具体为:输入问题,在本地词向量库中,将输入的问题转成一个的问题词向量,问题词向量能够匹配到相近距离的句子的向量或段落的向量。
[0014]进一步的,步骤3进一步具体为:通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度,得到一个相似度矩阵,所述相似度矩阵中每个元素表示两个句子之间的相似度得分,从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。
[0015]进一步的,步骤4进一步具体为:通过模版字符串拼接的方式,把问题和若干个句子,提交给语言模型。
[0016]一种语言模型问题回答优化系统,所述系统包括词向量生成模块、问题词向量生成模块、相似度计算模块、输入模块、输出模块;
[0017]所述词向量生成模块用于对未训练过的内容进行分词生成文本,再生成文本的词
向量,保存在本地词向量库;
[0018]所述问题词向量生成模块用于输入问题,根据输入的问题生成问题词向量;
[0019]所述相似度计算模块用于通过词向量余弦算法获取本地词向量库中句子与问题词向量之间的相似度,选取相似度最高的若干个句子;
[0020]所述输入模块用于将相似度最高的若干个句子和问题发送给语言模型;
[0021]所述输出模块用于语言模型接收若干个句子和问题,经过处理返回正确率最高的答案。
[0022]进一步的,词向量生成模块进一步具体为:通过jieba分词工具对未训练过的内容进行分词,通过word2vec库将文本转为词向量,保存在本地词向量库。
[0023]进一步的,问题词向量生成模块进一步具体为:输入问题,在本地词向量库中,将输入的问题转成一个的问题词向量,问题词向量能够匹配到相近距离的句子的向量或段落的向量。
[0024]进一步的,相似度计算模块进一步具体为:通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度,得到一个相似度矩阵,所述相似度矩阵中每个元素表示两个句子之间的相似度得分,从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。
[0025]进一步的,输入模块进一步具体为:通过模版字符串拼接的方式,把问题和若干个句子,提交给语言模型。
[0026]本专利技术的有益效果在于:
[0027]本专利技术提供了一种语言模型问题回答优化方法及其系统,能够提高回答语言模型中不存在的内容的问题的准确性,对于未训练过的内容,只需把未训练过的内容的段落拆分开,只提取出和问题最相关的片段给语言模型,就能回答问题,在一定程度上解决字数限制的问题。
附图说明
[0028]图1为本专利技术方法的流程图;
[0029]图2为本专利技术系统的结构框图。
具体实施方式
[0030]下面结合附图对本专利技术做进一步说明。
[0031]请参见图1,一种语言模型问题回答优化方法,所述方法步骤如下:
[0032]步骤1:对未训练过的内容进行分词生成文本,再生成文本的词向量,保存在本地词向量库;
[0033]步骤2:输入问题,根据输入的问题生成问题词向量;
[0034]步骤3:通过词向量余弦算法获取本地词向量库中句子与问题词向量之间的相似度,选取相似度最高的若干个句子;
[0035]步骤4:将相似度最高的若干个句子和问题发送给语言模型;
[0036]步骤5:语言模型接收若干个句子和问题,经过处理返回正确率最高的答案。
[0037]下面结合一个具体实施例来对本专利技术进行进一步说明:
[0058]两个字符串找模版拼接后发给语言模型,这里最简单的模版就是直接拼接,复杂的可以定义前后辅助词。
[0059]步骤5:语言模型接收上面的句子+问题,根据语言模型已经训练好的参数和语言模型的神经网络结构,就能预测输出回答的答案。
[0060]这里语言模型是比较强的问题回答模型,只是它可能没有学过新的知识,并且语言模型一次性输入的内容有限制,有的语言模型只能接收2000个字。如果有10000字的内容,我们要从中提取想要的答案(内容),所以通过本地词向量库先提取出与问题相关的句子或段落,尽可能的把和问题相关的内容压缩到2000个字以内发送给它回答。
[0061]参见图2,一种语言模型问题回答优化系统,所述系统包括词向量生成模块、问题词向量生成模块、相似度计算模块、输入模块、输出模块;
[0062]所述词向量生成模块用于对未训练过的内容进行分词生成文本,再生成文本的词向量,保存在本地词向量库;
[0063]所述问题词向量生成模块用于输入问题,根据输入的问题生成问题词向量;
[0064]所述相似度计算模块用于通过词向量余弦算法获取本地词向量库中句子与问题词向量之间的相似度,选取相似度最高的若干个句子;
[0065]所述输入模块用于将相似度最高的若干个句子和问题发送给语言模型;
[0066]所述输出模块用于语言模型接收若干个句子和问题,经过处理返回正确率最高的答案。
[0067]词向量生成模块进一步具体为:通过jieba分词工具对未训练过的内容进行分词,通过word2vec库将文本转为词向量,保存在本地词向量库;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语言模型问题回答优化方法,其特征在于,所述方法步骤如下:步骤1:对未训练过的内容进行分词生成文本,再生成文本的词向量,保存在本地词向量库;步骤2:输入问题,本地词向量库根据输入的问题生成问题词向量;步骤3:通过词向量余弦算法获取本地词向量库中句子的向量与问题词向量之间的相似度,选取相似度最高的若干个句子;步骤4:将相似度最高的若干个句子和问题发送给语言模型;步骤5:语言模型接收若干个句子和问题,经过处理返回正确率最高的答案。2.根据权利要求1所述的一种语言模型问题回答优化方法,其特征在于,步骤1进一步具体为:通过jieba分词工具对未训练过的内容进行分词,通过word2vec库将文本转为词向量,保存在本地词向量库。3.根据权利要求1所述的一种语言模型问题回答优化方法,其特征在于,步骤2进一步具体为:输入问题,在本地词向量库中,将输入的问题转成一个的问题词向量,问题词向量能够匹配到相近距离的句子的向量或段落的向量。4.根据权利要求1所述的一种语言模型问题回答优化方法,其特征在于,步骤3进一步具体为:通过词向量余弦算法计算每个句子的向量与问题词向量之间的相似度,得到一个相似度矩阵,所述相似度矩阵中每个元素表示两个句子之间的相似度得分,从相似度矩阵中选出与目标句子相似度最高的句子作为匹配结果。5.根据权利要求1所述的一种语言模型问题回答优化方法,其特征在于,步骤4进一步具体为:通过模版字符串拼接的方式,把问题和若干个句子,提交给语言模型。6.一种语言模型问题回答优化系统,其特征在于,所述系统包括词向量生成模块、问题词向量...

【专利技术属性】
技术研发人员:刘德建陈丛亮李佳
申请(专利权)人:福建天晴在线互动科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1