一种面向招投标服务的检索式智能问答方法技术

技术编号:38391812 阅读:10 留言:0更新日期:2023-08-05 17:44
本发明专利技术公开了一种面向招投标服务的检索式智能问答方法,涉及智能问答技术领域;本发明专利技术使用BERT模型计算问题与句子的语义相关性,由于BERT模型具有深层的神经网络且涵盖多个注意力头部,较传统的语言模型来说,可以捕捉更加复杂的语义特征。同时,使用BERT模型自带的标记化工具对问题和句子进行分词与编码,比传统的先对文本进行分词后编码的方法更方便快捷,从而提高实验的效率;本发明专利技术使用ALBERT模型预测答案集合中答案两两之间的顺序判断矩阵,由于计算的顺序判断矩阵涉及多次的逻辑推断,与BERT模型相比较,在保持高精度的同时,ALBERT能大大减少了参数量,提高了模型的效率和可扩展性。和可扩展性。和可扩展性。

【技术实现步骤摘要】
一种面向招投标服务的检索式智能问答方法


[0001]本专利技术属于智能问答
,具体是一种面向招投标服务的检索式智能问答方法。

技术介绍

[0002]随着人工智能的不断发展,检索式智能问答系统已经成为招投标服务平台的重要技术资产之一。
[0003]检索式智能问答系统是一种基于人工智能技术的问答系统,旨在回答用户提出的问题。系统主要依靠搜索引擎和知识库中的数据进行回答,这种问答系统通常包含两个主要组件:检索引擎和答案生成器。检索引擎负责在知识库中查找与用户问题相关的信息,而答案生成器则将搜索到的信息整合并生成最终的回答。
[0004]尽管检索式智能问答系统的准确性和效率都得到了极大的提高,但它们在招投标服务平台的应用仍然存在一些限制。首先,现有研究受限于语义表征能力的限制,无法捕获问题和招投标手册文档句子的深层语义,因此无法对复杂问题进行准确回答;第二,现有研究通过语义匹配获得答案列表,忽略了答案列表之间存在的逻辑顺序,导致用户接收到的答案列表是不通畅、不连贯的;第三,现有面向招投标服务的答案生成器通常使用模板匹配等技术,将从知识库或搜索引擎中检索到的信息整合成最终的回答,缺乏针对问题和答案知识的整合能力。使得生成的答案过于模板化,缺乏灵活性。

技术实现思路

[0005]本专利技术旨在至少解决现有技术中存在的技术问题之一;为此,本专利技术提出了一种面向招投标服务的检索式智能问答方法。
[0006]一种面向招投标服务的检索式智能问答方法,该方法具体包括如下步骤:
[0007]步骤1、收集问题和招投标手册文档,并对文档进行句子级别的切分,得到切分好的招投标手册文档集合D

={D
l

,l=1,2,

,L};对切分好的招投标手册文档D

中所有元素D
l

的句子做并集,得到含有P个句子的集合S={S
p
,p=1,2,

,P};从句子集合中采样部分子集S

={S
t

,t=1,2,

,T}∈S作为BERT模型参数的微调样本;
[0008]步骤2、用BERT模型选择与问题最相关的N个句子作为Top

N答案列表A
i
={A
ij
,j=1,2,...,N},其中A
ij
表示第i个问题Q
i
的第j个答案;
[0009]步骤3、采用ALBERT模型计算N个答案两两之间的顺序判断矩阵;
[0010]步骤4、利用层次分析法对N个答案进行重排序;
[0011]根据层次分析法中求判断矩阵特征值的根法求第i个问题Q
i
的N个答案A
i
={A
ij
,j=1,2,...,N}的顺序权重值。计算顺序判断矩阵M
i
中每一行的元素之积,得到顺序判断矩阵M
i
的N行元素之积集合:
[0012][0013]其中,表示第i个问题Q
i
的顺序判断矩阵M
i
的第r行的元素之积;计算得到顺序判断矩阵M
i
的N行元素之积M
i
的N次方根集合:
[0014][0015]其中,表示第i个问题Q
i
顺序判断矩阵M
i
的第r行元素之积的N次方根;对顺序判断矩阵M
i
的N行元素之积的N次方根集合作归一化处理,得到第i个问题Q
i
的N个答案列表A
i
的顺序权重集合的顺序权重集合其中表示第r个答案A
ir
的顺序权重;
[0016]步骤5、将重排序的N个答案输入到GPT

2模型中生成针对问题的答案文本;
[0017]步骤6、将答案文本作为最终的反馈响应,并附带Top

N答案列表作为响应的依据。
[0018]与现有技术相比,本专利技术的有益效果是:
[0019]本专利技术使用BERT模型计算问题与句子的语义相关性,由于BERT模型具有深层的神经网络且涵盖多个注意力头部,较传统的语言模型来说,可以捕捉更加复杂的语义特征。同时,使用BERT模型自带的标记化工具对问题和句子进行分词与编码,比传统的先对文本进行分词后编码的方法更方便快捷,从而提高实验的效率;
[0020]本专利技术使用ALBERT模型预测答案集合中答案两两之间的顺序判断矩阵,由于计算的顺序判断矩阵涉及多次的逻辑推断,与BERT模型相比较,在保持高精度的同时,ALBERT能大大减少了参数量,提高了模型的效率和可扩展性。同时,由于ALBERT采用多任务学习,其在自然语言推断任务上有比其他模型更好的表现;
[0021]本专利技术借助层次分析法通过对答案集的不同答案进行两两比较,使用特定的数学方法来计算每个答案的权重,从而对答案集进行重新排序,使重排序的答案之间有较强的逻辑性和推断性,最终提高最终生成答案文本的准确性;
[0022]本专利技术借助GPT

2模型学习离散的答案之间潜在的语义特征与逻辑关系,将离散的答案片段连贯成语义流畅且内容丰富的答案文本,最终反馈响应给用户,由于GPT

2模型比传统的生成模型拥有更好的语言表达能力和语言推理能力而且能自动完成文本生成任务,响应更加快捷准确,以此来提高用户的体验感,增加服务平台与用户的粘性。
附图说明
[0023]图1是本专利技术生成答案文本的流程图;
[0024]图2是本专利技术使用BERT模型计算问题与答案相关性得分图;
[0025]图3是本专利技术使用ALBERT模型预测N个答案两两顺序图;
[0026]图4是本专利技术使用GPT

2模型生成答案文本图。
具体实施方式
[0027]下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实
施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0028]请参阅图1

图4所示,本申请提供了一种面向招投标服务的检索式智能问答方法,该方法具体包括如下步骤:
[0029]步骤1、收集问题与招投标手册文档并对文档进行句子切分;
[0030]步骤1.1、收集问题和招投标手册文档;
[0031]在相关招投标服务平台、贴吧等平台收集有关招投标的问题以及包含大部分问题答案的招投标手册文档,包括:M个问题Q={Q
i
,i=1,2,

,M}和L篇招投标手册文档D={D
l
,l=1,2,

,L};...

【技术保护点】

【技术特征摘要】
1.一种面向招投标服务的检索式智能问答方法,其特征在于,该方法具体包括如下步骤:步骤1、收集问题和招投标手册文档,并对文档进行句子级别的切分,得到切分好的招投标手册文档集合D

={D
l

,l=1,2,

,L};对切分好的招投标手册文档D

中所有元素D
l

的句子做并集,得到含有P个句子的集合S={S
p
,p=1,2,

,P};从句子集合中采样部分子集S

={S
t

,t=1,2,

,T}∈S作为BERT模型参数的微调样本;步骤2、用BERT模型选择与问题最相关的N个句子作为Top

N答案列表A
i
={A
ij
,j=1,2,...,N},其中A
ij
表示第i个问题Q
i
的第j个答案;步骤3、采用ALBERT模型计算N个答案两两之间的顺序判断矩阵;步骤4、利用层次分析法对N个答案进行重排序;根据层次分析法中求判断矩阵特征值的根法求第i个问题Q
i
的N个答案A
i
={A
ij
,j=1,2,...,N}的顺序权重值。计算顺序判断矩阵M
i
中每一行的元素之积,得到顺序判断矩阵M
i
的N行元素之积集合:其中,表示第i个问题Q
i
的顺序判断矩阵M
i
的第r行的元素之积;计算得到顺序判断矩阵M
i
的N行元素之积M
i
的N次方根集合:其中,表示第i个问题Q
i
顺序判断矩阵M
i
的第r行元素之积的N次方根;对顺序判断矩阵M
i
的N行元素之积的N次方根集合作归一化处理,得到第i个问题Q
i
的N个答案列表A
i
的顺序权重集合的顺序权重集合其中表示第r个答案A
ir
的顺序权重;步骤5、将重排序的N个答案输入到GPT

2模型中生成针对问题的答案文本;步骤6、将答案文本作为最终的反馈响应,并附带Top

N答案列表作为响应的依据。2.根据权利要求1所述的一种面向招投标服务的检索式智能问答方法,其特征在于,对文档进行句子级别切分的具体方式为:S11、根据“。”、“;”、“!”、“?”和
“……”
等标点符号,分别取出招投标手册文档D中的第l篇文档D
l
进行句子级别的切分,得到切分好的招投标手册文档集合D

={D
l

,l=1,2,

,L};对切分好的招投标手册文档D

中所有元素D

l
的句子做并集,得到含有P个句子的集合S={S
p
,p=1,2,

,P};S12、从句子集合中采样部分子集S

={S

t
,t=1,2,

,T}∈S作为BERT模型参数的微调样本,标注子集S

中每个句子S

t
与每个问题Q
i
的相关性,相关标记为l

ti
=1,不相关标记为l

ti
=0,则真实标签为长度是M的向量l

t

=[l

t1
,l

t2
,

,l

tM
],该标注的子集S

用于步骤2中对BERT模型的参数微调。3.根据权利要求1所述的一种面向招投标服务的检索式智能问答方法,其特征在于,用
BERT模型选择答案列表的具体方式为:步骤2.1、将问题与句子拼接作为BERT模型的输入来计算问题与句子的相关性得分;将第i个问题Q
i
与句子集合S中的每个句子S
p
进行拼接,组成第i个问答对集合QS
i
={(Q
...

【专利技术属性】
技术研发人员:沈家桓魏晓磊丁三帖君艳陈少炜吴志伟金占周亮李剑飞张伟花艳
申请(专利权)人:安徽安天利信工程管理股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1