【技术实现步骤摘要】
一种海量数据问答系统设计方法、系统、电子设备
本专利技术涉及任务型问答系统设计
,具体涉及一种海量数据问答系统设计方法、系统、电子设备。
技术介绍
随着互联网的普及和人工智能的高速发展,人机交互在人们的生活中扮演着越来越重要的角色。智能问答系统是人机交互的核心技术之一,最常见的应用场景就是任务型的问答系统,也就是智能客服可以根据用户的问题,快速的匹配到数据库中近似的问题,并将答案反馈给客户。通过构建智能问答系统,可以大量的减少企业运营的人工成本,减轻企业运营的压力。在目前已有的智能问答系统中,采用了深度语义匹配的方法实现对两个句子语义的相似度对比,最常用的方法是将两个句子拼接后输入到预先训练好的自然语言理解模型中(如BERT或LSTM模型等),在网络模型计算后会输出两个句子的文本内容相似概率。输出的结果越高,说明两个问题在语义上相似的概率越高,那么就可以把数据库中的问题对应的答案反馈给用户。随着网络上产生的信息越来越多,在问答系统中保存的问答对数据也快速的增加。随着数据量快速增加,如果将用户新提出的问题与数据库 ...
【技术保护点】
1.一种海量数据问答系统设计方法,其特征在于,包括如下步骤:/n接收用户输入要咨询的问题,将用户输入的问题转化生成一个用于表示用户问题句子文本内容信息的词向量;/n将用于表示用户问题句子文本内容信息的词向量利用文本相似度召回算法,快速的从问答对数据库中查找内容近似的问题的词向量形成近似问题的向量集合;/n将用于表示用户问题句子文本内容信息的词向量与近似问题集合中的问题的词向量逐一组合后输入到自然语言处理模型中,获得相似度最高的问题;/n将相似度最高的问题对应的答案反馈给用户。/n
【技术特征摘要】
1.一种海量数据问答系统设计方法,其特征在于,包括如下步骤:
接收用户输入要咨询的问题,将用户输入的问题转化生成一个用于表示用户问题句子文本内容信息的词向量;
将用于表示用户问题句子文本内容信息的词向量利用文本相似度召回算法,快速的从问答对数据库中查找内容近似的问题的词向量形成近似问题的向量集合;
将用于表示用户问题句子文本内容信息的词向量与近似问题集合中的问题的词向量逐一组合后输入到自然语言处理模型中,获得相似度最高的问题;
将相似度最高的问题对应的答案反馈给用户。
2.根据权利要求1所述的一种海量数据问答系统设计方法,其特征在于,所述的接收用户输入要咨询的问题,将用户输入的问题转化生成一个用于表示用户问题句子文本内容信息的词向量的步骤之前,还包括:
将问答对数据库中的所有的问题句子文本的内容转化成用于表示问题的文本内容的信息的词向量。
3.根据权利要求1所述的一种海量数据问答系统设计方法,其特征在于,所述的接收用户输入要咨询的问题,将用户输入的问题转化生成一个用于表示用户问题句子文本内容信息的词向量的步骤包括:
接收用户输入要咨询的问题;
将用户输入要咨询的问题文本进行分词;
利用预存储的词向量表转化成词向量;
将转化成的词向量输入到编码器模型转化输出用于表示用户问题句子文本内容信息的词向量。
4.根据权利要求1所述的一种海量数据问答系统设计方法,其特征在于,将用于表示用户问题句子文本内容信息的词向量利用文本相似度召回算法,快速的从问答对数据库中查找内容近似的问题的词向量形成近似问题的向量集合的步骤具体包括:
随机生成与用于表示用户问题句子文本内容信息的词向量同维的映射向量;
将用于表示用户问题句子文本内容信息的词向量与随机生成的映射向量点乘生成一维空间值;
将一维空间值相等的问题的词向量形成近似问题的向量集合。
5.根据权利要求4所述的一种海量数据问答系统设计方法,其特征在于,将用于表示用户问题句子文本内容信息的词向量与随机生成的映射向量点乘生成一维空间值的步骤具体包括:
v是高维空间中的k维词向量,x是随机生成的k维映射向量,则内积操作将v映射到一维空间,生成一个数值h(v);
h(v)=v·x
当生成的一维空间值h(v)为非整数时,对h(v)进行取整处理,公式如下:
w:分桶的宽度
...
【专利技术属性】
技术研发人员:赵旭东,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。