基于制造技术

技术编号:39678358 阅读:7 留言:0更新日期:2023-12-11 18:55
本发明专利技术涉及人工智能技术领域,尤其涉及基于

【技术实现步骤摘要】
基于AI的智能问答方法及系统


[0001]本专利技术涉及人工智能
,尤其涉及基于
AI
的智能问答方法及系统


技术介绍

[0002]随着人工智能(
AI
)中自然语言处理技术的发展,问答系统已广泛应用于电商

金融

教育等众多行业

越来越多的人们习惯于在网络上寻求问题解答,用户每天提出的问题不仅数量多,还会出现很多描述方式不同但语义相同的问题,对这类问题重复进行解答会耗费大量的人力和物力

[0003]现有智能问答技术多以文本信息

语音信息交互,形式比较单一,无法准确获取用户意图,对于复杂的语句环境问答准确率低,影响用户体验感

传统的模型训练速度慢

计算量大

匹配精准度低,目前广泛使用深度神经网络来提取文本特征,常用的如
RNN、CNN

Transformer
等模型,其中
Transformer
具有更好的泛化性能,
BERT
等大型预训练神经网络模型被用于对话系统中的检索任务,但在生成任务上表现较差,而实现检索和生成模式的相结合更有助于提升问题答复的质量和效率,问答系统应该进一步提升对话生成的质量,提升数据利用率及加深对文本语义的理解


技术实现思路

[0004]为了解决上述技术问题,本专利技术提供了基于
AI
的智能问答方法及系统

[0005]本专利技术采用以下技术方案:基于
AI
的智能问答方法,所述方法包括:接收用户输入的问题;基于改进的
TextCNN
模型解析所述问题,得到所述问题的意图;基于改进的注意机制(
BiLSTM

Attention
)模型对所述问题进行实体识别,得到中间实体集合;对所述中间实体集合进行策略增强,并将增强后的所述中间实体集合与预先为业务场景构建的知识图谱进行关联,得到目标实体;根据所述目标实体及所述意图生成三元组查询条件,基于所述三元组查询条件从所述知识图谱中获取所述问题的答案;将所述答案返回给所述用户

[0006]本专利技术一实施例的基于
AI
的智能问答方法,通过改进的
TextCNN
模型能够识别理解复杂抽象的文本语义,提高了获取用户意图的准确率,根据改进的注意机制模型获取中间实体,保证了中间实体的准确率及召回率,得到的中间实体集合更全面,识别效果好;通过对中间实体集合进行策略增强,进一步提高了中间实体集合的全面性,然后将中间实体与知识图谱关联,为目标实体的获取提供有效的保证,最后根据目标实体及意图生成三元组查询条件,并基于三元组查询条件能够快速的从知识图谱中获取对应的答案,最终将答案反馈给用户,问答交互结果的质量及效率高,用户体验感好

[0007]进一步的,所述改进的
TextCNN
模型的算法步骤具体为:
输入训练文本及预训练的波动词嵌入,初始化卷积层的动态窗口

基本步幅

滤波器参数,设置识别率及迭代次数;把所述训练文本的文本语料映射为词袋模型嵌入,并与预训练的波动词嵌入进行向量计算得到目标波动词嵌入,将得到的所述目标波动词嵌入与随机初始化的波动嵌入进行拼接组成双通道词嵌入表征;通过对所述双通道词嵌入表征进行卷积操作,从而获取所述文本语料的文本特征,并使用预设的激活函数对所述文本特征进行初步划分,得到目标向量;在池化层采用最大值池化策略对所述目标向量进行降维操作,最后经过全连接层和归一化函数将降维后的所述目标向量转换为意图分类,确定所述文本语料的意图

[0008]进一步的,基于改进的注意机制模型对所述问题进行实体识别,得到中间实体集合的步骤具体为:输入训练文本

词典信息以及预训练的词向量表,通过预定义的样本数量对所述训练文本进行划分为多个样本,设置最大支持语句长度;把所述样本的语句映射到向量空间得到词袋模型嵌入,并与预训的所述词向量表进行向量计算得到初始词嵌入,在所述词典信息中对所述样本中的字进行逐个匹配并进行编码融合,直至得到当前所述样本的全部词嵌入表征;将所述词嵌入表征融入编码层,并根据最大支持语句长度对字数大于第一阈值的所述样本进行裁切,对字数小于第二阈值的所述样本进行修复,并得到对应的词段,将所述词段送入双向
LSTM
编码器中进行语义特征提取;基于解码层采用两个独立的多重感知机分别对每个所述词段的核心成分和依存成分进行解码,并计算出实体分类矩阵,最终再通过
argmax
函数得到所述实体分类矩阵中的实体的每个实体分类属性,得到附有实体分类属性的所述中间实体集合

[0009]进一步的,对所述中间实体集合进行策略增强的步骤具体为:获取所述问题的词句序列和所述中间实体集合的中间实体的实体名前缀序列,并基于当前时间步根据所述词句序列及所述实体名前缀序列计算得到当前时间步的词表概率分布;采用受限集束搜索算法生成第
n
个时间步的所有可能的中间字符,所述实体名前缀序列与所有的所述中间字符进行拼接,得到当前所有可能的中间实体序列;对于每一条中间路径,通过计算其和前一个时间步生成的所述实体名前缀序列与所述词句序列之间的覆盖度差值,来衡量其产生的覆盖度增益,所述覆盖度差值为:其中代表所述实体名前缀序列和所述词句序列的最长公共子串,为时间步为
n
的所述实体名前缀序列,
R
为所述词句序列,为时间步为
n
‑1的所述实体名前缀序列;基于所述覆盖度差值,对每个所述中间字符的生成概率进行调整,并对所有所述中间实体序列的概率进行重新归一化,得到新的词表概率分布,对新的所述词表概率分布进行解码,完成对所述中间实体集合的增强

[0010]进一步的,所述知识图谱的构建步骤具体为:
利用爬虫工具获取网页

业务数据库对应的数据信息,并将所述数据信息保存至本地;对获取的所述数据信息进行多次清洗,并对清洗后的所述数据信息抽取出相应的实体

关系以及属性信息,进而构建出知识的三元组数据;采取近义词词典

机器翻译

规则

语义嵌入四种方式对所述三元组数据进行同义数据增强;将增强后的所述三元组数据存入
Neo4j
图数据库,并生成知识图谱

[0011]本专利技术还提出基于
AI
的智能问答系统,所述系统包括:接收模块,用于接收用户输入的问题;解析模块,用于基于改进的
TextCNN
模型解析所述问题,得到所述问题的意图;识别模块,用于基于改进的注意机制(
BiLSTM
...

【技术保护点】

【技术特征摘要】
1.
基于
AI
的智能问答方法,其特征在于,所述方法包括:接收用户输入的问题;基于改进的
TextCNN
模型解析所述问题,得到所述问题的意图;基于改进的注意机制模型对所述问题进行实体识别,得到中间实体集合;对所述中间实体集合进行策略增强,并将增强后的所述中间实体集合与预先为业务场景构建的知识图谱进行关联,得到目标实体;根据所述目标实体及所述意图生成三元组查询条件,基于所述三元组查询条件从所述知识图谱中获取所述问题的答案;将所述答案返回给所述用户
。2.
根据权利要求1所述的基于
AI
的智能问答方法,其特征在于,所述改进的
TextCNN
模型的算法步骤具体为:输入训练文本及预训练的波动词嵌入,初始化卷积层的动态窗口

基本步幅

滤波器参数,设置识别率及迭代次数;把所述训练文本的文本语料映射为词袋模型嵌入,并与预训练的波动词嵌入进行向量计算得到目标波动词嵌入,将得到的所述目标波动词嵌入与随机初始化的波动嵌入进行拼接组成双通道词嵌入表征;通过对所述双通道词嵌入表征进行卷积操作,从而获取所述文本语料的文本特征,并使用预设的激活函数对所述文本特征进行初步划分,得到目标向量;在池化层采用最大值池化策略对所述目标向量进行降维操作,最后经过全连接层和归一化函数将降维后的所述目标向量转换为意图分类,确定所述文本语料的意图
。3.
根据权利要求1所述的基于
AI
的智能问答方法,其特征在于,基于改进的注意机制模型对所述问题进行实体识别,得到中间实体集合的步骤具体为:输入训练文本

词典信息以及预训练的词向量表,通过预定义的样本数量对所述训练文本进行划分为多个样本,设置最大支持语句长度;把所述样本的语句映射到向量空间得到词袋模型嵌入,并与预训的所述词向量表进行向量计算得到初始词嵌入,在所述词典信息中对所述样本中的字进行逐个匹配并进行编码融合,直至得到当前所述样本的全部词嵌入表征;将所述词嵌入表征融入编码层,并根据最大支持语句长度对字数大于第一阈值的所述样本进行裁切,对字数小于第二阈值的所述样本进行修复,并得到对应的词段,将所述词段送入双向
LSTM
编码器中进行语义特征提取;基于解码层采用两个独立的多重感知机分别对每个所述词段的核心成分和依存成分进行解码,并计算出实体分类矩阵,最终再通过
argmax
函数得到所述实体分类矩阵中的实体的每个实体分类属性,得到附有实体分类属性的所述中间实体集合
。4.
根据权利要求1所述的基于
AI
的智能问答方法,其特征在于,对所述中间实体集合进行策略增强的步骤具体为:获取所述问题的词句序列和所述中间实体集合的中间实体的实体名前缀序列,并基于当前时间步根据所述词句序列及所述实体名前缀序列计算得到当前时间步的词表概率分布;采用受限集束搜索算法生成第
n
个时间步的所有可能的中间字符,所述实体名前缀序
列与所有的所述中间字符进行拼接,得到当前所有可能的中间实体序列;对于每一条中间路径,通过计算其和前一个时间步生成的所述实体名前缀序列与所述词句序列之间的覆盖度差值,来衡量其产生的覆盖度增益,所述覆盖度差值为:其中代表所述实体名前缀序列和所述词句序列的最长公共子串,为时间步为
n
的所述实体名前缀序列,
R
为所述词句序列,为时间步为
n
‑1的所述实体名前缀序列;基于所述覆盖度差值,对每个所述中间字符的生成概率进行调整,并对所有所述中间实体序列的概率进行重新归一化,得到新的词表概率分布,对新的所述词表概率分布进行解码,完成对所述中间实体集合的增强
。5.
根据权利要求1所述的基于
AI
的智能问答方法,其特征在于,所述知识图谱的构建步骤具体为:利用爬虫工具获取网页

业务数据库对应的数据信息,并将所述数据信息保存至本地;对获取的所述数据信息进行多次清洗,并对清洗后的所述数据信息抽取出相应的实体

关系以及属性信息,进而构建出知识的三元组数据;采取近义词词典

机器翻译

规则

语义嵌入四种方式对所述三元组数据进行同义数据增强;将增强后的所述三元组数据存入
Neo4j
图数据库,并生成知识图...

【专利技术属性】
技术研发人员:李光辉李火亮穆阳
申请(专利权)人:江西拓世智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1