【技术实现步骤摘要】
基于语义训练算法的人工智能问答方法
[0001]本专利技术涉及人工智能技术,尤其是基于语义训练算法的人工智能问答方法。
技术介绍
[0002]自然语言处理是对人类用于进行信息传播的媒介如语言、文字等进行处理的一种科学研究,它的英文名称是Natural Language Processing,简称NLP,是属于当下非常热门的人工智能中的一个重要领域,对话系统则是NLP中的一个十分重要的研究方向,主要研究如何能使计算机具备与人交互的智能思维,是人工智能的一项重要工作,同时也是一项极具挑战的任务。在1950年,图灵通过《计算机与智能》一文发表了一种对计算机系统的评价方式,名叫“图灵测试”,空前绝后地为计算机智能提供了明确的目标方向,就是通过人机对话的方式来表现计算机的智能化水平,引发了学者们的广泛关注。当前对话系统主要有问答系统,帮助用户对问题进行回答;任务导向型对话系统,主要是在指定的场景任务下为用户提供相应的操作提示等;问答系统主要是通过对用户输入的问题进行处理,根据输入分析出问题关键内容,通过在候选的已有问答中寻找和生成回答 ...
【技术保护点】
【技术特征摘要】
1.基于语义训练算法的人工智能问答方法,其特征在于:包括如下步骤:S1.1:采集语料数据;S1.2:对采集的语料数据进行数据预处理;S1.3:基于采集的语料数据构建语义训练模型;S1.4:对构建的语义训练模型进行模型优化训练。2.根据权利要求1所述的基于语义训练算法的人工智能问答方法,其特征在于:所述S1.2中,对采集的语料数据进行错误检测修正处理和脱敏处理。3.根据权利要求1所述的基于语义训练算法的人工智能问答方法,其特征在于:所述S1.3中,对输入的语料数据进行定义,定义输入为其中,m表示对话的总轮次,i∈[1,m]表示对话的第i轮次,u
i
表示第i轮次所回复的话语,定义n
i
是第i轮次的所回复的话语的长度,表示第i轮次话语中所回复的话语的第j个字符,j∈[1,n
i
]。4.根据权利要求3所述的基于语义训练算法的人工智能问答方法,其特征在于:所述S1.3中,语义训练模型的输入包括token编码、片段编码和位置编码,将token编码与片段编码、位置编码的相加作为输入,其中,token编码为对应的字符嵌入表为E
t
,表示词片段编码为对应的片段嵌入表为E
s
,S表示最大片段数量,位置编码为对应的位置嵌入表为N表示整个对话的序列长度,即其中,m表示对话的总轮次,i∈[1,m]表示对话的第i轮次,n
i
是第i轮次所回复的话语长度,得到语义训练模型总输入为:其中,e
ij
为语义训练模型的输入,每个位置对应的嵌入向量;i∈[1,m],j∈[1,n
i
];经过提取,得到:E
ij
=transformer(e
ij
)其中,E
ij
表示序列每个字符的输出向量。5.根据权利要求4所述的基于语义训练算法的人工智能问答方法,其特征在于:通过...
【专利技术属性】
技术研发人员:徐杭,
申请(专利权)人:南京百珏科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。