【技术实现步骤摘要】
基于语义相似度的问答方法、系统和可读存储介质
[0001]本专利技术涉及智能问答
,具体而言,涉及一种基于语义相似度的问答方法、系统和可读存储介质。
技术介绍
[0002]现有的问答系统,采用人工标注的方式构建问答语料库,再加以检索的方式完成问题的匹配。具体来讲,有以下缺点:
[0003]依赖语料库,须依照已有的语料库(<问题
‑
答案>映射关系)才可进行问答系统的构建;
[0004]耗费资源,需要多名行业专家花费一定的时间完成标注任务,以便形成语料库。同时还需要一套标注系统;
[0005]难以解决同一个问题的多种表达形式,用户的咨询意愿可以用多种文字表述,人工标注难以枚举所有提问方式,从而影响回复效果;
[0006]检索系统中的分词(尤其是领域词)、搜索(问句相似度计算)、召回(答案获取)等过程,都会影响问答系统最终的回复效果;
[0007]深度学习在问答系统中存在类别不均衡的问题。
技术实现思路
[0008]本专利技 ...
【技术保护点】
【技术特征摘要】
1.一种基于语义相似度的问答方法,其特征在于,包括:获取用户输入的问题信息,并确定所述问题信息对应的第一语义向量;将所述第一语义向量与问题答案所在文档的多个知识块中每个知识块对应的第二语义向量进行相似度计算,得到多个相似度;根据所述多个相似度确定符合预设条件的目标语义向量,并确定所述目标语义向量的向量ID;获取与所述向量ID对应的目录ID;根据所述目录ID确定所述问题答案在所述文档中的位置。2.根据权利要求1所述的基于语义相似度的问答方法,其特征在于,在获取用户输入的问题信息之前,还包括:获取所述文档;根据所述文档确定所述文档的多个标题,并对所述多个标题进行编号,得到与所述多个标题对应的多个目录ID;根据所述多个标题对所述文档进行知识块划分,得到与所述多个目录ID对应的多个知识块。3.根据权利要求2所述的基于语义相似度的问答方法,其特征在于,所述对所述多个标题进行编号,得到与所述多个标题对应的多个目录ID的步骤,具体包括:根据所述多个标题中每个标题的级别及所述每个标题在所述文档中出现的顺序对所述每个标题进行编号,得到所述多个标题对应的多个目录ID。4.根据权利要求2所述的基于语义相似度的问答方法,其特征在于,还包括:确定所述多个知识块对应的多个第二语义向量;将所述多个目录ID和所述多个知识块对应的多个第二语义向量一一对应存储。5.根据权利要求4所述的基于语义相似度的问答方法,其特征在于,还包括:获取所述多个第二语...
【专利技术属性】
技术研发人员:薛会萍,
申请(专利权)人:用友网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。