【技术实现步骤摘要】
答案获取方法、装置、计算机设备和存储介质
[0001]本申请涉及软件
,特别是涉及一种答案获取方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着人工智能的普及,出现了用于对问句获取对应答案的问答系统。问答系统一般是预先将积累的无序语料信息,进行有序和科学的整理,得到包含答案信息的资料库或者答案库。使用问答系统来获取问句的答案,可有效节约人力资源、提高信息处理的自动性、降低运行成本。
[0003]但是,由于问答系统是建立在对应的资料库上的,因此,问答系统和资料库是相互绑定的,用户在使用问答系统时,当问答系统所绑定的资料库与用户需求不匹配的情况下,经常得不到预期的答复。比如,用户的问句为“GDP增长速度表”,由于用户所使用的问答系统的资料库是文字内容,只推送了一段文字,导致用户得不到满意的答案。因此,传统上的问答系统的使用是不够灵活方便的。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高灵活性的答案获取方法、装置、计算机设备、存储介质和计算机程序产品。 >[0005]第一方本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种答案获取方法,其特征在于,所述方法包括:确定待处理问句的问句向量;使用所述问句向量在资料描述向量集合中进行向量检索,得到与所述问句向量匹配的资料描述向量;所述资料描述向量集合中包括多个候选的资料描述信息对应的资料描述向量;所述多个候选的资料描述信息所描述的资料中具有至少两种资料类型的资料;基于匹配到的资料描述向量确定目标资料;使用所述目标资料的资料类型对应的检索技术,从所述目标资料中检索针对所述待处理问句的答案。2.根据权利要求1所述的方法,其特征在于,所述资料描述向量集合中的资料描述向量是通过训练好的向量化模型对所述多个候选的资料描述信息分别进行向量转换生成的;所述确定待处理问句的问句向量包括:将所述待处理问句输入所述训练好的向量化模型进行向量转换处理,得到所述待处理问句的问句向量。3.根据权利要求2所述的方法,其特征在于,所述训练好的向量化模型是通过以下步骤训练得到的:获取训练样本集合;所述训练样本集合包括样本问句和对应的样本资料的资料描述信息;所述样本资料是包含所述样本问句的答案的资料;多个样本资料具有至少两种资料类型的资料;使用所述训练样本集合迭代训练所述向量化模型,直至得到所述训练好的向量化模型。4.根据权利要求1所述的方法,其特征在于,所述多个候选的资料描述信息所描述的资料中包括属于非文本类型的非文本资料;所述方法还包括:提取所述待处理问句的问句关键信息;使用所述问句关键信息在目标资料描述集合中进行文本匹配,得到与所述问句关键信息匹配的资料描述信息;所述目标资料描述集合是所述非文本资料的资料描述信息的集合;所述基于匹配到的资料描述向量确定目标资料包括:基于匹配到的资料描述信息和匹配到的资料描述向量确定目标资料。5.根据权利要求4所述的方法,其特征在于,所述多个候选的资料描述信息所描述的资料中还包括属于文本类型的多个文本资料;所述方法还包括:基于倒排索引的方式,从所述多个文本资料中,召回与所述待处理问句的相关性分数大于预设阈值的至少一个文本资料;所述基于匹配到的资料描述信息和匹配到的资料描述向量确定目标资料包括:基于所述至少一个文本资料、匹配到的资料描述信息和匹配到的资料描述向量确定目标资料。6.根据权利要求5所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:潘晟锋,文博,刘云峰,
申请(专利权)人:深圳追一科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。