一种细粒度问答场景下的问答数据生成方法、设备及介质技术

技术编号:40037330 阅读:28 留言:0更新日期:2024-01-16 19:10
本发明专利技术公开了一种细粒度问答场景下的问答数据生成方法、设备及介质,属于智能问答技术领域,用于解决现有业务知识点中细分知识点缺乏对大量细节知识点的问答转化,导致现有的问答模型,难以回答有关细粒度知识点问题的技术问题。方法包括:根据业务知识点中的实体类型,对每个实体类型进行属性定义,构建出有关实体类型的实体模板;对实体类型以及对应的属性进行有关问题条件的属性限定,确定出问题模板;对实体类型以及对应的属性进行有关答案条件的属性限定,确定出答案模板;将问题模板与答案模板进行映射关联,得到问答映射关系;基于问答映射关系,将实体模板、问题模板以及答案模板进行有关问答逻辑算法的实例化组合,得到问答结果文件。

【技术实现步骤摘要】

本申请涉及智能问答,尤其涉及一种细粒度问答场景下的问答数据生成方法、设备及介质


技术介绍

1、随着以chatgpt为典型的大语言模型技术的出现,智能问答系统出现了实质性的技术突破,并在各个垂直领域快速的应用落地。对于很多企业而言,构建垂直领域的智能问答系统是其重要业务之一。由于企业拥有垂直领域的大量业务知识,往往需要将其业务知识转换为问答数据的形式,并对开源的大语言模型进行微调训练,才能构建满足该企业业务需求的智能问答系统。在将业务知识转换为问答数据的过程中,会按照知识点逐一转换为问答数据,这是一个人工转换过程。

2、然而对于很多业务知识点,其内部可能仍然蕴含大量细节知识。如果对其中的每个细分知识点也转换为问答形式,则将要消耗大量的人工,不太现实。另一方面,受限于当今可用的开源大语言模型的能力,当缺失这些细粒度问答训练数据时,训练出的模型往往难以回答相应的细粒度问题。即用户问题涉及到细粒度知识点,则智能问答系统的回答一般无法让用户满意。


技术实现思路

1、本申请实施例提供了一种细粒度问答场景下的本文档来自技高网...

【技术保护点】

1.一种细粒度问答场景下的问答数据生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种细粒度问答场景下的问答数据生成方法,其特征在于,根据业务知识点中的实体类型,对每个实体类型进行属性定义,构建出有关所述实体类型的实体模板,具体包括:

3.根据权利要求1所述的一种细粒度问答场景下的问答数据生成方法,其特征在于,对所述实体类型以及对应的属性进行有关问题条件的属性限定,确定出问题模板,具体包括:

4.根据权利要求3所述的一种细粒度问答场景下的问答数据生成方法,其特征在于,对所述实体类型以及对应的属性进行有关答案条件的属性限定,确定出答案模板,...

【技术特征摘要】

1.一种细粒度问答场景下的问答数据生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种细粒度问答场景下的问答数据生成方法,其特征在于,根据业务知识点中的实体类型,对每个实体类型进行属性定义,构建出有关所述实体类型的实体模板,具体包括:

3.根据权利要求1所述的一种细粒度问答场景下的问答数据生成方法,其特征在于,对所述实体类型以及对应的属性进行有关问题条件的属性限定,确定出问题模板,具体包括:

4.根据权利要求3所述的一种细粒度问答场景下的问答数据生成方法,其特征在于,对所述实体类型以及对应的属性进行有关答案条件的属性限定,确定出答案模板,具体包括:

5.根据权利要求1所述的一种细粒度问答场景下的问答数据生成方法,其特征在于,将所述问题模板与所述答案模板进行映射关联,得到问答映射关系,具体包括:

6.根据权利要求1所述的一种细粒度问答场景下的问答数据生成方法,其特征在于,在基于所述问...

【专利技术属性】
技术研发人员:刘通丁鑫闵万里田钿
申请(专利权)人:神思电子技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1