一种知识问答方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39412649 阅读:9 留言:0更新日期:2023-11-19 16:04
本申请实施例提供一种知识问答方法、装置、电子设备及存储介质,其中,该方法包括:获取问题数据;对所述问题数据进行命名实体识别,得到所述问题数据的初始实体;对所述初始实体进行排序,得到候选实体;对所述初始实体进行区分,得到问题类型;根据所述候选实体和所述问题类型在预先构建的知识图谱中进行召回,得到路径实体;将所述路径实体和关系数据进行拼接,得到答案数据。实施本申请实施例,可以实现智能化的知识问答,提高答案的准确性和答案与问题的匹配度,减少在进行问题检索时产生的巨大计算量,无需人工回复,减少工作量,降低成本。低成本。低成本。

【技术实现步骤摘要】
一种知识问答方法、装置、电子设备及存储介质


[0001]本申请涉及知识图谱
,具体而言,涉及一种知识问答方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,金融行业对于基于知识图谱的智能问答是热门研究方向,智能知识问答可以帮助金融行业解决多种问题,提高工作效率,目前有基于信息检索和基于语义解析的两大主要方法。基于信息检索是先解析出问题的实体,再从知识图谱中查询出实体关联的多个三元组,组成子图路径,之后分别对问句和子图路径编码、排序,返回分数最高的路径作为答案,该方法能端到端实现,但是,这种方法需要标注大量的自然语言逻辑表达式。
[0003]目前,现有技术在处理基于信息检索方法的智能问答时,主要集中在处理实体识别、关系识别、以及路径排序问题上,这种方式计算量巨大、计算效率低下,无法快速地、准确地实现知识问答。

技术实现思路

[0004]本申请实施例的目的在于提供一种知识问答方法、装置、电子设备及存储介质,可以实现智能化的知识问答,提高答案的准确性和答案与问题的匹配度,减少在进行问题检索时产生的巨大计算量,无需人工回复,减少工作量,降低成本。
[0005]第一方面,本申请实施例提供了一种知识问答方法,所述方法包括:
[0006]获取问题数据;
[0007]对所述问题数据进行命名实体识别,得到所述问题数据的初始实体;
[0008]对所述初始实体进行排序,得到候选实体;
[0009]对所述初始实体进行区分,得到问题类型;
[0010]根据所述候选实体和所述问题类型在预先构建的知识图谱中进行召回,得到路径实体;
[0011]将所述路径实体和关系数据进行拼接,得到答案数据。
[0012]在上述实现过程中,通过提取问题数据中的实体,再将路径实体和关系数据进行拼接,得到答案数据,可以实现智能化的知识问答,提高答案的准确性和答案与问题的匹配度,减少在进行问题检索时产生的巨大计算量,无需人工回复,减少工作量,降低成本。
[0013]进一步地,所述对所述初始实体进行排序,得到候选实体的步骤,包括:
[0014]获取关系数据;
[0015]将所述初始实体与所述关系数据进行拼接,得到拼接结果;
[0016]根据所述拼接结果得到所述候选实体。
[0017]在上述实现过程中,根据关系数据和初始实体进行拼接,使得到的候选实体可以包含关系数据在内,使得候选实体更加准确,便于得到更准确的答案数据。
[0018]进一步地,所述根据所述拼接结果得到所述候选实体的步骤,包括:
[0019]根据RoBERTa模型对所述拼接结果和所述问题数据进行相似度判断,得到相似度得分;
[0020]根据所述相似度得分对所述初始实体从小到大进行排序,得到排序后的初始实体;
[0021]根据排序阈值选取所述排序后的初始实体,得到所述候选实体。
[0022]在上述实现过程中,根据拼接结果和问题数据进行相似度判断,得到相似度得分,再根据相似度得分对初始实体进行排序,确保得到的候选实体为相似度最高的,能够减小拼接过程中产生的误差。
[0023]进一步地,所述对所述初始实体进行区分,得到问题类型的步骤,包括:
[0024]获取所述初始实体的实体数量;
[0025]根据所述实体数量对所述初始实体进行区分,得到所述问题类型。
[0026]在上述实现过程中,根据实体数量对初始实体进行区分,得到问题类型,便于后续根据问题类型对知识图谱进行召回,可以提高召回效率,提高问题与答案的匹配程度。
[0027]进一步地,所述将所述路径实体和关系数据进行拼接,得到答案数据的步骤,包括:
[0028]获取候选路径的召回类型;
[0029]根据所述召回类型对所述路径实体和所述关系数据进行拼接,得到候选路径;
[0030]根据所述候选路径获得所述答案数据。
[0031]在上述实现过程中,根据候选路径的召回类型对路径实体和关系数据进行拼接,确保拼接得到的答案数据完全符合在知识图谱中进行召回时的召回类型,使得答案数据更加接近问题数据。
[0032]进一步地,所述根据所述候选路径获得所述答案数据的步骤,包括:
[0033]获得所述候选路径的相似度得分;
[0034]将所述相似度得分最高的候选路径作为目标路径;
[0035]将所述目标路径数据所述知识图谱进行检索,得到所述答案数据。
[0036]在上述实现过程中,根据相似度得分选取目标路径,减少了根据目标路径获得答案数据的误差,提高了答案数据的实用性和准确率,便于在知识图谱中进行检索。
[0037]进一步地,在所述将所述路径实体和关系数据进行拼接,得到答案数据的步骤之后,还包括:
[0038]对所述答案数据进行矫正,得到矫正后的答案数据。
[0039]在上述实现过程中,对问题数据进行校正,使得答案数据更加准确,能有效提高问题数据与答案数据的匹配程度。
[0040]第二方面,本申请实施例还提供了一种知识问答装置,所述装置包括:
[0041]获取模块,用于获取问题数据;
[0042]识别模块,用于对所述问题数据进行命名实体识别,得到所述问题数据的初始实体;
[0043]排序模块,用于对所述初始实体进行排序,得到候选实体;
[0044]区分模块,用于对所述初始实体进行区分,得到问题类型;
[0045]召回模块,用于根据所述候选实体和所述问题类型在预先构建的知识图谱中进行
召回,得到路径实体;
[0046]拼接模块,用于将所述路径实体和关系数据进行拼接,得到答案数据。
[0047]在上述实现过程中,通过提取问题数据中的实体,再将路径实体和关系数据进行拼接,得到答案数据,可以实现智能化的知识问答,提高答案的准确性和答案与问题的匹配度,减少在进行问题检索时产生的巨大计算量,无需人工回复,减少工作量,降低成本。
[0048]第三方面,本申请实施例提供的一种电子设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的方法的步骤。
[0049]第四方面,本申请实施例提供的一种计算机可读存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如第一方面任一项所述的方法。
[0050]第五方面,本申请实施例提供的一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行如第一方面任一项所述的方法。
[0051]本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
[0052]并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。
附图说明
[0053]为了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识问答方法,其特征在于,所述方法包括:获取问题数据;对所述问题数据进行命名实体识别,得到所述问题数据的初始实体;对所述初始实体进行排序,得到候选实体;对所述初始实体进行区分,得到问题类型;根据所述候选实体和所述问题类型在预先构建的知识图谱中进行召回,得到路径实体;将所述路径实体和关系数据进行拼接,得到答案数据。2.根据权利要求1所述的知识问答方法,其特征在于,所述对所述初始实体进行排序,得到候选实体的步骤,包括:获取关系数据;将所述初始实体与所述关系数据进行拼接,得到拼接结果;根据所述拼接结果得到所述候选实体。3.根据权利要求2所述的知识问答方法,其特征在于,所述根据所述拼接结果得到所述候选实体的步骤,包括:根据RoBERTa模型对所述拼接结果和所述问题数据进行相似度判断,得到相似度得分;根据所述相似度得分对所述初始实体从小到大进行排序,得到排序后的初始实体;根据排序阈值选取所述排序后的初始实体,得到所述候选实体。4.根据权利要求1所述的知识问答方法,其特征在于,所述对所述初始实体进行区分,得到问题类型的步骤,包括:获取所述初始实体的实体数量;根据所述实体数量对所述初始实体进行区分,得到所述问题类型。5.根据权利要求1所述的知识问答方法,其特征在于,所述将所述路径实体和关系数据进行拼接,得到答案数据的步骤,包括:获取候选路径的召回类型;根据所述召回类型对所述路径实体和所述关系...

【专利技术属性】
技术研发人员:刘志强田鸥张恒张玉霞余雨竹
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1