问题信息的生成方法、装置、计算机设备及其存储介质制造方法及图纸

技术编号:22330342 阅读:36 留言:0更新日期:2019-10-19 12:19
本申请为语言数据处理技术领域,本申请提供一种问题信息的生成方法和装置,所述方法包括根据问题测评请求,获取该请求所对应的业务类型,并从该业务类型对应的候选问题库中选择第一问题信息进行输出,并获取基于用户输入的所述第一问题信息对应的应答信息;将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息,其中,对历史的问题信息和应答信息进行训练得到所述问题识别模型;将所述第二问题信息作为所述第一问题信息的下一个问题信息进行输出。该方法有利于提高问答测评项目的准确性。

Generation method, device, computer equipment and storage medium of problem information

【技术实现步骤摘要】
问题信息的生成方法、装置、计算机设备及其存储介质
本申请涉及语言数据处理
,具体而言,本申请涉及一种问题信息的生成方法、装置、计算机设备及其存储介质。
技术介绍
在很多场景中,都会使用问答,比如在金融行业(比如贷款),为了控制风险,风控人员往往会向申请者提出问题,并且根据申请者的回答提出下一个问题,如此往复,从而判断可能存在的风险。现有技术中,利用终端设备录入所有问题,形成一个问题库,存放需要进行提问的所有问题信息,然后使用者通过预设的方式生成下一个问题并进行输出,这种方式不能灵活根据实际的回答情况设定下一个问题,容易脱离实际的情况,难以符合客观性,因此,用于判断风险的准确性偏低。
技术实现思路
为克服以上技术问题,特别是现有技术中只能按照预设的方式生成下一个问题,造成可能脱离实际的情况下得到下一个问题信息,特提出以下技术方案:第一方面,本申请提供一种问题信息的生成方法,其包括以下步骤:根据问题测评请求,获取该请求所对应的业务类型,并从该业务类型对应的候选问题库中选择第一问题信息进行输出,并获取基于用户输入的所述第一问题信息对应的应答信息;将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息,其中,对历史的问题信息和应答信息进行训练得到所述问题识别模型;将所述第二问题信息作为所述第一问题信息的下一个问题信息进行输出。在其中一个实施例中,对历史的问题信息和应答信息进行训练得到所述问题识别模型,包括:建立关于问题信息与对应的应答信息的历史数据库;对所述历史数据库中的问题信息与对应的应答信息形成样本问答序列;对所述样本问答序列进行向量化,得到样本问答向量序列;利用所述样本问答向量序列进行训练,生成所述问题识别模型。在其中一个实施例中,在所述对所述样本问答序列进行向量化的步骤之前,还包括:对历史数据库的问题信息与对应的应答信息进行分词得到第一分词结果。在其中一个实施例中,所述对所述样本问答序列进行向量化,得到样本问答向量序列的步骤包括:利用词向量模型对所述第一分词结果进行向量化,得到历史数据库中的问题信息的特征向量和对应的应答信息的特征向量;将历史数据库中的问题信息的特征向量和对应的应答信息的特征向量进行组合以形成样本问答向量序列。在其中一个实施例中,将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息的步骤之前,还包括:对所述候选问题库中的每个问题信息进行分词,得到第二分词结果;利用词向量生成器对所述第二分词结果进行向量化,得到每个问题信息的第一特征向量。在其中一个实施例中,将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息的步骤,包括:将所述第一问题信息和对应的应答信息形成问答序列;对所述问答序列进行向量化得到问答向量序列,并将所述问答向量序列输入至所述问题识别模型,得到第二特征向量;分别计算所述第二特征向量与每个问题信息的第一特征向量的余弦相似度,以得到多个余弦相似度值;将所述余弦相似度值中的最大值对应的第一特征向量的问题信息作为第二问题信息。在其中一个实施例中,所述第一问题信息和对应的应答信息包括若干个第一问题子信息和对应的应答子信息;所述将所述第一问题信息和对应的应答信息输入问题识别模型的步骤包括:从若干个第一问题子信息和对应的应答子信息中获取预设个数的所述第一问题子信息和对应的应答子信息输入至所述问题识别模型。第二方面,本申请还提供一种问题信息的生成装置,其包括:获取模块,用于根据问题测评请求,获取该请求所对应的业务类型,并从该业务类型对应的候选问题库中选择第一问题信息进行输出,并获取基于用户输入的所述第一问题信息对应的应答信息;预测模块,用于将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息,其中,对历史的问题信息和应答信息进行训练得到所述问题识别模型;输出模块,用于将所述第二问题信息作为所述第一问题信息的下一个问题信息进行输出。第三方面,本申请还提供一种计算机设备,其包括:一个或多个处理器;存储器;一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于执行上述实施例所述的问题信息的生成方法。第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例所述的问题信息的生成方法。本申请所提供的一种问题信息的生成方法、装置、计算机设备及其存储介质,其是根据测评请求所属的业务类型,从候选问题库中选择输出第一问题信息,获取测评对象对该第一问题信息的应答信息,并输入至所述问题识别模型进行预测,得到对应的第二问题信息并向测评对象进行进一步提问。该方法可以利用所述问题识别模型对所述测评对象的对问题信息和其应答进行分析,使得相应地问答测评项目可以减少对测评人员经验的依赖度,也有助于减少人为错误的情况,从而提高问答测评项目的准确性。本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本申请中的一个实施例的问题信息的生成方法的流程图;图2是本申请中的一个实施例的构建问题识别模型的流程图;图3是本申请中的另一个实施例的构建问题识别模型的流程图;图4是本申请中的另一个实施例的问题信息的生成方法的流程图;图5为本申请中的一个实施例的问题信息的生成装置的结构示意图;图6为本申请中的一个实施例的服务器的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化本文档来自技高网
...

【技术保护点】
1.一种问题信息的生成方法,其特征在于,包括以下步骤:根据问题测评请求,获取该请求所对应的业务类型,并从该业务类型对应的候选问题库中选择第一问题信息进行输出,并获取基于用户输入的所述第一问题信息对应的应答信息;将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息,其中,对历史的问题信息和应答信息进行训练得到所述问题识别模型;将所述第二问题信息作为所述第一问题信息的下一个问题信息进行输出。

【技术特征摘要】
1.一种问题信息的生成方法,其特征在于,包括以下步骤:根据问题测评请求,获取该请求所对应的业务类型,并从该业务类型对应的候选问题库中选择第一问题信息进行输出,并获取基于用户输入的所述第一问题信息对应的应答信息;将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息,其中,对历史的问题信息和应答信息进行训练得到所述问题识别模型;将所述第二问题信息作为所述第一问题信息的下一个问题信息进行输出。2.根据权利要求1所述的问题信息的生成方法,其特征在于,对历史的问题信息和应答信息进行训练得到所述问题识别模型,包括:建立关于问题信息与对应的应答信息的历史数据库;对所述历史数据库中的问题信息与对应的应答信息形成样本问答序列;对所述样本问答序列进行向量化,得到样本问答向量序列;利用所述样本问答向量序列进行训练,生成所述问题识别模型。3.根据权利要求2所述的问题信息的生成方法,其特征在于,在所述对所述样本问答序列进行向量化的步骤之前,还包括:对历史数据库的问题信息与对应的应答信息进行分词得到第一分词结果。4.根据权利要求3所述的问题信息的生成方法,其特征在于,所述对所述样本问答序列进行向量化,得到样本问答向量序列的步骤包括:利用词向量模型对所述第一分词结果进行向量化,得到历史数据库中的问题信息的特征向量和对应的应答信息的特征向量;将历史数据库中的问题信息的特征向量和对应的应答信息的特征向量进行组合以形成样本问答向量序列。5.根据权利要求4所述的问题信息的生成方法,其特征在于,将所述第一问题信息和对应的应答信息输入问题识别模型,利用所述问题识别模型对所述第一问题信息和对应的应答信息进行预测,以得到第二问题信息的步骤之前,还包括:对所述候选问题库中的每个问题信息进行分词,得到第二分词结果;利用词向量生成器对所述第二分词结果进行向量化,得到每个问题信息的第一特征向量。6.根据权利要求5所述的问题信息的生成方法,其特征在于...

【专利技术属性】
技术研发人员:戴磊
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1