电子装置、问题识别确认方法和计算机可读存储介质制造方法及图纸

技术编号:17162127 阅读:25 留言:0更新日期:2018-02-01 20:24
本发明专利技术公开一种电子装置、问题识别确认方法和计算机可读存储介质,其中,该方法包括:接收用户发出的问题语音,对接收的问题语音进行语音识别,生成问题文本;对生成的问题文本按照预先确定的分词规则进行分词处理,获得所述问题文本对应的分词;若获得的分词中含有预先确定的特征词,则根据特征词与问题之间的概率分布,确定该预先确定的特征词对应的最大概率的问题,并根据预先确定的问题与答案之间的映射关系,确定该最大概率的问题对应的答案;将确定的答案反馈给用户。本发明专利技术技术方案提升了智能客服机器人、智能客服应答系统反馈给用户的答案的准确性。

Electronic device, problem recognition and confirmation method and computer readable storage medium

【技术实现步骤摘要】
电子装置、问题识别确认方法和计算机可读存储介质
本专利技术涉及智能语音
,特别涉及一种电子装置、问题识别确认方法和计算机可读存储介质。
技术介绍
目前,为了有效降低客户服务的等待状况、提升服务质量、提高客户服务的便捷性,很多服务型的公司(例如,移动运用商、保险公司、金融机构等)采用了线下智能客服机器人(例如,实体办公区域内设置的智能客服机器人)及/或线上智能客服应答系统(例如,智能语音应答系统)为客户进行服务。这类线下智能客服机器人及/或线上智能客服应答系统通常采用的现有方案是:预先配置标准问题与标准答案的映射关系数据;当接收到客户提出的标准问题后,根据预先配置的标准问题与标准答案的映射关系数据,确定出接收的标准问题对应的标准答案,并将确定出的标准答案反馈给客户。对于用户提出的非标准问题,这种现有方案将难以予以答案反馈。虽然,目前市面上存在一种解决非标准问题的改进方案:当无法找到非标准问题对应的答案时,将非标准问题与各个标准问题进行相似度计算,并将最大相似度的标准问题对应的标准答案作为非标准问题对应的答案进行反馈。但是,由于大多数情况下,非标准问题与标准问题之间的相似度都是因为一些与语句含义无关的字(例如,“的”、“吗”)而产生,因此,这种改进方案的准确性很低,经常出错,造成答非所问。
技术实现思路
本专利技术的主要目的是提供一种问题识别确认方法,旨在提升智能客服系统对非标准问题识别确认的准确性,从而提升针对非标准问题的反馈答案的准确性。为实现上述目的,本专利技术提出的电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的问题识别确认系统,所述问题识别确认系统被所述处理器执行时实现如下步骤:S1、接收用户发出的问题语音,对接收的问题语音进行语音识别,生成问题文本;S2、对生成的问题文本按照预先确定的分词规则进行分词处理,获得所述问题文本对应的分词;S3、若获得的分词中含有预先确定的特征词,则根据特征词与问题之间的概率分布,确定该预先确定的特征词对应的最大概率的问题,并根据预先确定的问题与答案之间的映射关系,确定该最大概率的问题对应的答案;S4、将确定的答案反馈给用户。优选地,所述步骤S3替换为如下步骤:若获得的分词中含有预先确定的特征词,则根据特征词与问题之间的概率分布,确定该预先确定的特征词对应各个问题的概率;按照概率的从大到小的顺序为各个问题进行排序,确定出排序在前的预设数量的问题作为候选问题,并将确定的各个候选问题提供或者播报给用户进行选择;在用户选择了一个问题后,根据预先确定的问题与答案之间的映射关系,确定该问题对应的答案。优选地,所述预先确定的分词规则为长词优先分词规则。优选地,所述特征词与问题之间的概率分布按照如下步骤确定:在特征词与问题之间添加预设数量的隐含主题;获取待进行训练的问题文本,并对获取的问题文本分别进行分词处理,得到各个问题文本对应的分词;根据预先确定的隐含主题与特征词的映射关系,分别确定每个隐含主题含有的特征词的第一数量,分别确定每个特征词所属的隐含主题的第二数量,根据对应的第一数量和第二数量确定每个特征词对各个隐含主题的第一选择概率;根据预先确定的隐含主题与问题文本的映射关系,分别确定每个问题文本含有的隐含主题的第三数量,分别确定每个隐含主题所属的问题文本的第四数量,根据对应的第三数量和第四数量确定每个隐含主题对各个问题文本的第二选择概率;将对应的第一选择概率和第二选择概率代入预先确定的计算公式进行计算,计算出每个特征词对各个问题文本的第三选择概率,计算出的各个特征词分别对各个问题文本的第三选择概率即为特征词与问题之间的概率分布。优选地,所述预先确定的计算公式为:P3=P1*P2,其中,P1代表第一选择概率,P2代表第二选择概率,P3代表第三选择概率。本专利技术还提出一种问题识别确认方法,其特征在于,该方法包括步骤:S1、接收用户发出的问题语音,对接收的问题语音进行语音识别,生成问题文本;S2、对生成的问题文本按照预先确定的分词规则进行分词处理,获得所述问题文本对应的分词;S3、若获得的分词中含有预先确定的特征词,则根据特征词与问题之间的概率分布,确定该预先确定的特征词对应的最大概率的问题,并根据预先确定的问题与答案之间的映射关系,确定该最大概率的问题对应的答案;S4、将确定的答案反馈给用户。优选地,所述步骤S3替换为如下步骤:若获得的分词中含有预先确定的特征词,则根据特征词与问题之间的概率分布,确定该预先确定的特征词对应各个问题的概率;按照概率的从大到小的顺序为各个问题进行排序,确定出排序在前的预设数量的问题作为候选问题,并将确定的各个候选问题提供或者播报给用户进行选择;在用户选择了一个问题后,根据预先确定的问题与答案之间的映射关系,确定该问题对应的答案。优选地,所述预先确定的分词规则为长词优先分词规则。优选地,所述特征词与问题之间的概率分布按照如下步骤确定:在特征词与问题之间添加预设数量的隐含主题;获取待进行训练的问题文本,并对获取的问题文本分别进行分词处理,得到各个问题文本对应的分词;根据预先确定的隐含主题与特征词的映射关系,分别确定每个隐含主题含有的特征词的第一数量,分别确定每个特征词所属的隐含主题的第二数量,根据对应的第一数量和第二数量确定每个特征词对各个隐含主题的第一选择概率;根据预先确定的隐含主题与问题文本的映射关系,分别确定每个问题文本含有的隐含主题的第三数量,分别确定每个隐含主题所属的问题文本的第四数量,根据对应的第三数量和第四数量确定每个隐含主题对各个问题文本的第二选择概率;将对应的第一选择概率和第二选择概率代入预先确定的计算公式进行计算,计算出每个特征词对各个问题文本的第三选择概率,计算出的各个特征词分别对各个问题文本的第三选择概率即为特征词与问题之间的概率分布。本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质存储有问题识别确认系统,所述问题识别确认系统可被至少一个处理器执行,以使所述至少一个处理器执行上述任一项所述的问题识别确认方法。本专利技术技术方案通过将用户的问题语音识别成问题文本后,对问题文本进行分词,获取分词结果中含有的能够反映用户问题的主题或语义方向的特征词,并按特征词与问题之间的概率分布,从而找出最大概率的问题(即最可能的问题),继而确定最大概率的问题对应的答案,以反馈给用户;由于本技术方案中,特征词能够反映用户问题的主题或语义方向,通过特征词对应的最大概率的问题所找到的相应答案,因此,相较于现有技术采取将整个问题与标准问题进行相似度比较,以获得最相似问题对应的答案的方式而言,本案反馈给用户的答案的准确性显著提高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1为本专利技术问题识别确认方法一实施例的流程示意图;图2为本专利技术问题识别确认方法二实施例的流程示意图;图3为本专利技术问题识别确认方法中确定特征词与问题之间的概率分布的流程示意图;图4为本专利技术问题识别确认系统较佳实施例的运行环境示意图;图5为本本文档来自技高网...
电子装置、问题识别确认方法和计算机可读存储介质

【技术保护点】
一种电子装置,其特征在于,所述电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的问题识别确认系统,所述问题识别确认系统被所述处理器执行时实现如下步骤:S1、接收用户发出的问题语音,对接收的问题语音进行语音识别,生成问题文本;S2、对生成的问题文本按照预先确定的分词规则进行分词处理,获得所述问题文本对应的分词;S3、若获得的分词中含有预先确定的特征词,则根据特征词与问题之间的概率分布,确定该预先确定的特征词对应的最大概率的问题,并根据预先确定的问题与答案之间的映射关系,确定该最大概率的问题对应的答案;S4、将确定的答案反馈给用户。

【技术特征摘要】
1.一种电子装置,其特征在于,所述电子装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的问题识别确认系统,所述问题识别确认系统被所述处理器执行时实现如下步骤:S1、接收用户发出的问题语音,对接收的问题语音进行语音识别,生成问题文本;S2、对生成的问题文本按照预先确定的分词规则进行分词处理,获得所述问题文本对应的分词;S3、若获得的分词中含有预先确定的特征词,则根据特征词与问题之间的概率分布,确定该预先确定的特征词对应的最大概率的问题,并根据预先确定的问题与答案之间的映射关系,确定该最大概率的问题对应的答案;S4、将确定的答案反馈给用户。2.如权利要求1所述的电子装置,其特征在于,所述步骤S3替换为如下步骤:若获得的分词中含有预先确定的特征词,则根据特征词与问题之间的概率分布,确定该预先确定的特征词对应各个问题的概率;按照概率的从大到小的顺序为各个问题进行排序,确定出排序在前的预设数量的问题作为候选问题,并将确定的各个候选问题提供或者播报给用户进行选择;在用户选择了一个问题后,根据预先确定的问题与答案之间的映射关系,确定该问题对应的答案。3.如权利要求1所述的电子装置,其特征在于,所述预先确定的分词规则为长词优先分词规则。4.如权利要求1-3中任意一项所述的电子装置,其特征在于,所述特征词与问题之间的概率分布按照如下步骤确定:在特征词与问题之间添加预设数量的隐含主题;获取待进行训练的问题文本,并对获取的问题文本分别进行分词处理,得到各个问题文本对应的分词;根据预先确定的隐含主题与特征词的映射关系,分别确定每个隐含主题含有的特征词的第一数量,分别确定每个特征词所属的隐含主题的第二数量,根据对应的第一数量和第二数量确定每个特征词对各个隐含主题的第一选择概率;根据预先确定的隐含主题与问题文本的映射关系,分别确定每个问题文本含有的隐含主题的第三数量,分别确定每个隐含主题所属的问题文本的第四数量,根据对应的第三数量和第四数量确定每个隐含主题对各个问题文本的第二选择概率;将对应的第一选择概率和第二选择概率代入预先确定的计算公式进行计算,计算出每个特征词对各个问题文本的第三选择概率,计算出的各个特征词分别对各个问题文本的第三选择概率即为特征词与问题之间的概率分布。5.如权利要求4所述的电子装置,其特征在于,所述预先确定的计算公式为:P3=P1*P2,其中,P1代表第一选择概率,P2代表第二选择概率...

【专利技术属性】
技术研发人员:王健宗韩茂琨肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1