一种基于定制语料库的语音搜题方法及家教设备技术

技术编号:19388909 阅读:57 留言:0更新日期:2018-11-10 02:02
一种基于定制语料库的语音搜题方法及家教设备,包括:采集用户输入的语音信息,并确定用户的个人数据,以及确定与个人数据相匹配的目标语料库,该个人数据至少包括用户的当前年龄,该目标语料库包括当前年龄所属年龄段的用户群针对不同问题的不同语音问法;然后根据目标语料库对语音信息进行识别,以提取出语音信息所包含的目标问题,并搜索目标问题的目标答案,以及输出目标答案。实施本发明专利技术实施例,能够提高对学生的语音问题的识别准确率,进而提高了搜题准确率。

A method of voice search based on customized corpus and tutoring equipment

A voice search method based on customized corpus and tutoring equipment include: collecting voice information input by users, determining personal data of users, and determining target corpus matching personal data. The personal data includes at least the current age of users, and the target corpus includes the year of the current age. Users of different age groups have different voice question methods for different questions; then they recognize the voice information according to the target corpus to extract the target questions contained in the voice information, and search the target answers of the target questions, as well as output the target answers. The implementation of the embodiment of the present invention can improve the recognition accuracy of students'voice problems, thereby improving the search accuracy.

【技术实现步骤摘要】
一种基于定制语料库的语音搜题方法及家教设备
本专利技术涉及电子设备
,具体涉及一种基于定制语料库的语音搜题方法及家教设备。
技术介绍
对于大多数小学低年级学生而言,语文学科所包含的拼音、字、词、句等内容是他们学习的重点,同样也是难点,为此,他们常需要通过搜题的方式获取该学科的正确知识。然而,小学低年级阶段的学生对于文字的认知水平有限,许多文字都无法通过书写的方式表达,因此,只能通过语音输入的方式进行搜题。目前,市面上具有语音输入功能的搜题软件大多基于成人的语音识别系统,即其核心的语义识别功能的构建基础是成人的语言体系。当学生通过该搜题软件进行语音搜题时,由于不同年龄段尤其是小学低年级年龄段的学生的语言表达能力较弱,不能很好的表述其所遇到的问题,这造成该搜题软件无法准确识别学生输入的语音问题,导致了学生搜索的问题不能得到有效解决,搜题准确率低。
技术实现思路
本专利技术实施例公开一种基于定制语料库的语音搜题方法及家教设备,能够提高对学生的语音问题的识别准确率,进而提高了搜题准确率。本专利技术实施例第一方面公开了一种基于定制语料库的语音搜题方法,所述方法包括:采集用户输入的语音信息,并确定用户的个人数据,所述个人数据至少包括用户的当前年龄;确定与所述个人数据相匹配的目标语料库,所述目标语料库包括所述当前年龄所属年龄段的用户群针对不同问题的不同语音问法;根据所述目标语料库对所述语音信息进行识别,以提取出所述语音信息所包含的目标问题,并搜索所述目标问题的目标答案,以及输出所述目标答案。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述采集用户输入的语音信息之前,所述方法还包括:获取当前时间点和当前地点;判断所述当前时间点是否位于预设的学习时间段内;如果所述当前时间点位于所述学习时间段内,判断所述当前地点是否位于预设的学习地点集合中;如果所述当前地点位于所述学习地点集合中,执行所述的采集用户输入的语音信息。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述搜索所述目标问题的目标答案之后,所述方法还包括:获取所述目标答案对应的目标知识点,并确定所述目标知识点在所述当前年龄所属年龄段对应的目标难度等级;判断所述目标难度等级是否高于预设难度等级;如果所述目标难度等级高于所述预设难度等级,输出针对所述目标知识点的知识点解析,并执行所述的输出所述目标答案。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述输出所述目标答案之后,所述方法还包括:根据所述语音信息获取用户的声纹特征,并根据所述声纹特征调取用户在预设时间段内的语音搜题记录,不同声纹特征对应不同用户的语音搜题记录;获取所述语音搜题记录对应的所有已搜索题目以及每个所述已搜索题目对应的已搜索答案;判断所有所述已搜索答案中是否存在与所述目标知识点对应的至少一个目标已搜索答案;如果存在至少一个所述目标已搜索答案,标记所述目标知识点,并基于用户的个人记忆曲线在预设时间间隔内输出针对所述目标知识点的巩固题目供用户学习。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述方法还包括:根据所述语音搜题记录确定用户在所述预设时间段内的搜题频率;判断所述搜题频率是否高于平均搜题频率,所述平均搜题频率是根据所述当前年龄所属年龄段的用户群在所述预设时间段内的平均语音搜题记录确定的;如果所述搜题频率高于所述平均搜题频率,识别每个所述已搜索题目所对应的学科,并统计每个所述学科所对应的已搜索题目数量,从统计出的所有所述已搜索题目数量中确定最高已搜索题目数量并确定所述最高已搜索题目数量所对应的目标学科,以及获取用户针对所述目标学科的学习成绩;根据所述学习成绩以及所述最高已搜索题目数量与所有所述已搜索题目的数量比值,判断是否需要向用户对应的所有教师终端中与所述目标学科对应的目标教师终端发送辅导请求;当判断出需要发送所述辅导请求时,梳理所有所述已搜索题目中与所述目标学科所对应的目标已搜索题目所涉及的待辅导知识点,并向所述目标教师终端发送包括所述待辅导知识点的所述辅导请求,所述辅导请求用于请求所述目标教师终端的教师针对所述待辅导知识点对用户进行辅导。本专利技术实施例第二方面公开了一种家教设备,其特征在于,包括:采集单元,用于采集用户输入的语音信息;确定单元,用于确定用户的个人数据,以及确定与所述个人数据相匹配的目标语料库,所述个人数据至少包括用户的当前年龄,所述目标语料库包括所述当前年龄所属年龄段的用户群针对不同问题的不同语音问法;第一识别单元,用于根据所述目标语料库对所述语音信息进行识别,以提取出所述语音信息所包含的目标问题;搜索单元,用于搜索所述目标问题的目标答案;第一输出单元,用于输出所述目标答案。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述家教设备还包括:第一获取单元,用于获取当前时间点和当前地点;第一判断单元,用于判断所述当前时间点是否位于预设的学习时间段内,以及在判断出所述当前时间点位于所述学习时间段内时,判断所述当前地点是否位于预设的学习地点集合中;所述采集单元,具体用于在所述第一判断单元判断出所述当前地点位于所述学习地点集合中时,采集用户输入的所述语音信息。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述家教设备还包括:第二获取单元,用于在所述搜索单元搜索所述目标问题的目标答案之后,获取所述目标答案对应的目标知识点;所述确定单元,还用于确定所述目标知识点在所述当前年龄所属年龄段对应的目标难度等级;第二判断单元,用于判断所述目标难度等级是否高于预设难度等级;所述第一输出单元,具体用于在所述第二判断单元判断出所述目标难度等级高于所述预设难度等级时,输出针对所述目标知识点的知识点解析和所述目标答案。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述第二获取单元,还用于在所述第一输出单元输出所述目标答案之后,根据所述语音信息获取用户的声纹特征;所述家教设备还包括:调取单元,用于根据所述声纹特征调取用户在预设时间段内的语音搜题记录,不同声纹特征对应不同用户的语音搜题记录;所述第二获取单元,还用于获取所述语音搜题记录对应的所有已搜索题目以及每个所述已搜索题目对应的已搜索答案;所述第二判断单元,还用于判断所有所述已搜索答案中是否存在与所述目标知识点对应的至少一个目标已搜索答案;标记单元,用于在所述第二判断单元判断出存在至少一个所述目标已搜索答案时,标记所述目标知识点;第二输出单元,用于基于用户的个人记忆曲线在预设时间间隔内输出针对所述目标知识点的巩固题目供用户学习。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述确定单元,还用于根据所述语音搜题记录确定用户在所述预设时间段内的搜题频率;所述第二判断单元,还用于判断所述搜题频率是否高于平均搜题频率,所述平均搜题频率是根据所述当前年龄所属年龄段的用户群在所述预设时间段内的平均语音搜题记录确定的;所述家教设备还包括:第二识别单元,用于在所述第二判断单元判断出所述搜题频率高于所述平均搜题频率时,识别每个所述已搜索题目所对应的学科;统计单元,用于统计每个所述学科所对应的已搜索题目数量;所述确定单元,还用于从统计出的所有所述已搜索题目数量中确定最高已搜索题目数量并确定所述最高已搜索题目数量所对应的目标学科;所述第二获取单元本文档来自技高网...

【技术保护点】
1.一种基于定制语料库的语音搜题方法,其特征在于,所述方法包括:采集用户输入的语音信息,并确定用户的个人数据,所述个人数据至少包括用户的当前年龄;确定与所述个人数据相匹配的目标语料库,所述目标语料库包括所述当前年龄所属年龄段的用户群针对不同问题的不同语音问法;根据所述目标语料库对所述语音信息进行识别,以提取出所述语音信息所包含的目标问题,并搜索所述目标问题的目标答案,以及输出所述目标答案。

【技术特征摘要】
1.一种基于定制语料库的语音搜题方法,其特征在于,所述方法包括:采集用户输入的语音信息,并确定用户的个人数据,所述个人数据至少包括用户的当前年龄;确定与所述个人数据相匹配的目标语料库,所述目标语料库包括所述当前年龄所属年龄段的用户群针对不同问题的不同语音问法;根据所述目标语料库对所述语音信息进行识别,以提取出所述语音信息所包含的目标问题,并搜索所述目标问题的目标答案,以及输出所述目标答案。2.根据权利要求1所述的方法,其特征在于,所述采集用户输入的语音信息之前,所述方法还包括:获取当前时间点和当前地点;判断所述当前时间点是否位于预设的学习时间段内;如果所述当前时间点位于所述学习时间段内,判断所述当前地点是否位于预设的学习地点集合中;如果所述当前地点位于所述学习地点集合中,执行所述的采集用户输入的语音信息。3.根据权利要求1或2所述的方法,其特征在于,所述搜索所述目标问题的目标答案之后,所述方法还包括:获取所述目标答案对应的目标知识点,并确定所述目标知识点在所述当前年龄所属年龄段对应的目标难度等级;判断所述目标难度等级是否高于预设难度等级;如果所述目标难度等级高于所述预设难度等级,输出针对所述目标知识点的知识点解析,并执行所述的输出所述目标答案。4.根据权利要求3所述的方法,其特征在于,所述输出所述目标答案之后,所述方法还包括:根据所述语音信息获取用户的声纹特征,并根据所述声纹特征调取用户在预设时间段内的语音搜题记录,不同声纹特征对应不同用户的语音搜题记录;获取所述语音搜题记录对应的所有已搜索题目以及每个所述已搜索题目对应的已搜索答案;判断所有所述已搜索答案中是否存在与所述目标知识点对应的至少一个目标已搜索答案;如果存在至少一个所述目标已搜索答案,标记所述目标知识点,并基于用户的个人记忆曲线在预设时间间隔内输出针对所述目标知识点的巩固题目供用户学习。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:根据所述语音搜题记录确定用户在所述预设时间段内的搜题频率;判断所述搜题频率是否高于平均搜题频率,所述平均搜题频率是根据所述当前年龄所属年龄段的用户群在所述预设时间段内的平均语音搜题记录确定的;如果所述搜题频率高于所述平均搜题频率,识别每个所述已搜索题目所对应的学科,并统计每个所述学科所对应的已搜索题目数量,从统计出的所有所述已搜索题目数量中确定最高已搜索题目数量并确定所述最高已搜索题目数量所对应的目标学科,以及获取用户针对所述目标学科的学习成绩;根据所述学习成绩以及所述最高已搜索题目数量与所有所述已搜索题目的数量比值,判断是否需要向用户对应的所有教师终端中与所述目标学科对应的目标教师终端发送辅导请求;当判断出需要发送所述辅导请求时,梳理所有所述已搜索题目中与所述目标学科所对应的目标已搜索题目所涉及的待辅导知识点,并向所述目标教师终端发送包括所述待辅导知识点的所述辅导请求,所述辅导请求用于请求所述目标教师终端的教师针对所述待辅导知识点对用户进行辅导。6.一种家教设备,其特征在于,包括:采集单元,用于采集用户输入的语音信息;确定单元,用于确定用户的个人数据,以及确定与所述个人数据相匹配的目标语料库,所述个人数据至少包括用户的当前年龄,所述目标语料库包括所述当前年龄所属年龄段的用户群针对不同问题的不同语音问法;第一识别单元,用于根据所述目...

【专利技术属性】
技术研发人员:徐杨
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1