【技术实现步骤摘要】
人工智能面试中获取输入文本和相关装置
本申请涉及人工智能
,特别涉及一种人工智能面试中获取输入文本的方法及装置、设备、计算机可读存储介质。
技术介绍
随着电子技术的不断发展,人工智能技术逐渐活跃在各种
,例如智能汽车驾驶、智能客服、智能扫地机器人、智能面试等等。其中,智能面试是由人工智能面试官代替传统面试官对应聘者进行面试,人工智能面试官融合了语音识别、面部识别等功能,能够对应聘者的面试表现进行综合评价,并通过对应聘者进行排名来确定理想人选。在智能面试中,应聘者对于面试题的回答仍是人工智能面试官评价应聘者的重要内容。由此,人工智能面试官能够准确获取应聘者的回答内容,决定了当前所进行智能面试的有效性。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
为了使得人工智能面试官能够准确获取应聘者针对面试题的回答内容,本申请提供了一种人工智能面试中获取输入文本的方法及装置、设备、计 ...
【技术保护点】
1.一种人工智能面试中获取输入文本的方法,其特征在于,所述方法包括:/n在所进行的人工智能面试中,调用预设的通用词词库和通用词发音对照表对输入语音进行校正,并对校正所得语音进行语音识别获得识别文本;/n通过对所述识别文本进行分词处理获得分词集合;/n对所述分词集合中的分词,分别计算所述分词相对左侧分词和右侧分词的互信息值,且根据所得互信息值定位所述识别文本中的同音错误词,所述互信息值包括左互信息值和右互信息值;/n从预设的同音词词库中提取目标词对所述同音错误词进行替换,获得所述智能面试中的输入文本,所述目标词的读音与所述同音错误词相同。/n
【技术特征摘要】
1.一种人工智能面试中获取输入文本的方法,其特征在于,所述方法包括:
在所进行的人工智能面试中,调用预设的通用词词库和通用词发音对照表对输入语音进行校正,并对校正所得语音进行语音识别获得识别文本;
通过对所述识别文本进行分词处理获得分词集合;
对所述分词集合中的分词,分别计算所述分词相对左侧分词和右侧分词的互信息值,且根据所得互信息值定位所述识别文本中的同音错误词,所述互信息值包括左互信息值和右互信息值;
从预设的同音词词库中提取目标词对所述同音错误词进行替换,获得所述智能面试中的输入文本,所述目标词的读音与所述同音错误词相同。
2.根据权利要求1所述的方法,其特征在于,在所述通过对所述识别文本进行分词处理获得分词集合之前,所述方法还包括:
根据预先设置的语气词词典,查找所述识别文本中重复出现的语气词;
将所述重复出现的语气词从所述识别文本中删除。
3.根据权利要求1所述的方法,其特征在于,所述根据所得互信息值定位所述识别文本中的同音错误词,包括:
根据所述分词集合中各分词对应的左互信息值和右互信息值,分别计算所述分词集合关于所述左互信息值和右互信息值的均值以及标准差;
分别对所述左互信息值和右互信息值的均值以及标准差进行差值运算,获得所述分词集合关于所述左互信息值和右互信息值的阈值;
获取所述分词集合中左互信息值和右互信息值小于对应阈值的分词为同音错误词。
4.根据权利要求3所述的方法,其特征在于,在所述获取所述分词集合中左互信息值和右互信息值小于对应阈值的分词获取为同音错误词之前,所述方法还包括:
根据为所述左互信息值和右互信息值所赋予的权重,对所述分词集合关于所述左互信息值和右互信息值的阈值进行加权和运算,获得所述分词集合对应的互信息阈值;
所述获取所述分词集合中左互信息值和右互信息值小于对应阈值的分词获取为同音错误词,包括:
对所述分词集合中的分词,按照所述权重对所述分词对应的左互信息值和右互信息值进行加权和运算,获得所述分词的互信息值;
获取所述互信息值小于所述互信息阈值的分词为同音错误词。
5.根据权利要求1所述的方法,其特征在于,所述从预设的同音词词库中提取目标词对所述同音错误...
【专利技术属性】
技术研发人员:郑立颖,徐亮,阮晓雯,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。