【技术实现步骤摘要】
一种基于声音识别的多模式语音交互方法及系统
[0001]本专利技术涉及语音交互
,尤其涉及一种基于声音识别的多模式语音交互方法及系统。
技术介绍
[0002]随着车联网和人工智能技术的兴起,越来越多的功能被搭载在车机上,当前汽车座舱智能化发展趋势下,语音交互功能已成为智能座舱内最具代表性的智能化功能,语音交互也已成为车内最为重要的交互方式,语音交互是车内最直接、最人性化、最安全的交互方式,同时随着AI和硬件性能的增强,智能语音交互会逐渐由单模交互方式向与其他交互方式相结合的多模交互方式发展。
[0003]现有技术中,汽车座舱内人机交互时语音I P形象的展示方式大多为通过节日来提供不同的语音形象、或者用户自己手动去切换语音I P皮肤包,这些都是基于固定的统计结果或者用户自发行为,只能迎合用户主动交互的一些喜好,语音端没有主动去识别用户需求,无法满足用户个性化与场景化的需求。
技术实现思路
[0004]为此,本专利技术提供一种基于声音识别的多模式语音交互方法及系统,用以克服现有技术中由于人机交互时无 ...
【技术保护点】
【技术特征摘要】
1.一种基于声音识别的多模式语音交互系统,其特征在于,包括:语音采集模块,用以实时采集车内用户的语音信息;内容识别模块,用以识别实时采集的语音信息中的文字内容;语音分析模块,用以对实时采集的语音信息进行声音特征分析,识别确认该语音信息是否为驾驶员发出,并对驾驶员的语音信息的文字内容、语速和语调进行分析,并根据分析结果判断驾驶员的驾驶状态;模式选择模块,用以根据驾驶员的驾驶状态选取对应的交互模式进行语音交互;模式调整模块,用以根据驾驶员的交互反馈信息对交互模式进行实时调整。2.根据权利要求1所述的基于声音识别的多模式语音交互系统,其特征在于,所述语音分析模块包括:声纹分析单元,用以对实时采集的语音信息中的声纹进行分析,以判断该语音信息是否为驾驶员的语音信息;文字分析单元,用以对驾驶员的语音信息进行文字提取,以获取语音信息中的状态关键字;语速分析单元,用以根据驾驶员的语音信息中的文字数量和语音时长对驾驶员进行语速分析;语调分析单元,用以根据驾驶员的语音信息中的声波频率对驾驶员进行语调分析;状态判断单元,用以根据获取的状态关键字数量、驾驶员的语速和驾驶员的语调对驾驶员的驾驶状态进行判断和校正。3.根据权利要求2所述的基于声音识别的多模式语音交互系统,其特征在于,所述声纹分析单元在对实时采集的语音信息进行声纹分析时,将实时采集的语音信息的声纹与已存储的若干驾驶员的声纹信息进行匹配,并根据匹配结果进行声纹分析,其中,当实时采集的语音信息的声纹与已存储的若干驾驶员的声纹信息匹配到相同声纹时,判断该语音信息为驾驶员发出的语音信息;当实时采集的语音信息的声纹与已存储的若干驾驶员的声纹信息未匹配到相同声纹时,判断该语音信息非驾驶员发出的语音信息。4.根据权利要求2所述的基于声音识别的多模式语音交互系统,其特征在于,所述文字分析单元设有若干预设状态关键字,所述文字分析单元获取驾驶员语音信息的文字内容,并将若干预设状态关键字分别与驾驶员语音信息的文字内容进行匹配,所述状态判断单元根据匹配结果对驾驶员的驾驶状态进行判断,其中,当匹配到相同状态关键字时,所述状态判断单元根据该状态关键字的状态类别对驾驶员的驾驶状态进行判断;当未匹配到相同状态关键字时,所述状态判断单元判定驾驶员的驾驶状态为正常状态。5.根据权利要求4所述的基于声音识别的多模式语音交互系统,其特征在于,状态关键字的状态类别包括愤怒、悲哀和恐惧,当匹配到单一相同状态关键字时,所述状态判断单元将该状态关键字的状态类别作为驾驶员的驾驶状态;当匹配到若干相同状态关键字时,若各状态关键字的状态类别相同,所述状态判断单元将该状态类别作为驾驶员的驾驶状态;若各状态关键字的状态类别不同,所述状态判断
单元将包含状态关键字最多的状态类别作为驾驶员的驾驶状态。6.根据权利要求5所述的基于声音识别的多模式语音交互系统,其特征在于,所述语速分析单元获取驾驶员的语音信息中的文字数量M和语音时长H,并计算驾驶员的语速V,设定V=M/H,所述语速分析单元将计算得到的驾驶员的语速V与各预设标准语速进行比对,并根据比对结果对...
【专利技术属性】
技术研发人员:魏玉玲,
申请(专利权)人:中国第一汽车股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。