与老人用户进行连续AI对话的方法及系统技术方案

技术编号:19636909 阅读:39 留言:0更新日期:2018-12-01 17:24
本发明专利技术涉及老人服务领域,具体涉及一种与老人用户进行连续AI对话的方法及系统,该系统包括:老人说话习惯分析模块和语音解析模块;老人说话习惯分析模块用于根据同一位老人输入的语音信息判断该老人的说话习惯信息,然后将老人的说话习惯信息发送给语音解析模块;语音解析模块接收到语音解析模块发送的老人的说话习惯信息后,根据该老人的说话习惯信息对该老人输入的语音信息按照输入时间先后进行重新组合,然后将组合后的语音信息解析成对应文本信息。与现有技术相比,本方案能够减少解析文本的错误率。

Method and System of Continuous AI Dialogue with Elderly Users

The invention relates to the field of elderly service, in particular to a method and system for continuous AI dialogue with elderly users. The system includes: an old person's speech habits analysis module and a voice analysis module; an old person's speech habits analysis module is used to judge the old person's speech habits information according to the voice information input by the same old person. Then the old man's speech habits information is sent to the voice analysis module; after receiving the old man's speech habits information sent by the voice analysis module, the voice information input by the old man is recombined according to the input time, and then the combined voice information is reconstructed according to the old man's speech habits information. Information is parsed into corresponding text information. Compared with the existing technology, this scheme can reduce the error rate of parsing text.

【技术实现步骤摘要】
与老人用户进行连续AI对话的方法及系统
本专利技术涉及老人服务领域,具体涉及与一种老人用户进行连续AI对话的方法及系统。
技术介绍
AI(人工智能),它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。在对语音进行处理时,公开号为CN107305541A的中国专利文件公开了一种语音识别文本分段方法及装置,该方法包括:对语音数据进行端点检测,得到各语音段及各语音段的开始帧序号和结束帧序号;对各语音段进行语音识别,得到各语音段对应的识别文本;提取各语音段对应的识别文本的分段特征;利用提取的分段特征以及预先构建的分段模型,对所述语音数据对应的识别文本进行分段检测,以确定需要分段的位置;根据分段检测结果对所述语音数据对应的识别文本进行分段。该专利技术可以自动地实现对识别文本进行分段,使识别文本的篇章结构更加清晰。但是,随着中国进入老龄化,中国老龄人越来越多,老人由于身体比较弱,说话习惯和年轻人不一样,比如,老人常常说话的时候会出现喘息的情况,导致老人说话断断续续,说话语速慢,说完一句话中间可能还会停顿很多次。若是在语音识别时一句话被断断续续分隔成多个小段,在语音识别时可能便会把每一个小段作为一个识别对象,使得对一个小段语音进行识别时这小段语音在不结合上下两个小段语音便无法正确解析,导致语音识别错误或分段错误,或者在一个小段语音输入后便误判断这一句话已经输入完毕,使得解析的文本信息完全偏离语音信息原本想表达的意思。
技术实现思路
本专利技术的提供了一种与老人用户进行连续AI对话的系统,以解决现有语音识别方法或系统用于对老人语音进行识别分段时由于老人说话断断续续,输入一句话进行多次停顿导致识别分段不成功的问题。本专利技术提供的基础方案为:一种与老人用户进行连续AI对话的系统,包括:老人说话习惯分析模块和语音解析模块;老人说话习惯分析模块用于根据同一位老人输入的语音信息判断该老人的说话习惯信息,然后将老人的说话习惯信息发送给语音解析模块;老人的说话习惯信息包括老人说话语速和音量大小信息;语音解析模块接收到语音解析模块发送的老人的说话习惯信息后,根据该老人的说话习惯信息对该老人输入的语音信息按照输入时间先后进行重新组合,然后将组合后的语音信息解析成对应文本信息。本基础方案的原理在于:一位老人说话时进行语音信息的输入,然后老人说话习惯分析模块便会对输入的语音信息进行该老人的说话习惯信息分析,然后将该老人的说话习惯信息发送给语音解析模块,语音解析模块接收到该老人的说话习惯信息后在该老人再次进行语音信息输入时便根据其说话习惯信息对其输入的语音信息按照输入时间先后顺序进行重新组合,然后将组合后的语音信息解析成对应的文本信息。本基础方案的优点在于:在进行语音解析前针对同一个位老人输入的语音信息分析其说话习惯信息,即了解该老人正常说话时的语速、音量大小等信息,也就是说不同老人输入的语音信息都会形成对应的说话习惯信息,便于根据老人的说话习惯信息进行该老人语音信息的解析,使得每一位老人的语音信息解析方式都不一样;在进行语音解析时根据老人的说话习惯信息进行解析,使得语音信息解析后的文本信息更加贴近老人想表达的意思,减少了解析错误率。与现有技术相比,本方案是针对老人的说话习惯信息进行语音解析,能增加对老人说话的语音信息识别成功率。进一步,还包括老人普遍交流习惯分析模块,老人普遍交流习惯分析模块用于对不同老人说话交流的习惯进行分析,然后生成老人普遍的说话习惯信息发送给语音解析模块;语音解析模块接收到老人普遍的说话习惯信息后,在一位老人输入语音信息时,根据该老人的说话习惯信息和老人普遍的说话习惯信息对输入的语音信息进行解析。语音解析模块对老人说话的语音信息进行解析时,不仅根据该老人个人的说话习惯信息进行解析,还根据老人普遍的说话习惯信息进行解析,即对老人同年龄段的老人都进行了说话习惯分析,便于了解老人的普遍说话习惯,使得进行语音解析时解析的语音能更加准确。进一步,还包括老人语音情绪判断模块和对话组合输出模块,老人语音情绪判断模块用于根据老人的说话习惯信息判断老人输入的语音信息中带有哪种情绪,然后将判断结果发送给对话组合输出模块,对话组合输出模块根据语音信息解析后的文本信息以及判断结果选择对话进行输出。同一个老人在情绪变化后输入的语音信息中语速、音量、语气等都有所不同,而语音信息内容相同时,由于语气、音量等的变化将赋予这段语音信息不同的情感,即真正想表达的意思便会在语气、音量、语速等的快慢变化后将有所不同,对老人的情绪进行分析,便能更好的了解老人说话时语音信息中含有的情感,便于进行对话时选择更加合适的对话内容进行输出。进一步,还包括老人动作表情采集模块和状态分析模块,老人动作表情采集模块用于采集老人的动作信息,然后将老人的动作信息发送给状态分析模块,状态分析模块接收到老人动作表情采集模块发送的动作信息后根据老人的动作信息判断老人当前所属状态信息。老人当前所属状态信息指老人当前正在做什么。对老人当前所属状态信息进行分析,便于知道老人正在做什么,知道老人处于什么样的状态。进一步,还包括场景分配模块和场景对话存储模块,场景对话存储模块内存储有场景对话模型,场景分配模块用于根据老人的状态信息、老人情绪和语音信息解析后的文本信息在场景对话存储模块内寻找适合的场景对话模型,然后根据场景对话模型组合对话进行对话输出。根据老人的状态信息、老人情绪和语音信息解析后的文本信息寻找的场景对话模型,进一步增加了输出对话准确性。进一步,还包括连续对话组合模块,连续对话组合模块用于对输出的对话和老人输入的语音信息按照时间先后排列成对话排列表,然后根据对话排列表中的内容生成对应的文本信息内容发送给场景分配模块,场景分配模块接收到连续对话组合模块发送的文本信息内容后,根据对话排列表中的文本信息内容、老人的状态信息、老人情绪和语音信息解析后的文本信息在场景对话存储模块内寻找适合的场景对话模型。根据对话排列表中的内容生成对应的文本信息内容发送给场景分配模块,即后选用的场景对话模型是根据之前的对话内容选择,也就是说实现了后续对话根据前面对话内容进行选择输出,实现可前后对话的关联性输出。另外,针对与老人用户进行连续AI对话的系统,本专利技术还提供了一种与老人用户进行连续AI对话的方法,包括如下步骤:步骤一:对老人输入的语音信息进行采集;步骤二:根据不同老人输入的语音信息对所有老人普遍的说话习惯进行分析,得到所有老人普遍的说话习惯信息;步骤三:根据老人普遍的说话习惯信息对同一位老人输入的语音信息进行分析得到该老人的说话习惯信息;步骤四:根据老人的说话习惯信息对该老人输入的语音信息进行解析。与现有技术相比,步骤三中,根据老人普遍的说话习惯信息对同一位老人输入的语音信息进行分析得到该老人的说话习惯信息,即老人普遍的说话习惯信息可以作为初次给该老人进行说话习惯信息分析时的依据,便于快速的获得比较正确的老人的说话习惯信息;同时,根据老人的说话习惯进行语音解析,增加了老人语音信息的解析正本文档来自技高网
...

【技术保护点】
1.一种与老人用户进行连续AI对话的系统,其特征在于,包括:老人说话习惯分析模块和语音解析模块;老人说话习惯分析模块用于根据同一位老人输入的语音信息判断该老人的说话习惯信息,然后将老人的说话习惯信息发送给语音解析模块;老人的说话习惯信息包括老人说话语速和音量大小信息;语音解析模块接收到语音解析模块发送的老人的说话习惯信息后,根据该老人的说话习惯信息对该老人输入的语音信息按照输入时间先后进行重新组合,然后将组合后的语音信息解析成对应文本信息。

【技术特征摘要】
1.一种与老人用户进行连续AI对话的系统,其特征在于,包括:老人说话习惯分析模块和语音解析模块;老人说话习惯分析模块用于根据同一位老人输入的语音信息判断该老人的说话习惯信息,然后将老人的说话习惯信息发送给语音解析模块;老人的说话习惯信息包括老人说话语速和音量大小信息;语音解析模块接收到语音解析模块发送的老人的说话习惯信息后,根据该老人的说话习惯信息对该老人输入的语音信息按照输入时间先后进行重新组合,然后将组合后的语音信息解析成对应文本信息。2.根据权利要求1所述的与老人用户进行连续AI对话的系统,其特征在于:还包括老人普遍交流习惯分析模块,老人普遍交流习惯分析模块用于对不同老人说话交流的习惯进行分析,然后生成老人普遍的说话习惯信息发送给语音解析模块;语音解析模块接收到老人普遍的说话习惯信息后,在一位老人输入语音信息时,根据该老人的说话习惯信息和老人普遍的说话习惯信息对输入的语音信息进行解析。3.根据权利要求1所述的与老人用户进行连续AI对话的系统,其特征在于:还包括老人语音情绪判断模块和对话组合输出模块,老人语音情绪判断模块用于根据老人的说话习惯信息判断老人输入的语音信息中带有哪种情绪,然后将判断结果发送给对话组合输出模块,对话组合输出模块根据语音信息解析后的文本信息以及判断结果选择对话进行输出。4.根据权利要求1-3中任一项所述的与老人用户进行连续AI对话的系统,其特征在于:还包括老人动作表情采集模块和状态分析模块,老人动作表...

【专利技术属性】
技术研发人员:潘晓明
申请(专利权)人:重庆柚瓣家科技有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1