【技术实现步骤摘要】
电子设备及其自然语言分析方法
本专利技术涉及一种电子设备及其自然语言分析方法。
技术介绍
随着技术的发展,具有人机会话功能的计算机等智能型的电子设备越来越受到消费者的亲睐。然而,自然语言理解一直是人工智能学科内引人注目而又困难重重的一个核心研究课题。在人机会话的过程中,电子设备将用户的自然语言通过词汇切分法等方式进行切分,然后结合预存的基础语料库来理解用户的自然语言,通过转换最终得到句子的语意。虽然基础语料库中已被注入大量的语言知识和语法规则知识,然而,当用户的自然语言中出现语言代指时,例如,自然语言中的“然而圆规很不平,显出鄙夷的神色,仿佛嗤笑法国人不知道拿破仑…(鲁迅先生的《故乡》)”、“学生吃食堂”、“老乡吃大碗”等等,电子设备根据基础语料库就无法快速准确的理解用户的自然语言。
技术实现思路
有鉴于此,有必要提供一种用于电子设备的自然语言分析方法,可提高电子设备理解用户的自然语言的准确度,以便于更有效的人机会话,以解决上述问题。有鉴于此,还有必要提供一种采用自然语言分析方法的电子设备,以解决上述问题。一种自然语言分析方法,用于包括存储有基础语料库的电子设备。所述基础语料库记录了多个词汇以及每一词汇的使用频率。所述电子设备还存储有记录了至少一代指词汇及其临时理解结果的一一对应关系的临时语料库。所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果,并在所述多种词汇切分结果的基础上,根据句式构造规则将所述 ...
【技术保护点】
一种自然语言分析方法,用于包括存储有基础语料库的电子设备,其特征在于,所述基础语料库记录了多个词汇以及每一词汇的使用频率,所述电子设备还存储有记录了至少一代指词汇及其临时理解结果的一一对应关系的临时语料库,所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果,并在所述多种词汇切分结果的基础上,根据句式构造规则将所述文本信息进行语句成分划分,得到多种语句划分结果;从所述基础语料库中获取切分后的每一词汇的使用频率,并在获取的每一词汇的使用频率的基础上,根据各种词汇切分结果以及语句划分结果综合分析并得到一第一理解结果;根据上下文理解法对用户的一预设时段内的文本信息进行分析,判断所述第一理解结果是否为一恰当的理解结果;当所述第一理解结果不是恰当的理解结果时,确定导致所述第一理解结果为不恰当的理解结果的一或多个代指词汇,并将所述一或多个代指词汇与存储在所述临时语料库中的词汇进行对比,判断临时语料库中是否记录了所述一或多个代指词汇;当所述临时 ...
【技术特征摘要】
1.一种自然语言分析方法,用于包括存储有基础语料库的电子设备,其特征在于,所述基础语料库记录了多个词汇以及每一词汇的使用频率,所述电子设备还存储有记录了至少一代指词汇及其临时理解结果的一一对应关系的临时语料库,所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果,并在所述多种词汇切分结果的基础上,根据句式构造规则将所述文本信息进行语句成分划分,得到多种语句划分结果;从所述基础语料库中获取切分后的每一词汇的使用频率,并在获取的每一词汇的使用频率的基础上,根据各种词汇切分结果以及语句划分结果综合分析并得到一第一理解结果;根据上下文理解法对用户的一预设时段内的文本信息进行分析,判断所述第一理解结果是否为一恰当的理解结果;当所述第一理解结果不是恰当的理解结果时,确定导致所述第一理解结果为不恰当的理解结果的一或多个代指词汇,并将所述一或多个代指词汇与存储在所述临时语料库中的词汇进行对比,判断临时语料库中是否记录了所述一或多个代指词汇;当所述临时语料库中未记录所述一或多个代指词汇时,根据上下文分析确定所述一或多个代指词汇的临时理解结果以及对所述文本信息的第二理解结果,并将所述一或多个代指词汇及其临时理解结果一一对应存储于临时语料库中;及根据所述第二理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息。2.如权利要求1所述的自然语言分析方法,其特征在于,还包括:将所述回复信息转换为自然语言的文本信息和/或语音信号;及显示所述转换后的文本信息和/或播放所述语音信号。3.如权利要求1或2所述的自然语言分析方法,其特征在于,还包括:新建一临时语料库,并将所确定的一或多个代指词汇及其临时理解结果一一对应后存储于该新建的临时语料库中。4.如权利要求1或2所述的自然语言分析方法,其特征在于,还包括:当所述第一理解结果为不恰当的理解结果,且所述临时语料库中记录了所述一或多个代指词汇时,从临时语料库中获取所述一或多个代指词汇所对应的临时理解结果,并据此确定对所述文本信息的第三理解结果;及根据所述第三理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息。5.如权利要求1或2所述的自然语言分析方法,其特征在于,还包括:判断当前会话是否已结束;及当当前会话已结束时,删除所述临时语料库。6.一种电子设备,包括存储有基础语料库的存储单元和输入单元,所述基础语料库记录了多个词汇以及每一词汇的使用频率...
【专利技术属性】
技术研发人员:熊雨凯,陆欣,翁世芳,刘慧丰,吕东生,张玉勇,朱健健,成响林,黄选峰,姜安林,周小山,李新华,
申请(专利权)人:富泰华工业深圳有限公司,鸿海精密工业股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。