电子设备及其自然语言分析方法技术

技术编号:8883153 阅读:201 留言:0更新日期:2013-07-04 02:02
一种自然语言分析方法,用于包括存储有基础语料库和临时语料库的电子设备。所述方法包括如下步骤:接收用户输入并转换为电信号;将输入信号转换为文本信息;将文本信息进行分析;根据基础语料库和词汇切分结果和语句划分结果分析得到第一理解结果;根据上下文理解法判断第一理解结果是否为恰当的理解结果;当第一理解结果不是恰当的理解结果时,确定一或多个代指词汇,根据上下文确定其临时理解结果以及对文本信息的第二理解结果;及根据第二理解结果以及基础语料库和临时语料库确定用于回应用户的文本信息的一回复信息。本发明专利技术还提供了一种应用上述方法的电子设备。本发明专利技术提高了电子设备理解用户的自然语言的准确度。

【技术实现步骤摘要】
电子设备及其自然语言分析方法
本专利技术涉及一种电子设备及其自然语言分析方法。
技术介绍
随着技术的发展,具有人机会话功能的计算机等智能型的电子设备越来越受到消费者的亲睐。然而,自然语言理解一直是人工智能学科内引人注目而又困难重重的一个核心研究课题。在人机会话的过程中,电子设备将用户的自然语言通过词汇切分法等方式进行切分,然后结合预存的基础语料库来理解用户的自然语言,通过转换最终得到句子的语意。虽然基础语料库中已被注入大量的语言知识和语法规则知识,然而,当用户的自然语言中出现语言代指时,例如,自然语言中的“然而圆规很不平,显出鄙夷的神色,仿佛嗤笑法国人不知道拿破仑…(鲁迅先生的《故乡》)”、“学生吃食堂”、“老乡吃大碗”等等,电子设备根据基础语料库就无法快速准确的理解用户的自然语言。
技术实现思路
有鉴于此,有必要提供一种用于电子设备的自然语言分析方法,可提高电子设备理解用户的自然语言的准确度,以便于更有效的人机会话,以解决上述问题。有鉴于此,还有必要提供一种采用自然语言分析方法的电子设备,以解决上述问题。一种自然语言分析方法,用于包括存储有基础语料库的电子设备。所述基础语料库记录了多个词汇以及每一词汇的使用频率。所述电子设备还存储有记录了至少一代指词汇及其临时理解结果的一一对应关系的临时语料库。所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果,并在所述多种词汇切分结果的基础上,根据句式构造规则将所述文本信息进行语句成分划分,得到多种语句划分结果;从所述基础语料库中获取切分后的每一词汇的使用频率,并在获取的每一词汇的使用频率的基础上,根据各种词汇切分结果以及语句划分结果综合分析并得到一第一理解结果;根据上下文理解法对用户的一预设时段内的文本信息进行分析,判断所述第一理解结果是否为一恰当的理解结果;当所述第一理解结果不是恰当的理解结果时,确定导致所述第一理解结果为不恰当的理解结果的一或多个代指词汇,并将所述一或多个代指词汇与存储在所述临时语料库中的词汇进行对比,判断临时语料库中是否记录了所述一或多个代指词汇;当所述临时语料库中未记录所述一或多个代指词汇时,根据上下文分析确定所述一或多个代指词汇的临时理解结果以及对所述文本信息的第二理解结果,并将所述一或多个代指词汇及其临时理解结果一一对应存储于临时语料库中;及根据所述第二理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息。一种电子设备,包括存储有基础语料库的存储单元和输入单元。所述基础语料库记录了多个词汇以及每一词汇的使用频率。所述输入单元用于接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号。所述存储单元还存储了一临时语料库。所述临时语料库记录了至少一代指词汇及其临时理解结果的一一对应关系。所述电子设备还包括:一语言文字转换模块,用于将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;一语言分析模块,用于将所述文本信息切分为包括多个词汇的多种词汇切分结果,并在所述多种词汇切分结果的基础上,根据句式构造规则将所述文本信息进行语句成分划分,得到多种语句划分结果;以及从所述基础语料库中获取切分后的每一词汇的使用频率,并在获取的每一词汇的使用频率的基础上,根据各种词汇切分结果以及语句划分结果综合分析并得到一第一理解结果;一判断模块,用于根据上下文理解法对用户的一预设时段内的文本信息进行分析,判断所述第一理解结果是否为一恰当的理解结果,以及当所述第一理解结果不是恰当的理解结果时,确定导致所述第一理解结果为不恰当的理解结果的一或多个代指词汇,并将所述一或多个代指词汇与存储在所述临时语料库中的词汇进行对比,判断临时语料库中是否记录了所述一或多个代指词汇;所述语言分析模块,还用于当所述临时语料库中未记录所述一或多个代指词汇时,根据上下文分析确定所述一或多个代指词汇的临时理解结果以及对所述文本信息的第二理解结果,并将所述一或多个代指词汇及其临时理解结果一一对应存储于临时语料库中;及一智能会话模块,用于根据所述第二理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息。相对于现有技术,上述电子设备及其自然语言分析方法,使用上述电子设备及其自然语言分析方法,当用户启动电子设备后,用户可以通过输入单元与电子设备进行人机会话,通过将用户的语音和/或文字输入转换为一文本信息,将该文本信息进行分析后确定一理解结果,判断所述理解结果为不恰当的理解结果时,确定一或多个导致所述理解结果为不恰当的理解结果的一或多个词汇(即代指词汇)及其临时理解结果并存储于临时语料库,并确定一新的理解结果,同时,根据新的理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息,从而更准确的理解用户的自然语言,提高了人机会话的效率。附图说明图1为本专利技术一实施方式的电子设备的功能模块图。图2为本专利技术中电子设备的自然语言分析方法的步骤流程图。主要元件符号说明电子设备100存储单元10基础语料库11临时语料库41输入单元20处理单元30语音文字转换模块31语言分析模块32判断模块33智能会话模块34缓存器40显示单元50语音输出单元60如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施方式请参阅图1,其为本专利技术的一实施方式的电子设备100的功能模块图。电子设备100可更准确的理解用户自然语言,具有较高的人机会话效率。在本实施方式中,电子设备100为一电脑,在其他实施方式中,电子设备100还可以是手机等电子设备。电子设备100包括一存储单元10、一输入单元20、一处理单元30、一显示单元50和一语音输出单元60。存储单元10存储有基础语料库11。基础语料库11记录了海量的词汇以及每一词汇的使用频率。基础语料库11是按照明确的语言学标准选择并排序的语言运用材料汇集,是按照明确的设计标准集成的可机读的大型文本库。在本实施方式中,基础语料库11是存有大量的中文自然语言的文本库,在其他实施方式中,基础语料库11还可以存储有英文、日文等其他语言种类的自然语言的文本库。具体文本的语言种类可以根据需要设置。缓存器40中存储有临时语料库41。临时语料库41记录了至少一代指词汇及其临时理解结果的一一对应关系。该临时语料库41是在电子设备100进行人机会话的过程中存储的。例如,临时语料库41记录了代指词汇“圆规”与对其的临时理解结果为“一人名”的对应关系、代指词汇“吃食堂”与对其的临时理解结果为“在食堂吃饭”等等。在一实施方式中,该临时语料库41暂存于存储单元10中。输入单元20用于接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号,并将转换得到的语音信号和/或文字输入信号传输至处理单元30。处理单元30包括一语音文字转换模块31、一语言分析模块32、一判断模块33和一智能会话模块34。当用户开启电子设备100后,输入单元20即被启动,用户可以通过输入单元20与电子设备100进行人机会话。语音文字转换模块31用于将输入单元20传输的用户的语音信号和本文档来自技高网...
电子设备及其自然语言分析方法

【技术保护点】
一种自然语言分析方法,用于包括存储有基础语料库的电子设备,其特征在于,所述基础语料库记录了多个词汇以及每一词汇的使用频率,所述电子设备还存储有记录了至少一代指词汇及其临时理解结果的一一对应关系的临时语料库,所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果,并在所述多种词汇切分结果的基础上,根据句式构造规则将所述文本信息进行语句成分划分,得到多种语句划分结果;从所述基础语料库中获取切分后的每一词汇的使用频率,并在获取的每一词汇的使用频率的基础上,根据各种词汇切分结果以及语句划分结果综合分析并得到一第一理解结果;根据上下文理解法对用户的一预设时段内的文本信息进行分析,判断所述第一理解结果是否为一恰当的理解结果;当所述第一理解结果不是恰当的理解结果时,确定导致所述第一理解结果为不恰当的理解结果的一或多个代指词汇,并将所述一或多个代指词汇与存储在所述临时语料库中的词汇进行对比,判断临时语料库中是否记录了所述一或多个代指词汇;当所述临时语料库中未记录所述一或多个代指词汇时,根据上下文分析确定所述一或多个代指词汇的临时理解结果以及对所述文本信息的第二理解结果,并将所述一或多个代指词汇及其临时理解结果一一对应存储于临时语料库中;及根据所述第二理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息。...

【技术特征摘要】
1.一种自然语言分析方法,用于包括存储有基础语料库的电子设备,其特征在于,所述基础语料库记录了多个词汇以及每一词汇的使用频率,所述电子设备还存储有记录了至少一代指词汇及其临时理解结果的一一对应关系的临时语料库,所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果,并在所述多种词汇切分结果的基础上,根据句式构造规则将所述文本信息进行语句成分划分,得到多种语句划分结果;从所述基础语料库中获取切分后的每一词汇的使用频率,并在获取的每一词汇的使用频率的基础上,根据各种词汇切分结果以及语句划分结果综合分析并得到一第一理解结果;根据上下文理解法对用户的一预设时段内的文本信息进行分析,判断所述第一理解结果是否为一恰当的理解结果;当所述第一理解结果不是恰当的理解结果时,确定导致所述第一理解结果为不恰当的理解结果的一或多个代指词汇,并将所述一或多个代指词汇与存储在所述临时语料库中的词汇进行对比,判断临时语料库中是否记录了所述一或多个代指词汇;当所述临时语料库中未记录所述一或多个代指词汇时,根据上下文分析确定所述一或多个代指词汇的临时理解结果以及对所述文本信息的第二理解结果,并将所述一或多个代指词汇及其临时理解结果一一对应存储于临时语料库中;及根据所述第二理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息。2.如权利要求1所述的自然语言分析方法,其特征在于,还包括:将所述回复信息转换为自然语言的文本信息和/或语音信号;及显示所述转换后的文本信息和/或播放所述语音信号。3.如权利要求1或2所述的自然语言分析方法,其特征在于,还包括:新建一临时语料库,并将所确定的一或多个代指词汇及其临时理解结果一一对应后存储于该新建的临时语料库中。4.如权利要求1或2所述的自然语言分析方法,其特征在于,还包括:当所述第一理解结果为不恰当的理解结果,且所述临时语料库中记录了所述一或多个代指词汇时,从临时语料库中获取所述一或多个代指词汇所对应的临时理解结果,并据此确定对所述文本信息的第三理解结果;及根据所述第三理解结果以及基础语料库和临时语料库确定用于回应用户的所述文本信息的一回复信息。5.如权利要求1或2所述的自然语言分析方法,其特征在于,还包括:判断当前会话是否已结束;及当当前会话已结束时,删除所述临时语料库。6.一种电子设备,包括存储有基础语料库的存储单元和输入单元,所述基础语料库记录了多个词汇以及每一词汇的使用频率...

【专利技术属性】
技术研发人员:熊雨凯陆欣翁世芳刘慧丰吕东生张玉勇朱健健成响林黄选峰姜安林周小山李新华
申请(专利权)人:富泰华工业深圳有限公司鸿海精密工业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1