电子设备及其自然语言分析方法技术

技术编号:8883152 阅读:186 留言:0更新日期:2013-07-04 02:02
一种自然语言分析方法,用于包括语料库的电子设备。该方法包括如下步骤:接收用户语音和/或文字输入并转换为电信号;将用户的信号转换为文本信息;将文本信息切分为包括多个词汇的多种词汇切分结果;从语料库中获取多种词汇切分结果中每一词汇的使用频率,计算每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照第一概率值排序,得到对语言分析结果的第一排序方式;根据句式构造规则将文本信息进行语句成分划分;计算出各种词汇切分结果的第二概率值,并得到语言分析结果的第二排序方式;及确定用于回应用户的文本信息的一回复信息。本发明专利技术还提供了一种应用上述方法的电子设备。本发明专利技术提高了电子设备理解用户的自然语言的准确度。

【技术实现步骤摘要】

本专利技术涉及一种。
技术介绍
随着技术的发展,具有人机会话功能的计算机等智能型的电子设备越来越受到消费者的亲睐。然而,自然语言理解一直是人工智能学科内引人注目而又困难重重的一个核心研究课题。在人机会话的过程中,电子设备将用户的自然语言通过词汇切分法等方式进行切分,并通过分析排除不适当的歧义,从而形成对应原文的机器可识别的语言。然后结合预存的语料库来理解用户的自然语言,通过转换最终得到句子的语意。然而,在自然语言理解处理过程中,语言的复杂性导致理解处理结果会产生多种语言歧义,尤其是中文语言,往往存在电子设备错误理解用户的语言的问题。
技术实现思路
有鉴于此,有必要提供一种用于电子设备的自然语言分析方法,可提高电子设备理解用户的自然语言的准确度,以便于更有效的人机会话,以解决上述问题。有鉴于此,还有必要提供一种采用自然语言分析方法的电子设备,以解决上述问题。一种自然语言分析方法,用于包括存储有语料库的电子设备。所述语料库记录了多个词汇以及每一词汇的使用频率。所述方法包括如下步骤: 接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号; 将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息; 将所述文本信息切分为包括多个词汇的多种词汇切分结果; 从所述语料库中获取所述多种词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到一语言分析结果的第一排序方式; 在多种词汇切分结果的基础上根据句式构造规则,将所述文本信息进行语句成分划分; 根据所述语句划分结果,计算出各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式,其中,所述第一排序方式和第二排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序;及 根据所述第二排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。一种电子设备,包括存储有语料库的存储单元和输入单元。所述语料库记录了多个词汇以及每一词汇的使用频率。所述输入单元用于接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号。所述电子设备还包括: 一语言文字转换模块,用于将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息; 一词汇切分模块,用于将所述文本信息切分为包括多个词汇的多种词汇切分结果; 一语句分析模块,用于在多种词汇切分结果的基础上根据句式构造规则,将所述文本信息进行语句成分划分; 一分析控制模块,用于从所述语料库中获取所述多种词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到对语言分析结果的第一排序方式;以及根据所述语句划分结果,计算出各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式,其中,所述第一排序方式和第二排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序;及 一智能会话模块,用于根据所述第二排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。相对于现有技术,上述,当用户启动电子设备后,用户可以通过输入单元与电子设备进行人机会话,通过将用户的语音和/或文字输入转换为一文本信息,并将该文本信息切分为多个词汇的多种词汇词汇切分结果,并将与多种词汇切分结果对应的语言分析结果进行排序得到语言分析结果的第一排序方式,再将该文本信息进行语句划分,并根据语句划分结果对语言分析结果的第一排序方式进行调整,得到第二排序方式,最后将该文本信息进行段落分析,并根据段落分析结果对语言分析结果的第二排序方式进行调整,得到第三排序方式,从而更准确的理解用户的自然语言,提高了人机会话的效率。附图说明图1为本专利技术一实施方式的电子设备的功能模块图。图2为本专利技术中电子设备的自然语言分析方法的步骤流程图。主要元件符号说明 _电子设备_100存储单元_10薇斗库一—Ti"输入单元_20亙理单元i语音文字转换模块 31词汇切分模块_32i吾句分析模块i分析控制模块34段落分析模块35智能会话模块36缓存器_40显示单元_50_语音输出单元丨60 如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施例方式请参阅图1,其为本专利技术的一实施方式的电子设备100的功能模块图。电子设备100可更准确的理解用户自然语言,具有较高的人机会话效率。在本实施方式中,电子设备100为一电脑,在其他实施方式中,电子设备100还可以是手机等电子设备。电子设备100包括一存储单兀10、一输入单兀20、一处理单兀30、一显不单兀50和一语音输出单兀60。存储单元10存储有语料库12。语料库12记录了海量的词汇以及每一词汇的使用频率。语料库12是按照明确的语言学标准选择并排序的语言运用材料汇集,是按照明确的设计标准集成的可机读的大型文本库。在本实施方式中,语料库12是存有大量的中文自然语言的文本库,在其他实施方式中,该语料库12还可以存储有英文、日文等其他语言种类的自然语言的文本库。具体文本的语言种类可以根据需要设置。输入单元20用于接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号,并将转换得到的语音信号和/或文字输入信号传输至处理单元30。处理单兀30包括一语音文字转换模块31、一词汇切分模块32、一语句分析模块33和一分析控制模块34。当用户开启电子设备100后,输入单兀20即被启动,用户可以通过输入单兀20与电子设备100进行人机会话。语音文字转换模块31用于将输入单兀20传输的用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息。在本实施方式中,该预设的语言为中文,该文本信息可以为包括一个词、一句话或一段话的文本信息。在其他实施方式中,该预设的语言还可以是英文、日文等。词汇切分模块32用于将语音文字转换模块31转换得到的文本信息切分为包括多个词汇的多种词汇切分结果,并将所述多种词汇切分结果一一传输至分析控制模块34。在本实施方式中,词汇切分模块32按照双向最大匹配法对文本信息进行切分以提高词汇切分的准确度,即从正向和逆向均进行切分,并将多种词汇切分结果均传输至分析控制模块34。例如:当文本信息为包括“老虎咬死了猎人的狗”这句话时,词汇切分模块32从正向将该文本信息可以切分为包括“老虎”、“咬”、“死了”、“猎人”、“的”和“狗”这些词汇的一个词汇切分结果,包括“老虎”、“咬死了”、“猎人”、“的”和“狗”这些词汇的另一个词汇切分结果,以及包括“老虎”、“咬死了”和“猎人的狗”这些词汇的又一个词汇切分结果等;词汇切分模块32从反向将该文本信息可以切分为包括“狗”、“的”、“猎人”、“死了”、“咬”和“老虎”这些词汇的一个词汇切分结果,包括“狗”、“的”、“猎人”、“咬死了”和“老虎”这些词汇的另一个词汇切分结本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201110449948.html" title="电子设备及其自然语言分析方法原文来自X技术">电子设备及其自然语言分析方法</a>

【技术保护点】
一种自然语言分析方法,用于包括存储有语料库的电子设备,所述语料库记录了多个词汇以及每一词汇的使用频率,所述方法包括如下步骤:接收用户的语音和/或文字输入,将接收的语音和/或文字输入转换为电信号;将所述用户的语音信号和/或文字输入信号转换为一预设的语言的文本信息;将所述文本信息切分为包括多个词汇的多种词汇切分结果;从所述语料库中获取所述多种词汇切分结果中每一词汇的使用频率,在获取的每一词汇的使用频率的基础上,计算出每一种词汇切分结果的第一概率值,并将各种词汇切分结果按照各自的第一概率值排序,得到一语言分析结果的第一排序方式;在多种词汇切分结果的基础上根据句式构造规则,将所述文本信息进行语句成分划分;根据所述语句划分结果,计算出各种词汇切分结果的第二概率值,并根据各种词汇切分结果的第二概率值对所述语言分析结果的第一排序方式进行调整,得到语言分析结果的第二排序方式,其中,所述第一排序方式和第二排序方式均是根据各种词汇切分结果的概率值的降序对词汇切分结果所对应的语言分析结果进行排序;及根据所述第二排序方式中排在最前面的语言分析结果以及语料库确定用于回应用户的所述文本信息的一回复信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:熊雨凯陆欣翁世芳刘慧丰吕东生张玉勇朱健健成响林周小山黄选峰姜安林李新华
申请(专利权)人:富泰华工业深圳有限公司鸿海精密工业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1