当前位置: 首页 > 专利查询>井冈山大学专利>正文

一种基于大数据的智能语言认知信息处理系统及方法技术方案

技术编号:21060344 阅读:40 留言:0更新日期:2019-05-08 07:03
本发明专利技术属于大数据领域,公开了一种基于大数据的智能语言认知信息处理系统及方法;通过语音与文字输入形式将语言进行输入;利用词语、成语、谚语、句型对语言采用最佳一致逼近方法进行词语提取,词语提取后进行转化;对转化内容与系统内存在的句意,采用肖维涅算法进行核对,对转化内容进行验证;验证后通过输入到微处理器;验证失败后重新进行提取与转化,合格后出入到微处理器;最终对信息采用PURE-LET的小波域去噪进行保存并通过扬声器进行输出。本发明专利技术可以使得智能语言认知系统的出错率大大降低,并且可以进行多种语言转化,通过记忆功能可以提高转化效率。

An Intelligent Language Cognitive Information Processing System and Method Based on Large Data

【技术实现步骤摘要】
一种基于大数据的智能语言认知信息处理系统及方法
本专利技术属于大数据领域,尤其涉及一种基于大数据的智能语言认知信息处理系统及方法。
技术介绍
语言就广义而言,是采用一套具有共同处理规则来进行表达的沟通指令,指令会以视觉、声音或者触觉方式来传递。严格来说,语言是指人类沟通所使用的指令-自然语言。所有人都是通过学习从而获得的语言能力,语言的目的是交流观念、意见、思想等。语言学就是从人类研究语言分类与规则而发展出来的。语言是人与人之间的一种交流方式,人们彼此的交往离不开语言。尽管通过图片、动作、表情等可以传递人们的思想,但是语言是其中最重要的,也是最方便的媒介。当人类发现了某些动物能够以某种方式沟通,就诞生了动物语言的概念。到了电脑的诞生,人类需要给予电脑指令。这种“单向沟通”就成了电脑语言。但是电脑在直接理解人类说出的语言时并不能很好的认知,目前计算机在智能语言认知方面出错率高,并且有很多词语无法识别,只能进行简单单一的识别。综上所述,现有技术存在的问题是:目前计算机在智能语言认知方面出错率高,并且有很多词语无法识别,只能进行简单单一的识别。现有技术中无法对对词语进行准确的提取;现有技术本文档来自技高网...

【技术保护点】
1.一种基于大数据的智能语言认知信息处理方法,其特征在于,所述基于大数据的智能语言认知信息处理方法包括:第一步,通过语音与文字输入形式将语言进行输入;第二步,利用词语、成语、谚语、句型对语言采用最佳一致逼近方法进行词语提取,词语提取后进行转化;第三步,对转化内容与系统内存在的句意,采用肖维涅算法进行核对,对转化内容进行验证;第四步,验证后通过输入到微处理器;验证失败后重新进行提取与转化,合格后出入到微处理器;最终对信息采用PURE-LET的小波域去噪进行保存并通过扬声器进行输出。

【技术特征摘要】
1.一种基于大数据的智能语言认知信息处理方法,其特征在于,所述基于大数据的智能语言认知信息处理方法包括:第一步,通过语音与文字输入形式将语言进行输入;第二步,利用词语、成语、谚语、句型对语言采用最佳一致逼近方法进行词语提取,词语提取后进行转化;第三步,对转化内容与系统内存在的句意,采用肖维涅算法进行核对,对转化内容进行验证;第四步,验证后通过输入到微处理器;验证失败后重新进行提取与转化,合格后出入到微处理器;最终对信息采用PURE-LET的小波域去噪进行保存并通过扬声器进行输出。2.如权利要求1所述的基于大数据的智能语言认知信息处理方法,其特征在于,所述第二步中利用词语、成语、谚语、句型对于语言采用最佳一致逼近方法进行词语提取,具体算法为:f(x)∈C[a,b],pn(x)是次数不超过n的全体多项式构成的集合;如果:则称p*(x)是f(x)在[a,b]上的最佳一致逼近多项式,也称极小化极大多项式;采用里米兹算法求取最佳多项式;根据切比雪夫定理求解:其中:ak(k=0,1,…n)为待求多项式系数;ρ为最佳逼近值;xi用反复校正法取得。3.如权利要求1所述的基于大数据的智能语言认知信息处理方法,其特征在于,所述第三步中对转化内容采用肖维涅算法进行核对,实现对转化内容的高效验证;具有算法为:利用数据...

【专利技术属性】
技术研发人员:尹观海方燕红王文烨李小东陈佳张明宝廖玲萍
申请(专利权)人:井冈山大学
类型:发明
国别省市:江西,36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1