汉语文本智能分词法制造技术

技术编号：4291025 阅读：310 留言：0更新日期：2012-04-11 18:40

本发明专利技术是一种主要基于汉语语法分析基础上的计算机或嵌入式可移动设备的汉语文本智能分词方法，它是一种基于理解的汉语文本分词方法。本发明专利技术所采用的汉语语法是词法和句法以及构词法与英语几乎完全相一致的一种新型汉语语法，所分词的汉语文本可以是汉字，也可以是与《汉语拼音方案》具有一一对应关系的汉语拼音文本，属于计算机或各种手持嵌入式可移动设备汉语信息处理技术领域。它能广泛应用于汉语的拼音－汉字双向转换、简体－繁体转换、汉语的语音识别、语音合成、机器翻译以及信息检索搜索等领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术是一种主要基于汉语语法分析基础上的计算机或嵌入式可移动设备的汉语文本智能分词方法，所采用的汉语语法是词法和句法以及构词法与英语几乎完全相一致的一种新型汉语语法，所分词的汉语文本可以是汉字以及与《汉语拼音方案》具有一一对应关系的汉语拼音文本，由于一个汉字对应于一个汉语拼音音节，因此本专利技术凡是适用汉字的地方，对与《汉语拼音方案》具有一一对应关系的汉语拼音的对应音节也同样适用，本专利技术属于计算机或各种手持嵌入式可移动设备汉语信息处理
二
技术介绍
二十世纪四十年代起，计算机的飞速发展在全球范围内引起了一场以电子计算机为中心的第三次技术革命，它把人类从繁重的脑力劳动中解放出来，开创了人类智力解放的新纪元。众所周知，拼音文字文本比如英语文本是按词连写，词与词之间已经是分隔好的词串，本身不存在分词问题，而由于我国记录汉语使用的是方块表意汉字，由方块表意汉字组成的汉语文本是一种没有按词切分的连续汉字或音节串，通常需要以词为基本单位进行切分后，才能交给计算机作进一步处理。例如汉语的汉语拼音与汉字的转换、汉字的简体和繁体转换、汉语的语音识别、汉语文本的...

【技术保护点】
一种主要基于与英语语法的词法句法及其构词法基本相一致的新型汉语语法分析基础上的计算机或嵌入式可移动设备的汉字文本和与《汉语拼音方案》具有一一对应关系的汉语拼音文本的分词方法。

【技术特征摘要】

【专利技术属性】
技术研发人员：苗玉水，
申请(专利权)人：苗玉水，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人