【技术实现步骤摘要】
文档疑难杂字智能注音方法、系统、设备及介质
本专利技术涉及汉字应用处理
,特别是涉及一种文档疑难杂字智能注音方法、系统、设备及介质。
技术介绍
中国文化博大精深,语言文字丰富多样。汉字是文化的载体,因为有了汉字,中华民族传统文化才得以传承。作为表意文字的汉字,有别于拼音文字,它所代表的意义远超出了汉字本身。汉字是语素文字,总数非常庞大,据估计,到目前为止,汉字数量达到11万左右。其中常用字大概7000左右。疑难杂字,也称生僻字(冷僻字),指不常见的或人们不熟悉的汉字。自有汉字以来,汉字也在不断发展中经历了由简到繁、由繁到简的“适者生存”的淘汰式选择和变化。在现代信息社会生活和工作中,文档中不可避免会用到一些不常用、很少见的文字,在文档的交流中,大多数人对这部分冷僻字是不认识和读不出音的,尤其是当文档打印输出交给其他人阅读时,阅读者对于出现疑难杂字的文档的理解程度、阅读体验都会受到限制。如果文档是呈交给领导的讲稿,领导拿讲稿公开讲话或做报告时,遇到不能准确读出拼音的疑难杂字,就会出现尴尬的场景,也会影响到讲稿文档制作者或 ...
【技术保护点】
1.一种文档疑难杂字智能注音方法,其特征在于,包括:/n存储和维护包含疑难杂字及其注音的疑难杂字表;/n设置疑难杂字的注音规则;/n扫描目标文档,根据疑难杂字表和注音规则,识别目标文档中出现的疑难杂字,并在目标文档中加注疑难杂字对应的拼音。/n
【技术特征摘要】
1.一种文档疑难杂字智能注音方法,其特征在于,包括:
存储和维护包含疑难杂字及其注音的疑难杂字表;
设置疑难杂字的注音规则;
扫描目标文档,根据疑难杂字表和注音规则,识别目标文档中出现的疑难杂字,并在目标文档中加注疑难杂字对应的拼音。
2.根据权利要求1所述的文档疑难杂字智能注音方法,其特征在于,所述存储和维护包含疑难杂字及其注音的疑难杂字表,包括:
收录并存储疑难杂字及其注音,生成疑难杂字表;
添加新的疑难杂字及其注音至疑难杂字表中;
修改已有的疑难杂字和/或其注音至疑难杂字表中;
删除已有的疑难杂字及其注音,更新疑难杂字表。
3.根据权利要求1所述的文档疑难杂字智能注音方法,其特征在于,所述设置疑难杂字的注音规则,包括:设置是否对疑难杂字设置强调格式并设置强调格式内容,以及设置注音位置、设置注音单位、设置注音左右符号、设置拼音间分隔符号。
4.根据权利要求3所述的文档疑难杂字智能注音方法,其特征在于,所述设置强调格式内容包括:设置字体加粗和/或强调背景;
所述设置注音位置包括:设置在疑难杂字的前或后注音;
所述设置注音单位包括:设置按字或词为单位注音;
所述设置注音左右符号包括:设置疑难杂字在前、注音在后并在注音外加括号,或者,设置注音在前、疑难杂字在后并在疑难杂字外加括号;
所述设置拼音间隔符号包括:设置拼音间是否用空格分隔,以及,若用空格分割时,选用全角空格或半角空格。
5.根据权利要求1所述的文档疑难杂字智能注音方法,其特征在于,所述扫描目标文档,包括:逐段落扫描目标文档正文中的文本,所述文本包括段落文本和/或表格中的文本。
6.根据权利要求1-5任一项所述的文档疑难杂字智...
【专利技术属性】
技术研发人员:郭世仁,廖琳,简友光,吴东庆,黄灏然,连剑波,周颖,曾梓冰,
申请(专利权)人:仲恺农业工程学院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。