文档疑难杂字智能注音方法、系统、设备及介质技术方案

技术编号:29331371 阅读:41 留言:0更新日期:2021-07-20 17:48
本发明专利技术公开了一种文档疑难杂字智能注音方法、装置、设备及介质。文档疑难杂字智能注音方法,包括:存储和维护包含疑难杂字及其注音的疑难杂字表;设置疑难杂字的注音规则;扫描目标文档,根据疑难杂字表和注音规则,识别目标文档中出现的疑难杂字,并在目标文档中加注疑难杂字对应的拼音。文档疑难杂字智能注音装置,包括:疑难杂字表单元,配置用于存储和维护包含疑难杂字及其注音的疑难杂字表;以及配置用于设置疑难杂字的注音规则;智能注音单元,配置用于扫描目标文档,根据疑难杂字表和注音规则,识别目标文档中出现的疑难杂字,并在目标文档中加注疑难杂字对应的拼音。本发明专利技术还提供一种文档疑难杂字智能注音设备及计算机可读存储介质。

【技术实现步骤摘要】
文档疑难杂字智能注音方法、系统、设备及介质
本专利技术涉及汉字应用处理
,特别是涉及一种文档疑难杂字智能注音方法、系统、设备及介质。
技术介绍
中国文化博大精深,语言文字丰富多样。汉字是文化的载体,因为有了汉字,中华民族传统文化才得以传承。作为表意文字的汉字,有别于拼音文字,它所代表的意义远超出了汉字本身。汉字是语素文字,总数非常庞大,据估计,到目前为止,汉字数量达到11万左右。其中常用字大概7000左右。疑难杂字,也称生僻字(冷僻字),指不常见的或人们不熟悉的汉字。自有汉字以来,汉字也在不断发展中经历了由简到繁、由繁到简的“适者生存”的淘汰式选择和变化。在现代信息社会生活和工作中,文档中不可避免会用到一些不常用、很少见的文字,在文档的交流中,大多数人对这部分冷僻字是不认识和读不出音的,尤其是当文档打印输出交给其他人阅读时,阅读者对于出现疑难杂字的文档的理解程度、阅读体验都会受到限制。如果文档是呈交给领导的讲稿,领导拿讲稿公开讲话或做报告时,遇到不能准确读出拼音的疑难杂字,就会出现尴尬的场景,也会影响到讲稿文档制作者或编辑人员的工作评价。本文档来自技高网...

【技术保护点】
1.一种文档疑难杂字智能注音方法,其特征在于,包括:/n存储和维护包含疑难杂字及其注音的疑难杂字表;/n设置疑难杂字的注音规则;/n扫描目标文档,根据疑难杂字表和注音规则,识别目标文档中出现的疑难杂字,并在目标文档中加注疑难杂字对应的拼音。/n

【技术特征摘要】
1.一种文档疑难杂字智能注音方法,其特征在于,包括:
存储和维护包含疑难杂字及其注音的疑难杂字表;
设置疑难杂字的注音规则;
扫描目标文档,根据疑难杂字表和注音规则,识别目标文档中出现的疑难杂字,并在目标文档中加注疑难杂字对应的拼音。


2.根据权利要求1所述的文档疑难杂字智能注音方法,其特征在于,所述存储和维护包含疑难杂字及其注音的疑难杂字表,包括:
收录并存储疑难杂字及其注音,生成疑难杂字表;
添加新的疑难杂字及其注音至疑难杂字表中;
修改已有的疑难杂字和/或其注音至疑难杂字表中;
删除已有的疑难杂字及其注音,更新疑难杂字表。


3.根据权利要求1所述的文档疑难杂字智能注音方法,其特征在于,所述设置疑难杂字的注音规则,包括:设置是否对疑难杂字设置强调格式并设置强调格式内容,以及设置注音位置、设置注音单位、设置注音左右符号、设置拼音间分隔符号。


4.根据权利要求3所述的文档疑难杂字智能注音方法,其特征在于,所述设置强调格式内容包括:设置字体加粗和/或强调背景;
所述设置注音位置包括:设置在疑难杂字的前或后注音;
所述设置注音单位包括:设置按字或词为单位注音;
所述设置注音左右符号包括:设置疑难杂字在前、注音在后并在注音外加括号,或者,设置注音在前、疑难杂字在后并在疑难杂字外加括号;
所述设置拼音间隔符号包括:设置拼音间是否用空格分隔,以及,若用空格分割时,选用全角空格或半角空格。


5.根据权利要求1所述的文档疑难杂字智能注音方法,其特征在于,所述扫描目标文档,包括:逐段落扫描目标文档正文中的文本,所述文本包括段落文本和/或表格中的文本。


6.根据权利要求1-5任一项所述的文档疑难杂字智...

【专利技术属性】
技术研发人员:郭世仁廖琳简友光吴东庆黄灏然连剑波周颖曾梓冰
申请(专利权)人:仲恺农业工程学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1