文本一致性编辑方法技术

技术编号:6108795 阅读:273 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种文本一致性编辑方法,文本一致性编辑方法包含专有词词库加载模块、专有词定制模块、专有词保存模块、候选专有词列表构建模块及候选专有词显示模块。当用户开始进行文本编辑时,专有词词库加载模块将负责加载专有词词库。用户利用专有词定制模块在编辑文本时定制专有词。利用专有词保存模块保存用户定制的专有词。候选专有词列表构建模块根据当前输入的字符串在专有词词库中查找并构建候选专有词列表。候选专有词显示模块列出候选专有词列表,协助用户决定当前编辑的字符串是否为已定制的专有词。从而维持用户前后输入专有词的一致性。

【技术实现步骤摘要】

本专利技术涉及文本编辑
,尤其涉及一种能够协助用户编辑文本,使得文本 中使用的专有词前后一致的。
技术介绍
用户通过键盘操作输入字符编辑文本逐渐普及。无论是工作中还是生活中,随着 互联网及计算机技术的发展,用户通过键盘操作进行电子邮件的撰写、专利的撰写、会议内 容记录及博文的发布等已经变得很普遍。现有研究多围绕对文字的编码进行改进,通过缩 短编码长度,降低重码,进而提高键盘操作进行文本编辑的效率。同时,一些传统技术是基 于由用户输入的字符序列提出预期字符序列,从增强文本输入操作效率并简化其操作。一 些智能拼音输入法则通过记录缩写及缩写对应的词组或句子来实现个人输入定制。通过为 拼音输入法提供智能组句功能,降低用户选词时间,提升选词的准确率。同时,谷歌拼音输 入法通过根据用户上传到服务器端的个人字典,构造个性化语言模型。不同用户的输入内 容在语言风格上,可能又较大的差异,借助于个性化的语言模型,谷歌拼音输入法对于用户 输入的字和词,特别是词组和语句的匹配会更加符合用户的行文风格及聊天习惯,提高文 本编辑的效率。而目前针对进行单个文本编辑时经常出现的前后引用或定义的专有词不一致问 题没有被重视,但这个问题却经常困扰诸如专利撰写者及论文撰写者。一致性的文本编辑可以提高用户编辑效率。智能输入法能够根据用户习惯来进行 候选列表的搭建,但是这并能够解决上文提到的不一致性问题。因此,目前急需一种能够支持文本一致性编辑的方法。
技术实现思路
本专利技术的目的是通过定制、保存及查找匹配用户自定制专有词的系统方法,来支 持用户的一致性文本编辑,提高文本编辑过程中前后引用或输入的自定义的字符串的一致 性,为此提供一种。为了实现所述的目的,本专利技术提出的一种,是利用专有词词 库加载模块、专有词定制模块、专有词保存模块、候选专有词列表构建模块及候选专有词显 示模块实现文本一致性编辑的步骤如下步骤Sl 对文本进行编辑时,专有词词库加载模块通过专有词词库中的文件标识 来定位专有词词库,并在用户打开当前文本进行编辑时,将所定位的专有词词库分别加载 到用户当前使用的输入法的词码表中及内存中,支持对专有词词库的进一步查询和更新操 作;步骤S2 在用户选定一个在当前编辑的文本中输入的字符串作为待定制的专有 词后,用户利用专有词定制模块判断内存中的专有词词库中是否已存在与当前待定制的专 有词相似或是相同的专有词,如果已存在与当前待定制的专有词相似或是相同的专有词,则提示用户当前选定的作为待定制的专有词已被定制,执行步骤S4;如果不存在与当前待 定制的专有词相似或是相同的专有词,则执行步骤S3 ;步骤S3 专有词保存模块将被定制的专有词保存在内存中的专有词词库及用户 当前使用的输入法的词码表中;步骤S4:当用户选定当前编辑的文本中的某一字符串时,候选专有词列表构建模 块根据当前输入字符串在内存中的专有词词库中查找候选专有词,生成候选专有词列表;步骤S5 候选专有词显示模块根据候选专有词与当前用户输入字符串的相似度 对候选专有词进行排序,列出候选专有词列表,协助用户决定当前编辑的字符串是否为已 定制的专有词,从而维持用户前后输入的专有词的一致性。优选实施例步骤Sl所述专有词词库用来存放用户在编辑所述专有词词库所属 的文本文件过程中定制的所有专有词,专有词词库的记录拥有文本文件标识、编码、拼音和 汉语词组字段;根据文本文件标识定位专有词词库所属的文本文件。优选实施例步骤Sl所述专有词词库加载模块在保存当前编辑的文本或关闭文 本编辑器后,自动将内存中的当前最新版本的专有词词库以文件形式保存在与所属的文本 本件相同的路径下,并覆盖原有文件,保存专有词词库的文件的默认属性为隐藏只读。优选实施例步骤S2所述专有词定制模块是以插件形式运行在文本编辑器上,用 户主动选择是否定制所输入的新字符串。优选实施例步骤S4所述候选专有词列表的构建是由候选专有词列表构建模块 根据当前编辑的文字的完整性采用无编码候选列表生成算法实现;候选专有词列表构建模 块根据用户主动选定的字符串在专有词词库中选出与用户主动选定的字符串相近的候选 专有词。优选实施例步骤S4所述候选专有词列表构建模块根据当前编辑的字符串在专 有词词库中查找候选专有词的方法是动态规划方法或相似度查找算法。当用户打开当前 文本进行编辑时,候选专有词列表构建模块通过为专有词词库中的专有词分配最高的相似 度、权重或评分,使用户当前使用的输入法中已经定制的专有词被优先列出。优选实施例步骤S5所述协助用户决定当前编辑的字符串是否为已定制的专有 词是通过在用户主动选定某一字符串后,列出候选专有词列表来实现;候选专有词列表显 示在当前编辑的文本旁;用户根据显示的候选专有词列表确定当前编辑字符串所表达的含 义是否已经定义及存在于专有词词库中。优选实施例在用户进行文本拷贝操作时,步骤Sl所述的专有词词库加载模块将 提示用户是否将与所属的文本本件在相同的路径下的保存专有词词库的文件同时进行拷 贝,保证被拷贝到其他位置的文本在再次打开时可以成功定位到属于所打开的文本的保存 专有词词库的文件。本专利技术的有益效果是一种与文本编辑器及文本输入法无关 的方法。的具体实施难点涉及专有词词库加载的实施,候选专有词列 表构建的实施。专有词词库加载的实施利用专有词词库加载模块加载专有词词库包含将专有词 词库加载到内存中及将专有词词库中的内容加载到用户当前使用的输入法的词码表中。将 专有词词库存储在内存中可以提高对专有词词库的查找及更新速度。候选专有词列表构建的实施首先,候选专有词列表构建模块根据当前编辑的字 符串在专有词词库中查找候选专有词的查找可以是动态规划方法等相似度查找算法等。候 选专有词列表构建方法根据当前编辑的文字的完整性可以也可采用无编码候选列表生成 算法等。1)协助文本编辑者进行一致性文本编辑,提高文本编辑过程中前后引用或输入的 自定义的新词或新字符串的一致性;2)所述的适合工作于任何文本编辑器上,例如Microsoft Off ice、金山WPS Office、UltraEdit等。适用于专利撰写、论文撰写等各类文档的撰写,在 需要定义新词或新字符串的文本编辑过程中,帮助用户进行一致性文本编辑,进而提高工 作效率及工作质量。附图说明图1为本专利技术提供的流程图。图2为图1提供的文本一致性编辑系统示意图。具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照 附图,对本专利技术进一步详细说明。图2示出的文本一致性编辑系统示意图,所述系统利用计算机实现专有词词库加 载模块101、专有词定制模块103、专有词保存模块104、候选专有词列表构建模块107及候 选专有词显示模块108。利用图2示出的文本一致性编辑系统实现图1示出的,所述 文本一致性编辑的一种实施方式的步骤如下步骤Sl 对文本进行编辑时,专有词词库加载模块101通过专有词词库中的文件 标识来定位专有词词库,并在用户打开当前文本进行编辑时,将所定位的专有词词库分别 加载到用户当前使用的输入法的词码表中及内存中,支持对专有词词库的进一步查询和更 新操作。当用户利用文本编辑器102进行文本编辑时,首先将打开文本文件,与此同时专 有词词库加载模块101本文档来自技高网...

【技术保护点】
1.一种文本一致性编辑方法,其特征在于:利用专有词词库加载模块、专有词定制模块、专有词保存模块、候选专有词列表构建模块及候选专有词显示模块实现文本一致性编辑的步骤如下:步骤S1:对文本进行编辑时,专有词词库加载模块通过专有词词库中的文件标识来定位专有词词库,并在用户打开当前文本进行编辑时,将所定位的专有词词库分别加载到用户当前使用的输入法的词码表中及内存中,支持对专有词词库的进一步查询和更新操作;步骤S2:在用户选定一个在当前编辑的文本中输入的字符串作为待定制的专有词后,用户利用专有词定制模块判断内存中的专有词词库中是否已存在与当前待定制的专有词相似或是相同的专有词,如果已存在与当前待定制的专有词相似或是相同的专有词,则提示用户当前选定的作为待定制的专有词已被定制,执行步骤S4;如果不存在与当前待定制的专有词相似或是相同的专有词,则执行步骤S3;步骤S3:专有词保存模块将被定制的专有词保存在内存中的专有词词库及用户当前使用的输入法的词码表中;步骤S4:当用户选定当前编辑的文本中的某一字符串时,候选专有词列表构建模块根据当前输入字符串在内存中的专有词词库中查找候选专有词,生成候选专有词列表;步骤S5:候选专有词显示模块根据候选专有词与当前用户输入字符串的相似度对候选专有词进行排序,列出候选专有词列表,协助用户决定当前编辑的字符串是否为已定制的专有词,从而维持用户前后输入的专有词的一致性。...

【技术特征摘要】

【专利技术属性】
技术研发人员:谭杰李娜
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1