【技术实现步骤摘要】
本申请总体上涉及信息处理,具体来说涉及文档处理,更具体地,涉及一种文档处理方法和装置,文档处理所使用的模板的生成方法和装置,以及文档处理和模板的生成所使用的概念库的生成方法和装置。
技术介绍
现有技术中已知各种在信息处理设备例如计算机、移动设备、个人数字助理(PDA) 等上编辑自然语言文档的工具。从文字输入、文档编辑、文档交换、文档输出的角度,文档中所使用的文字本身都是代码化的,以便信息处理设备识别和处理。例如包括英文字母和数字以及其它有关符号的ASCII码、各种汉字编码方案等等。实践中存在在语义层面加强文档的互交换性的需要。也就是需要使信息处理设备能够“理解”和交换文档所表达的语义,而不只是文字本身。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。本申请第一方面的目的是提供一种能够同时编辑自然语言文档和生成机器可处理文档的文档处理方法和工具。本申请另一方面的目的是提供能够用于前述文档处理方法和工具的模板生成方法和工具。本申请再一方面的目的是提供能够用于前述文档处理方法和工具和/或模板生成方法和工具的概念库生成方法和工具。为实现上述第一方面的目的,根据本申请所提供的一种实施例,提供了一种文档处理方法,包括获取模板,该模板由至少一个语义项目构成,各个语义项目的候选值以及各个语义项目之间的关系与机器可处理的语义代 ...
【技术保护点】
1.一种文档处理方法,包括:获取模板,该模板由至少一个语义项目构成,各个语义项目的候选值以及各个语义项目之间的关系与机器可处理的语义代码相关联,并且该模板与相应的自然语言表达模式相关联;接收针对该模板的至少一个语义项目的输入值;基于所述输入值、各个语义项目之间的关系以及所关联的机器可处理的语义代码,生成包括所述机器可处理的语义代码的机器可处理的文档,以及基于所述输入值以及所述自然语言表达模式生成包括所述输入值的自然语言文档。
【技术特征摘要】
1.一种文档处理方法,包括获取模板,该模板由至少一个语义项目构成,各个语义项目的候选值以及各个语义项目之间的关系与机器可处理的语义代码相关联,并且该模板与相应的自然语言表达模式相关联;接收针对该模板的至少一个语义项目的输入值;基于所述输入值、各个语义项目之间的关系以及所关联的机器可处理的语义代码,生成包括所述机器可处理的语义代码的机器可处理的文档,以及基于所述输入值以及所述自然语言表达模式生成包括所述输入值的自然语言文档。2.如权利要求1所述的文档处理方法,其中,接收针对该模板的至少一个语义项目的输入值包括显示所述至少一个语义项目的输入界面;经由所述输入界面接收所述输入值。3.如权利要求2所述的文档处理方法,其中,显示所述至少一个语义项目的输入界面包括识别该模板中的核心概念;识别该模板中所述至少一个语义项目与所述核心概念的相互关系;从概念库中获取修饰概念,所述修饰概念与所述核心概念的相互关系,同所述语义项目与所述核心概念之间的相互关系相同;基于所述修饰概念生成所述输入界面,用于输入所述语义项目的值。4.如权利要求1所述的文档处理方法,其中,接收针对该模板的至少一个语义项目的输入值包括从外部设备接收输入。5.如权利要求1所述的文档处理方法,其中,获取模板包括从外部设备获取模板。6.如权利要求1所述的文档处理方法,其中,获取模板包括按照需要的自然语言模式构建模板。7.如权利要求1所述的文档处理方法,其中,获取模板包括将自然语言文档样本中的可变的句子成份替换为模板的语义项目,从而形成模板。8.如权利要求1-7之一所述的文档处理方法,其中,所述文档为基于临床文档架构标准的文档。9.一种用于从自然语言文档样本生成如权利要求1-8之一所述的方法所使用的模板的方法,包括识别所述自然语言文档样本中的核心概念及其它句子成份;确定每一句子成份的当前概念与所述核心概念的关系;搜索所述概念库中的修饰概念,所述修饰概念与所述核心概念的关系,同所述当前概念与所述核心概念之间的关系相同;基于搜索结果生成模板的语义项目,以及在存在具有相同关系的修饰概念的情况下,基于所述具有相同关系的修饰概念生成该语义项目的候选值。10.如权利要求9所述的方法,其中,基于搜索结果生成模板的语义项目包括在存在所述具有相同关系的修饰概念的句子成份中选定感兴趣的句子成份作为所述模板的具有候选值选项的语义项目;以及将其它句子成份替换为没有候选值选项的语义项目。11.一种用于从自然语言文档样本生成如权利要求1-8之一所述的方法所使用的模板的方法,包括显示所述自然语言文档样本;选定所述自然语言文档样本中的感兴趣的句子成份作为所述模板的核心概念和其它语义项目;确定所述语义项目的当前概念与所述核心概念的关系;搜索所述概念库中的修饰概念,所述修饰概念与所述核心概念的关系,与所述当前概念与所述核心概念之间的关系相同;在存在具有相同关系的修饰概念的情况下,基于具有相同关系的修饰概念生成该语义项目的候选值。12.如权利要求9-11之一所述的方法,其中,基于具有相同关系的修...
【专利技术属性】
技术研发人员:李静,胡岗,曹锋,王晓元,任永亮,李中,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。