用于智能文本注释的方法、系统和计算机程序技术方案

技术编号:4653601 阅读:233 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种用于为用户注释文本的方法、系统和计算机程序,所述方法包括由开发者执行的创建总结用户感兴趣的主题的主题地图的步骤;开发者还为每个主题创建数据结构、主题类;在计算机上执行的注释器程序自动地使用主题地图来创建两个链接的用户字典,即反映主题名称的主题字典和遍历字典,所述字典优选地为基于FSA的字典,反映主题的知识结构;开发者可选地将动作与主题类型链接;注释器使用字典和动作来自动地实例化在文本中找到的主题的主题数据结构(当它们之前已经被链接至主题类型时);注释器自动地将实例化的主题数据结构附于文本;开发者创建GUI,允许用户访问文本注释并与其交互。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及文字处理的领域;更具体地讲,本专利技术应用于注 释文本文档的方法。
技术介绍
利用文字处理器,可通过对文本的多个部分加下划线或高亮、在 页边空白或在文档中的任何位置的文本框中写入文本来注释文本。这 便利和加快了文本解释。此外,如果文本注释功能与语义模型相关, 则所述文本注释功能能够提供有用的知识,所述知识帮助用户甚至更 好地解释文本,便利他们采取一些快速动作。这还可以大大地增强许 多与文本相关的应用(诸如文本分类、主题检测和文档检索)的准确 度。 一些应用,诸如微软Word中的智能标签(Smart Tags),当被 启用时,识别数据的类型,诸如名称、日期或电话号码,并包含为每 种数据类型提供一个或多个动作所需的逻辑。可进行的动作取决于被 Word识别并用智能标签标记的数据类型。例如,如果在文本中识别 出"人名",则可进行下述动作诸如打开联系人、安排会议、添加 到联系人或插入地址。如果用户选择例如"添加到联系人",则启动 相应的用于更新联系人列表的Outlook功能,用户可非常快地将该信 息粘贴到他的地址簿中。然而,希望通过向文本提供更多知识并决定要执行的最佳动作来 提高文本解释。当今,没有向文本添加知识,或向文本添加了非常有 限的知识。
技术实现思路
本专利技术的一个目的是智能地注释文本以改进文本解释。根据权利要求1,该目的可利用在计算机上执行的方法来实现,所述方法使开发者注释被用户读取的文本,所述方法包括开发者创建主题地图,所述主题地图包含与用户相关联的兴趣主题;开发者为用户创建对应于主题模型的数据结构;计算机自动地读取主题地图,并为每个主题存储包含主题名称和 知识结构的主题信息;计算机自动地读取文本,并为文本中找到的每个主题检索存储的 主题信息并填写主题数据结构;计算机将填写的主题数据结构作为注释自动地附于在文本中找到 的相应主题。还利用从属权利要求的方法来实现本专利技术的目的。 根据权利要求10,还利用计算机程序产品来实现该目的,所述 计算机程序产品包含这样的程序代码指令,当在计算机上执行所述程 序时,所述程序代码指令执行根据权利要求1至8中的任一项所述的 方法的步骤。根据权利要求11,还利用包含这样的装置的系统来实现该目 的,所述装置适合于执行根据方法权利要求中的任一项所述的方法。方案的原理是提供一种语义模型,用于语义地结构化文本,以便 将文本中包含的信息变换为有用知识。利用本专利技术的方法创建的文本注释将帮助用户更好地理解文本、 导航与所述文本相关联的知识、将所述文本的内容与他的知识体系关 联、并便利他进行一些相关的快速动作。所述方案提供下述附加优点1、 将由某个用户感兴趣的主题地图代表的知识体系嵌入文本, 以帮助恰当地解释所述文本,增加用户对所述文本的理解,并引导用 户进行与所述文本相关的正确的快速动作。2、 支持基于语义模型的文本中的智能检索。3、 允许文本的上下文内的知识导航,由此在正确的时间传递正确的上下文中的正确信息。4、 不仅覆盖资源以上的元层,还连接元层内的资源(与文本相 关的)。5、 能够支持基于文本语义结构的文本分类。6、 能够使用来自其它源的标准化知识结构,诸如主题地图和从 主题地图创建的字典,所述主题地图和字典可被存储和重复使用。7、 利用基于FSA的字典来改进创建注释的方法的性能。8、 文本注释带来的知识包括与文本的被注释部分相关的动作, 所述文本读取器能够从文本界面激活这些动作。附图说明图1描述了根据按照本专利技术优选实施例的创建文本注释的方法的 上下文和逻辑块。图2是根据优选实施例的由设计者与用户上下文准备相关地建立 的主题地图的例子。图3是根据优选实施例的基于FSA的主题字典的样本,用户上 下文准备的一部分。图4描述了根据优选实施例的主题字典及其相关联的遍历字典中 的条目。图5是根据本专利技术的优选实施例以UML描述的主题注释类。 图6描述了使用字典和动作数据库的内容实例化的主题注释类。 图7示例了根据优选实施例产生的、用户可看到的文本注释。 图8是根据优选实施例的方法的整体流程图。 图9是图8的流程图的一个步骤的流程图,描述了根据优选实施例的主题注释类的实例4匕(instanciation )。图10描述了用于用户访问根据优选实施例的方法创建的文本注释的上下文和逻辑块。具体实施例方式6图1描述了特征化根据本专利技术的优选实施例用于创建注释文本的方法的上下文和逻辑块。为用户准备文本注释的人(100)将是在计 算机(110)上工作的设计者或程序开发者。开发者首先通过图形用户界面来准备主题地图,在所述主题地图中,开发者输入示例特定用 户的兴趣的互相关信息。该主题地图将按照用户感兴趣的主题来定向知识的结构和内容,将用于该用户的文本注释。稍后参照图2的说明 在本文中描述主题地图的原理。保持主题地图数据库(130)存储已 经创建的代表用户兴趣的主题地图。作为一个程序或一组程序,在计 算机上运行注释器(150)来帮助开发者自动地执行用于注释文本的 方法的一些步骤。开发者首先让程序读取一个主题地图,并提取所有 必需的信息来创建与相应用户相关联的两个字典主题字典(170) 和遍历字典(160)。稍后参照图3和4的说明在本文中描述字典的 说明。在本专利技术的优选实施例中,文本注释包括与文本的主题相关联 的动作。在该情况下,开发者创建与主题地图的主题相关联的动作, 并将它们存储在数据库,即动作数据库(135)中。动作数据库(当 被创建时)和字典也是为用户创建他的文本注释的上下文的一部分。 上下文与一个用户相关联、或与由具有相同简档的人形成的一个群体(诸如公司的一个部门等)相关联。为了开始创建(例如,从数据库 180获取的)给定文本的注释,开发者创建知识结构的数据结构。该 数据结构可以是数据库(140)中存储的以UML语言或任何其它建 模语言创建的注释主题类。如果在创建文本注释中考虑动作,则开发 者可决定创建包含"动作"对象的类。然后,开发者运行注释器(150),所述注释器(150)识别文本的主题,并为每个识别的主 题,使用来自字典的信息自动地创建主题类的实例化。如果使用动作 数据库(135),则注释器将处理程序链接至实例化的主题类的动 作。然后,注释器通过将实例化的类附于在文本中找到的相应主题来 创建文本中的注释。然后,开发者创建GUI (用户GUI l卯),所述 GUI将允许读取被注释文本的用户通过例如茱单来以逻辑方式访问 该注释。给定主题地图的标准结构,可为所有用户的所有文本开发通用用户GUI。然而,开发者可为一个用户或为一个用户的一个具体文本 定制用户GUI。应注意,注释器是这样的程序,所述程序帮助为与任何用户、或 由具有相同简档的人组成的任何群体相关联的文本创建注释。事实 上,注释器能够读取任何ISO标准主题地图和以任何特定建模语言 写入的任何主题对象类。即使开发者改变用于描述主题类的建模语言, 一旦定义了类,就 可使用同一注释器程序来实例化所述类,并在文本中包括注释。图2是根据优选实施例,设计者与用户上下文准备相关地建立的 主题地图的例子。主题地图是用于描述知识结构,并将它们与信息资 源相关联的新的ISO标准,由此使得未被结构化的信息被结构化 (httD:〃www.topicm本文档来自技高网...

【技术保护点】
一种在计算机上执行的方法,用于开发者注释由用户读取的文本,所述方法包括: 开发者创建包含与用户相关联的兴趣主题的主题地图; 开发者创建对应于用户的主题模型的数据结构; 计算机自动地读取主题地图,并为每个主题存储包含主题名称 和知识结构的主题信息; 计算机自动地读取文本,并为在文本中找到的每个主题检索存储的主题信息并填写主题数据结构; 计算机自动地将填写的主题数据结构作为注释附于在文本中找到的相应主题。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:H埃尔辛辛尼A拉格赫布M德亚布A阿布杜勒瓦尼斯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1