An annotation aid that provides easy and low local construction of text annotations. Note the data generation auxiliary system (160) includes an input output device (202), through dialogue to accept input; morpheme analysis system (380) and the dependency relation analysis system (382), the text file (192) parses the text data and morpheme dependency parsing; first ~ fourth candidate generation unit (388 390, 392, and 394), the morpheme string in the predicate dependency relation in the detection of omitted or deixis, determine the annotation processing position of the object, using the language knowledge to the presumption of insert performance candidates; alternate DB (386), storing the inferred candidates; and dialogue annotation device (396) from DB (386), alternate reading annotation processing waiting through the input and output device (202) the dialogue processing and choose the candidate for additional comments.
【技术实现步骤摘要】
【国外来华专利技术】注解辅助装置及用于其的计算机程序
本专利技术涉及自然语言处理技术,尤其是涉及用于对文本有效地进行针对自然语言的语句中频繁出现的省略、代词等指示语的照应关系的注解的注解辅助装置。
技术介绍
在自然语言的文本中,频繁出现省略以及指示语。例如考虑图1所示的例句30。例句30包括第一句和第二句。在第二句中包含「其」这一指示语(代词)42。在该情况下,「其」这一指示语指代第一句的「农历新年的日期」这一表现40。将如此确定指示语所指代的词语的处理称为「照应解析」。另一方面,考虑图2的例句60。该例句60包括第一句和第二句。在第二句中,省略了「搭载自诊断功能」这一谓语部分的主语,在该主语的省略位置76,省略了第一句的「新型交换机」这一单词72。同样地,省略了「预定设置200系统。」这一谓语部分的主语。在该主语的省略位置74,省略了第一句的「N公司」这一单词70。将如此检测主语等的省略并且对其进行补足的处理称为「省略解析」。以后,将照应解析和省略解析一起称为「照应/省略解析」。在所谓的人工智能中,为了取得与人的交流,自然语言处理是不可缺少的技术。作为自然语言处理的重要的问题,存在自动翻译以及问题解答等。照应/省略解析的技术,在这种自动翻译以及问题解答中是必不可少的技术。但是,现状的照应/省略解析的技术水平,虽然也根据语言而不同,但是还未达到实用级别。如此,照应/省略解析的性能不能提高的理由,可以考虑各种理由。作为主要的理由,可以列举在这种解析中需要一般常识。为了考虑一般常识,需要考虑与照应/解析相关的人的判断。但是,考虑了这样的要素的解析算法比较困难。归根到底,需要准备大 ...
【技术保护点】
一种注解辅助装置,对用于自然语言句子的照应/省略解析的注解数据的生成进行辅助,所述注解辅助装置包括:输入输出单元,其包括显示装置和输入装置,通过与用户的对话型处理来受理用户输入;读出单元,其从成为注解对象的文本档案中读出文本数据;解析单元,其进行所述读出单元读出的文本数据的词素解析以及依存解析,输出附加了表示依存构造的信息的词素串;谓语检索单元,其检索所述解析单元输出的词素串中的谓语;对象确定单元,其用于检测在所述谓语检索单元检索出的各个谓语参与的依存关系中针对该谓语省略了应处于规定关系的单词的情况或者成为指示语的情况,并作为注解处理的对象,确定该单词的位置;候补推定单元,其针对所述对象确定单元所确定的各个所述单词的位置,使用该位置与周围词素串的关系以及语言知识,来推定应插入到该位置的表现的候补;候补存储单元,其将由所述候补推定单元推定出的候补与所述单词的位置建立关联地进行存储;候补显示单元,其针对所述注解处理的各个对象,从所述候补存储单元读出所述候补推定单元推定出的候补,在所述显示装置显示为用户能够选择任意一个;和对话式选择单元,其响应对由所述候补显示单元显示的任一个候补进行选择的用 ...
【技术特征摘要】
【国外来华专利技术】2015.01.23 JP 2015-0114911.一种注解辅助装置,对用于自然语言句子的照应/省略解析的注解数据的生成进行辅助,所述注解辅助装置包括:输入输出单元,其包括显示装置和输入装置,通过与用户的对话型处理来受理用户输入;读出单元,其从成为注解对象的文本档案中读出文本数据;解析单元,其进行所述读出单元读出的文本数据的词素解析以及依存解析,输出附加了表示依存构造的信息的词素串;谓语检索单元,其检索所述解析单元输出的词素串中的谓语;对象确定单元,其用于检测在所述谓语检索单元检索出的各个谓语参与的依存关系中针对该谓语省略了应处于规定关系的单词的情况或者成为指示语的情况,并作为注解处理的对象,确定该单词的位置;候补推定单元,其针对所述对象确定单元所确定的各个所述单词的位置,使用该位置与周围词素串的关系以及语言知识,来推定应插入到该位置的表现的候补;候补存储单元,其将由所述候补推定单元推定出的候补与所述单词的位置建立关联地进行存储;候补显示单元,其针对所述注解处理的各个对象,从所述候补存储单元读出所述候补推定单元推定出的候补,在所述显示装置显示为用户能够选择任意一个;和对话式选择单元,其响应对由所述候补显示单元显示的任一个候补进行选择的用户的指示,将所选择的候补作为注解而附加到所述位置。2.根据权利要求1所述的注解辅助装置,其中,所述候补推定单元包括:疑问句生成单元,其针对所述对象确定单元所确定的各个所述单词的位置,使用该位置的周围的单词串来生成用于询问应插入到该单词的位置的单词的句子;疑问句输入单元,其将所述疑问句生成单元所生成的疑问句作为输入提供给预先准备的问题解答系统;和根据针对从所述疑问句输入单元提供的疑问句而从所述问题解答系统获得的回答,使应插入到所述单词的位置的单词的候补与该单词的位置建立关联地存储到所述候补存储单元中的单元。3.根据权利要求2所述的注解辅助装置,其中,所述候补推定单元还包括:语言知识存储单元,其存储多个语言知识规则;匹配表现提取单元,其针对所述对象确定单元所确定的各个所述单词的位置,确定与所述语言知识存储单元中所存储的任一语言知识匹配、并且包括该单词的位置和确定该单词的位置时使用的所述谓语的表现;和通过对由所述匹配表现提取单...
【专利技术属性】
技术研发人员:饭田龙,鸟泽健太郎,桥本力,吴钟勋,大竹清敬,木俵丰,
申请(专利权)人:国立研究开发法人情报通信研究机构,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。