上下文解析装置及上下文解析方法制造方法及图纸

技术编号：10676084 阅读：180 留言：0更新日期：2014-11-26 11:29

实施方式的上下文解析装置(100)具备机器学习用事例生成器(3)和照应解析预测器(5)。机器学习用事例生成器(3)具备预测序列生成部(32)和概率预测部(33)。预测序列生成部(32)以具有共有项的谓语、确定该谓语的语义的语义确定信息、和表示上述共有项的格的种类的格种类信息的组合为要素，从解析对象文书(D6)生成预测序列，该预测序列通过预测求出将该要素排列有多个的序列的一部分要素。概率预测部(33)基于从任意的文书群(D1)事先获得的与上述预测序列一致的上述序列的出现概率，预测上述预测序列的发生概率。照应解析预测器(5)使用预测出的上述预测序列的发生概率，进行对解析对象文书(D6)的上下文解析。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】实施方式的上下文解析装置(100)具备机器学习用事例生成器(3)和照应解析预测器(5)。机器学习用事例生成器(3)具备预测序列生成部(32)和概率预测部(33)。预测序列生成部(32)以具有共有项的谓语、确定该谓语的语义的语义确定信息、和表示上述共有项的格的种类的格种类信息的组合为要素，从解析对象文书(D6)生成预测序列，该预测序列通过预测求出将该要素排列有多个的序列的一部分要素。概率预测部(33)基于从任意的文书群(D1)事先获得的与上述预测序列一致的上述序列的出现概率，预测上述预测序列的发生概率。照应解析预测器(5)使用预测出的上述预测序列的发生概率，进行对解析对象文书(D6)的上下文解析。【专利说明】
本专利技术涉及进行上下文解析的。
技术介绍
照应解析(AnaphoraResolut1n)、首尾一贯性的解决(CoreferenceResolut1n)、对话处理(Dialog Processing)等上下文解析(Contextual Analysis)在自然语言处理中在正确地理解文书方面是重要的任务。在上下文解析中，已知使用香克(Schank)的脚本(script)或菲尔莫尔(Fillmore)的框架(frame)那样的程序性知识(procedural knowledge)是有效的。但是，在由人工制作的程序性知识方面有覆盖度(coverage)的极限。所以，尝试自动从文书获得这样的程序性知识的途径(approach)。例如，提出了将相互关联的谓语的序列(以下称作“事件序列(eventsequence) ”)看作...

【技术保护点】
一种上下文解析装置，具备：预测序列生成部，以具有共有项的谓语、确定该谓语的语义的语义确定信息、和表示上述共有项的格的种类的格种类信息的组合为要素，从解析对象的文书生成预测序列，该预测序列是通过预测而求出了排列有多个上述要素的序列中的一部分要素的序列；概率预测部，基于从任意的文书群事先获得的与上述预测序列一致的上述序列的出现概率，预测上述预测序列的发生概率；以及解析处理部，使用预测到的上述预测序列的发生概率，进行对于解析对象的文书的上下文解析。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：浜田伸一郎，
申请(专利权)人：株式会社东芝，东芝解决方案株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人