语句解析系统以及程序技术方案

技术编号:19561796 阅读:18 留言:0更新日期:2018-11-25 00:28
提供一种能从以自然语言记述的语句中有效抽出发言的意图、价值判断的技术。在输入语句的必要的词素,预先通过词素解析部12设定了意义候选标签、感性主题标签。另外,通过构式解析部13,编写记述有包含意义候选标签、感性主题标签的文节、各标签的种类的索引40。意义属性抽出部15通过参照此索引40,在识别包含意义候选标签的文节、标签的种类的基础上,应用意义属性规则,在必要的文节中设定意义属性标签的同时,更新索引40。感性分析部16通过参照此索引40,在识别包含感性主题标签的文节、包含意义属性标签的文节的基础上,应用感性分析规则,在必要的文节设定感性属性标签。

Statement parsing system and program

Provides a technology that can effectively extract the intention and value judgment of speech from statements described in natural language. In order to input the necessary morphemes of sentences, the candidate labels of meaning and the perceptual subject labels are set in advance through the morpheme analysis unit 12. In addition, through the construction analysis section 13, an index 40 is compiled to describe the categories of meaningful candidate tags, perceptual subject tags and tags. By referring to the index 40, the meaning attribute extraction unit 15 updates the index 40 while setting the meaning attribute labels in the necessary sections by applying the meaning attribute rules on the basis of identifying the types of articles and labels containing the meaning candidate labels. By referring to the index 40, the Department of perceptual analysis applies the rules of perceptual analysis to set perceptual attribute labels in the necessary sections on the basis of identifying the sections containing perceptual subject labels and those containing meaningful attribute labels.

【技术实现步骤摘要】
【国外来华专利技术】语句解析系统以及程序
本专利技术涉及语句解析系统以及程序,尤其是通过电子公告牌上的发言数据、调查问卷的回答数据等电子化文件数据,自动收集终端用户关于特定的商品、服务等的主观评价、意见的技术。
技术介绍
终端用户对具体的商品、服务(以下“商品等”)的主观评价(感想)、发言意图,对于现行商品等的改良、下一代商品等的开发来说,是极为重要的指针。为此,各个企业从各种各样的观点出发,对从终端用户收集的调查问卷结果进行分析,或者访问网络上电子公告牌、查阅对自己公司商品等的评价。另外,为了实现这种人工分析作业的高效化,通过使用电脑对电子化语句进行自动解析,抽出终端用户对于特定商品等的评价的技术已经被提出。例如,专利文献1中公开了针对包含对于规定对象的情绪表达的语句,在实施词素处理、构式解析处理之后,参照注册了多种情绪表达的情感术语辞典,从该语句中抽出情绪表达的同时,统计各情绪表达的属性(消极/积极等),将其结果向外部输出的技术。其结果是,对于“口红”这一评价对象的色泽、气味、妆感、包装等多项评价轴的每一项,都可以提示否定评价与肯定评价的分布状况。专利文献1:特开2003-248681号公报但是,使用电脑对人类记述的自然语言所构成的语句进行解析时,一般会将语句分解成最小的构成单位——词素,在对词类等进行特定的词素解析、将各词素总结为多个文节的同时,对文节相互之间的联结关系实行确定的构式解析处理,以语法树的形式输出。接着,对于此语法树,按照规定的顺序适用多项规则,由于具备抽出了各文的意义内容等的构造,因此,随着语句结构变得复杂,判定规则可否应用将需要庞大的处理时间。对此,专利文献2中主张:对于无需参照语法树,即可通过词素的排列来判定可否应用的一部分规则,在词素解析的阶段应用规则,赋予意义属性,对于构式解析之后的语法树,仅应用剩余的规则,这样能够节约规则应用所需的判定时间。专利文献2:特开2005-092254号公报
技术实现思路
专利技术所要解决的课题然而,不参照语法树就能够判定其可否应用的规则的数量本身有限,即使在同一文献中,仅仅举例示出了意为“时间在前”的“~kara”和意为“理由”的“~kara”。实际上,为了从以自然语言记述的复杂语句中准确抽出作成者的意图、评价等意义内容等,思考文节之间的联结结构是很重要的,省略这一步骤而能够确定的,属于例外,为此,不得不说,即使应用了专利文献2的技术,也无法期待处理速度的急速提高。本专利技术的提出,是为了解决以往的此类问题,目的是提供可以从以自然语言记述的语句中有效抽出意义内容等的技术。用于解决课题的方案为了达成上述目的,权利要求1中记载的语句解析系统的特征是,具备以下手段:将输入的语句以词素为单位进行分解的手段;参照规定了特定词素与属性种类之间的对应关系的属性辞典,对于符合的词素设定事前标签的事前标签设定手段;将各词素以文节为单位汇集起来的同时,对各文节之间的联结关系进行特定的构式解析手段;生成记录有包含事前标签的文节的特定信息与该事前标签的种类形成的组合的索引的索引生成手段;储存了多项将至少指定包含特定种类的事前标签的文节的应用条件与指定属性标签设定对象文节以及设定的属性标签的种类的应用效果组合起来所构成的判定规则的判定规则记忆手段;参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的属性标签的判定手段。权利要求2中记载的语句解析系统是权利要求1中的系统,其特征在于:进而,上述属性辞典中的至少一个是规定了特定词素与意义属性的种类之间的对应关系的意义属性辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的意义候选标签,在上述索引,通过上述索引生成手段,记录下包含意义候选标签的文节的特定信息与该意义候选标签的种类形成的组合,在上述判定规则记忆手段中,储存有至少指定包含特定种类的意义候选标签的文节的应用条件与指定意义属性标签设定对象文节以及设定的意义属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的意义属性标签。权利要求3中记载的语句解析系统是权利要求2中的系统,其特征在于:进而,上述属性辞典中的至少一个是规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签,在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合,在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的意义属性标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。权利要求4中记载的语句解析系统是权利要求1中的系统,其特征在于:进而,作为上述属性辞典,至少具备规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典、规定了特定词素与大小表达的种类之间的对应关系的大小表达辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签以及大小表达标签,在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合、包含大小表达标签的文节的特定信息与该大小表达的种类形成的组合,在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的大小表达标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。权利要求5中记载的语句解析系统是权利要求1或权利要求4中的系统,其特征在于:进而,作为上述属性辞典,至少具备规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典、规定了特定词素与感性表达的种类之间的对应关系的感性表达辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签以及感性表达标签,在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合、包含感性表达标签的文节的特定信息与该感性表达标签的种类形成的组合,在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的感性表达标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。权利要求6中记载的语句解析程序,其特征在于将电脑作为以下手段发挥功能:本文档来自技高网
...

【技术保护点】
1.一种语句解析系统,其特征在于,具备:将输入的语句以词素为单位进行分解的手段;参照规定了特定词素与属性种类之间的对应关系的属性辞典,在符合的词素设定事前标签的事前标签设定手段;将各词素以文节为单位汇集起来的同时,对各文节之间的联结关系进行特定的构式解析手段;生成记录有包含事前标签的文节的特定信息与该事前标签的种类形成的组合的索引的索引生成手段;储存了多项将至少指定包含特定种类的事前标签的文节的应用条件与指定属性标签设定对象文节以及设定的属性标签的种类的应用效果组合起来所构成的判定规则的判定规则记忆手段;参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的属性标签的判定手段。

【技术特征摘要】
【国外来华专利技术】1.一种语句解析系统,其特征在于,具备:将输入的语句以词素为单位进行分解的手段;参照规定了特定词素与属性种类之间的对应关系的属性辞典,在符合的词素设定事前标签的事前标签设定手段;将各词素以文节为单位汇集起来的同时,对各文节之间的联结关系进行特定的构式解析手段;生成记录有包含事前标签的文节的特定信息与该事前标签的种类形成的组合的索引的索引生成手段;储存了多项将至少指定包含特定种类的事前标签的文节的应用条件与指定属性标签设定对象文节以及设定的属性标签的种类的应用效果组合起来所构成的判定规则的判定规则记忆手段;参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的属性标签的判定手段。2.如权利要求1所述的语句解析系统,其特征在于:上述属性辞典中的至少一个是规定了特定词素与意义属性的种类之间的对应关系的意义属性辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的意义候选标签,在上述索引,通过上述索引生成手段,记录下包含意义候选标签的文节的特定信息与该意义候选标签的种类形成的组合,在上述判定规则记忆手段中,储存有至少指定包含特定种类的意义候选标签的文节的应用条件与指定意义属性标签设定对象文节以及设定的意义属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的意义属性标签。3.如权利要求2所述的语句解析系统,其特征在于:上述属性辞典中的至少一个是规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签,在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合,在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的意义属性标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。4.如权利要求1所述的语句解析系统,其特征在于:作为上述属性辞典,至少具备规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典、规定了特定词素与大小表达的种类之间的对应关系的大...

【专利技术属性】
技术研发人员:大岛修渡边绩央
申请(专利权)人:株式会社野村综合研究所
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1