【技术实现步骤摘要】
本专利技术涉及信息分析领域,尤其涉及一种指示描述信息的歧义的方法和装置。
技术介绍
现有技术中,用户之间或人机之间或机器与机器之间基于描述信息进行交互时,通常容易遇到理解或分析上的歧义,例如,对于一段描述信息“用户登录成功,如果当前用户是管理员,可以锁定任何用户”,在该段描述信息中,词“用户”第一次作为主语出现,第二次作为宾语出现,从而引发两次出现的“用户”是指同一用户还是指不同用户的歧义。歧义的出现,往往导致交互各方的交互效率显著降低,特别在业务需求领域,业务方(也即提出需求的当事方)通过将描述的需求信息提供给需求实现方,如果描述的需求信息存在歧义,则容易导致实现方在需求实现的效果上与业务方的实际需求背道而驰。
技术实现思路
本专利技术解决的技术问题之一通过将描述信息中存在歧义的地方指出,以更好地为交互的一方或多方明确描述信息是否足够清楚,从而提升交互效率。根据本专利技术的一个实施例,提供了一种指示描述信息的歧义的方法,包括:接收输入的描述信息;将所述描述信息分为句子;将句子分成词意基本单位;基于对句子的语法分析,获得第一判断结果,其中所述第一判断结果
包括句子的语法分析的结果;基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果,其中所述第二判断结果包括所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的判断结果;基于第一判断结果和第二判断结果,指示描述信息的歧义。根据本专利技术的另一个实施例,提供了一种指示描述信息的歧义的装置,包括:信息接收单元,被配置为接收输 ...
【技术保护点】
一种指示描述信息的歧义的方法,包括:接收输入的描述信息;将所述描述信息分为句子;将句子分成词意基本单位;基于对句子的语法分析,获得第一判断结果,其中所述第一判断结果包括句子的语法分析的结果;基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果,其中所述第二判断结果包括所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的判断结果;基于第一判断结果和第二判断结果,指示描述信息的歧义。
【技术特征摘要】
1.一种指示描述信息的歧义的方法,包括:接收输入的描述信息;将所述描述信息分为句子;将句子分成词意基本单位;基于对句子的语法分析,获得第一判断结果,其中所述第一判断结果包括句子的语法分析的结果;基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果,其中所述第二判断结果包括所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的判断结果;基于第一判断结果和第二判断结果,指示描述信息的歧义。2.根据权利要求1所述的方法,其中所述词意基本单位包括词和/或词组。3.根据权利要求1所述的方法,其中所述接收输入的描述信息的步骤还包括:基于预定的约束条件,过滤掉违反约束条件的所述描述信息,其中所述将所述描述信息分为句子的步骤包括:将过滤后的描述信息分为句子。4.根据权利要求1所述的方法(1),其中所述将所述句子句子分成词意基本单位(S103)的步骤包括:参考通用词意基本单位库和专业词意基本单位库,将句子分成词意基本单位。5.根据权利要求1所述的方法,其中所述基于对句子的语法分析,获得第一判断结果包括:基于对句子的语法分析、以及句子的句型是否匹配于白名单句型库中的句型,获得第一判断结果,其中白名单句型库配置为存储有虽不符合语法但无歧义的句型。6.根据权利要求5所述的方法,其中白名单句型库中的句型是预先设置的。7.根据权利要求5所述的方法,还包括:响应于接收到用户对指示的描述信息的歧义是句子不符合语法的错判纠正反馈,从错判纠正反馈所针对的句子提取出句型;将提取出的句型放入所述白名单句型库。8.根据权利要求1所述的方法,其中基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果的步骤包括:-基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位、以及该多次出现的词意基本单位是否在白名单词意基本单位库中,获得第二判断结果;其中白名单词意基本单位库配置为存储有虽在描述信息中以多种词性和/或作为不同的语法成分多次出现、但无歧义的词意基本单位。9.根据权利要求8所述的方法,其中白名单词库中的词意基本单位是预先设置的。10.根据权利要求8所述的方法,还包括:响应于接收到用户对指示的描述信息的歧义是所述描述信息中含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的错判纠正反馈,将错判纠正反馈所针对的所述词意基本单位放入白名单词意基本单位库。11.根据权利要求4所述的方法,其中通用词意基本单位库包含通用词和通用词组,专业词意基本单位库包含专业词和专业词组,其中通用词组是响应于用户的输入而添加到通用词意基本单位库的,专业词组是响应于用户的输入而添加到专业词意基本单位库的。12.根据权利要求1所述的方法,还包括:如果指示的描述信息的歧义是句子不符合语法,提示对应的修改建议;响应于接收到对所述修改建议的接受或选择,消除所述修改建议的提示。13.根据权利要求10所述的方法,还包括:如果指示的描述信息的歧义是句子不符合语法,根据历史上在指示的描述信息的歧义是同一句子不符合语法的情况下接收到的对提示的修改建议的接受或选择的次数与预定阈值的比较,确定是否采用该修改建议。14.一种指示描述信息的歧义的装置,包括:信息接收单元,被配置为接收输入的描述...
【专利技术属性】
技术研发人员:张翔,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。