一种信息分析方法及电子设备技术

技术编号:14898783 阅读:122 留言:0更新日期:2017-03-29 13:56
本发明专利技术公开了一种信息分析方法及电子设备,所述方法包括:从文本信息中获取到至少两个词汇信息;获取到所述至少两个词汇信息的属性集合;基于所述至少两个词汇信息,选取至少一个规则模板;利用所述至少两个词汇信息的属性集合中的至少一个属性值,以及所述至少一个规则模板中的规则部分以及属性值约束关系表达式,获取到所述文本信息对应的含义。

【技术实现步骤摘要】

本专利技术涉及信息处理领域的信息分析技术,尤其涉及一种信息分析方法及电子设备。
技术介绍
现有技术方案,通过规则模板+领域命名实体识别的方法来分析句子,没有利用领域命名实体的属性,以及命名实体属性间的关系。一般来说,一句完整的语句中,命名实体之间是有一定关系的,但是,目前采用现有技术方案无法获取到准确的语句含义。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种信息分析方法及电子设备,能至少解决现有技术存在的上述问题。本专利技术实施例提供了一种信息分析方法,所述方法包括:从文本信息中获取到至少两个词汇信息;获取到所述至少两个词汇信息的属性集合;其中,所述属性集合中包括有至少一个属性类型、每一个属性类型中包括属性值;基于所述至少两个词汇信息,选取至少一个规则模板;其中,规则模板中包括:至少由属性类型构成的规则部分、以及属性值约束关系表达式;利用所述至少两个词汇信息的属性集合中的至少一个属性值,以及所述至少一个规则模板中的规则部分以及属性值约束关系表达式,获取到所述文本信息对应的含义。本专利技术实施例还提供了一种电子设备,包括:文本信息处理单元,用于从文本信息中获取到至少两个词汇信息;属性获取单元,用于获取到所述至少两个词汇信息的属性集合;其中,所述属性集合中包括有至少一个属性类型、每一个属性类型中包括属性值;模板获取单元,用于基于所述至少两个词汇信息,选取至少一个规则模板;其中,规则模板中包括:至少由属性类型构成的规则部分、以及属性值约束关系表达式;分析单元,用于利用所述至少两个词汇信息的属性集合中的至少一个属性值,以及所述至少一个规则模板中的规则部分以及属性值约束关系表达式,获取到所述文本信息对应的含义。本专利技术实施例所提供的信息分析方法及电子设备,能够从文本信息中提取得到词汇信息,获取到词汇信息的属性值,以及获取到词汇信息的规则模板;利用词汇信息的属性值以及规则模板中的规则部分以及属性值约束关系表达式,获取到所述文本信息对应的含义。如此,就能够结合词汇信息的属性值分析语音信息的含义,从而避免了现有技术中由于没有结合属性值进行约束关系分析而导致的语意分析准确性无法提升的问题。附图说明图1为本专利技术实施例信息分析方法流程示意图一;图2为本专利技术实施例信息分析方法流程示意图二;图3为本专利技术实施例包括有词汇信息及其属性类型和属性值的示例;图4为本专利技术实施例电子设备组成结构示意图一;图5为本专利技术实施例电子设备组成结构示意图二;图6为本专利技术实施例电子设备组成结构示意图三;图7为本专利技术实施例硬件实施结构图。具体实施方式下面结合附图及具体实施例对本专利技术实施例再作进一步详细的说明。实施例一、本专利技术实施例提供了一种信息分析方法,如图1所示,所述方法包括:步骤101:从文本信息中获取到至少两个词汇信息;步骤102:获取到所述至少两个词汇信息的属性集合;其中,所述属性集合中包括有至少一个属性类型、每一个属性类型中包括属性值;步骤103:基于所述至少两个词汇信息,选取至少一个规则模板;其中,规则模板中包括:至少由属性类型构成的规则部分、以及属性值约束关系表达式;步骤104:利用所述至少两个词汇信息的属性集合中的至少一个属性值,以及所述至少一个规则模板中的规则部分以及属性值约束关系表达式,获取到所述文本信息对应的含义。这里,上述步骤101中文本信息的获取方式可以为:获取到用户输入的文本信息;或者,还可以为将采集到的语音信息转换得到的文本信息所述获取到语音信息可以为由音频采集单元采集得到的语音信息;其中,所述音频采集单元可以为麦克风(MIC)。将所述语音信息转换为文本信息的方法可以为利用预设的语音文本转换软件进行转换。所述从文本信息中获取到至少两个词汇信息,可以为将所述文本信息按照预设的分隔方式进行分隔,得到至少两个词汇信息;其中,所述预设的分隔方式可以为:利用预设的词库与所述文本信息进行匹配,选取与词库匹配的词汇作为最终获取到的词汇信息。优选地,如果用户输入的语音信息所转换的到的文本信息,具备多种分隔方式,可以逐个选取分隔方式进行划分,按照选中的分隔方式对文本信息进行划分并且完成后续的处理流程。优选地,本实施例在执行步骤101之前,还可以对领域名称、词汇信息的类别名以及属性类型等参数进行设置,具体的,所述方法还包括:设置词汇信息库,所述词汇信息库中包括有至少一个词汇信息,并且包括词汇信息对应的类别名、属性类型以及属性值;并且为每一个类别名设置对应的领域名称;设置规则模板库,所述规则模板库中包括有领域名称对应的至少一个规则模板。所述获取到所述至少两个词汇信息的属性集合的方式可以包括:分别从所述至少两词汇信息中提取到待匹配词汇信息;将待匹配词汇信息与预设的词汇信息库中的全部词汇信息进行对比,选取到匹配的词汇信息,将匹配的词汇信息的类别名、属性类型以及属性值作为所述待匹配词汇信息的类别名、属性类型以及属性值。示例:小张:{类别名=歌手;演员;人名;属性集合={生日=xxxx.5.1;歌曲=A;B;C;女朋友=ED本文档来自技高网...
一种信息分析方法及电子设备

【技术保护点】
一种信息分析方法,其特征在于,所述方法包括:从文本信息中获取到至少两个词汇信息;获取到所述至少两个词汇信息的属性集合;其中,所述属性集合中包括有至少一个属性类型、每一个属性类型中包括属性值;基于所述至少两个词汇信息,选取至少一个规则模板;其中,规则模板中包括:至少由属性类型构成的规则部分、以及属性值约束关系表达式;利用所述至少两个词汇信息的属性集合中的至少一个属性值,以及所述至少一个规则模板中的规则部分以及属性值约束关系表达式,获取到所述文本信息对应的含义。

【技术特征摘要】
1.一种信息分析方法,其特征在于,所述方法包括:从文本信息中获取到至少两个词汇信息;获取到所述至少两个词汇信息的属性集合;其中,所述属性集合中包括有至少一个属性类型、每一个属性类型中包括属性值;基于所述至少两个词汇信息,选取至少一个规则模板;其中,规则模板中包括:至少由属性类型构成的规则部分、以及属性值约束关系表达式;利用所述至少两个词汇信息的属性集合中的至少一个属性值,以及所述至少一个规则模板中的规则部分以及属性值约束关系表达式,获取到所述文本信息对应的含义。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:设置词汇信息库,所述词汇信息库中包括有至少一个词汇信息,并且包括词汇信息对应的类别名、属性类型以及属性值;并且为每一个类别名设置对应的领域名称;设置规则模板库,所述规则模板库中包括有领域名称对应的至少一个规则模板。3.根据权利要求2所述的方法,其特征在于,所述基于所述至少两个词汇信息,选取至少一个规则模板,包括:基于所述词汇信息库,分别获取到所述至少两个词汇信息的类别名;基于所述至少两个词汇信息的类别名,确定所述至少两个词汇信息对应的领域名称;基于所述领域名称,从所述规则模板库中获取到至少一个规则模板。4.根据权利要求2所述的方法,其特征在于,所述利用所述至少两个词汇信息的属性集合中的至少一个属性值,以及所述至少一个规则模板中的规则部分以及属性值约束关系表达式,获取到所述文本信息对应的含义,包括:逐个从所述至少一个规则模板中提取规则模板;判断所述至少两个词汇信息的属性集合中的属性类型、与提取的所述规则模板的规则部分是否匹配;若两者匹配,则利用所述至少两个词汇信息的属性集合中的至少一个属性值,以及提取的所述规则模板中的属性值约束关系表达式,获取至少两个词汇信息的属性约束关系;基于所述至少两个词汇信息的属性约束关系,确定所述文本信息对应的含义。5.根据权利要求4所述的方法,其特征在于,所述基于所述至少两个词汇信息的属性约束关系,确定所述文本信息对应的含义,包括:若所述至少两个词汇信息的属性约束关系表征属性约束关系有效,则保存所述规则模板以及词汇信息至匹配列表;对匹配列表中保存的规则模板以及词汇信息进行处理后,选取一个目标规则模板及其对应的词汇信息;基于选取的目...

【专利技术属性】
技术研发人员:冯晓冰王飞徐浩许振兴
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1