【技术实现步骤摘要】
语意处理方法、电子装置以及非暂态电脑可读取记录媒体
本专利技术是有关于语言的处理方法,特别是一种语意处理方法、电子装置以及非暂态电脑可读取记录媒体。
技术介绍
在自然语言的技术范畴,运用上结合了语言学与人工智能。在一段输入的句子或文章当中,首先必须以语言学对句子进行解构,从句子当中分析出更小的单位,也就是字词,对各个字词标注所属的语意角色。一般而言,处理系统是以使用统计数据库来标注语意角色,因此训练完善的语料数据库相形重要。然而,字词往往不只具备一种词性,若以统计数值来决定字词的词性,例如以某字词最常出现的词性来标注,对于出现机率相对较低的词性的字词,则会使得句子的解析发生错误,而输出错误的解析结果。
技术实现思路
本专利技术的一个目的在于提供一种语意处理方法,其可产生正确的剖析树,并增加剖析解果的正确性。根据本专利技术的一实施例,揭示一种语意处理方法。此方法包含下述步骤:根据词库数据库对输入字串解析为多个字词。接着,建立断词表格,其中断词表格包含多个表格区块,并且这些表格区块分别位于断词表格的多 ...
【技术保护点】
1.一种语意处理方法,适用于电子装置,其特征是,所述语意处理方法包含:/n根据词库数据库对输入字串解析为多个字词;/n建立断词表格,其中所述断词表格包含多个表格区块,并且所述多个表格区块分别位于所述断词表格的多个阶层,所述多个阶层各自的所述多个表格区块逐层递减,所述多个表格区块每一个包含所述多个字词的其中一个或者所述多个字词中相邻的多个字词;/n参考所述断词表格的所述多个阶层中的所述多个表格区块的其中一个字词在所述词库数据库中对应的一个或多个词性或参考所述多个表格区块的多个字词在所述词库数据库中对应的一个或多个词性序列;/n根据所述断词表格的所述表格区块对应的所述一个或多个 ...
【技术特征摘要】
1.一种语意处理方法,适用于电子装置,其特征是,所述语意处理方法包含:
根据词库数据库对输入字串解析为多个字词;
建立断词表格,其中所述断词表格包含多个表格区块,并且所述多个表格区块分别位于所述断词表格的多个阶层,所述多个阶层各自的所述多个表格区块逐层递减,所述多个表格区块每一个包含所述多个字词的其中一个或者所述多个字词中相邻的多个字词;
参考所述断词表格的所述多个阶层中的所述多个表格区块的其中一个字词在所述词库数据库中对应的一个或多个词性或参考所述多个表格区块的多个字词在所述词库数据库中对应的一个或多个词性序列;
根据所述断词表格的所述表格区块对应的所述一个或多个词性或所述一个或多个词性序列,对各所述阶层的每一个表格区块执行文法规则;以及
根据所述断词表格中符合所述文法规则的所述多个表格区块,输出剖析树,所述剖析树包含所述多个字词在所述输入字串中的词意以及所述输入字串的句型行为。
2.根据权利要求1所述的语意处理方法,其特征是,将所述输入字串解析为多个字词包含判断所述输入字串中具有至少一个预设词组时,将所述预设词组放置于所述断词表格的所述表格区块的其中一个中,其中所述预设词组包含两个以上的所述字词。
3.根据权利要求1所述的语意处理方法,其特征是,所述文法规则包含判断所述断词表格的各所述阶层的所述表格区块的左边表格区块对应的所述词性是否符合设定词性。
4.根据权利要求1所述的语意处理方法,其特征是,所述文法规则包含判断所述断词表格的各所述阶层的所述表格区块的右边表格区块对应的所述词性是否符合设定词性。
5.根据权利要求1所述的语意处理方法,其特征是,所述文法规则包含判断所述表格区块所使用的字词组合在指定位置的所述表格区块所对应的所述词性,是否符合设定词性。
6.根据权利要求1所述的语意处理方法,其特征是,所述文法规则包含判断P节点,在执行所述文法规则而读取到所述P节点时,暂时通过所述文法规则。
7.根据权利要求6所述的语意处理方法,其特征是,读取到所述P节点而暂时通过所述文法规则后,以另一文法规则中的所述P节点的节点词判断所述节点词是否符合先前暂时通过的所述文法规则。
8.根据权利要求1所述的语意处理方法,其特征是,所述文法规则包含判断所述断词表格的所述表格区块对应的相邻字词的所述词性符合设定词性时,判断所述相邻字词为词组。
9.根据权利要求1所述的语意处理方法,其特征是,所述文法规则具有权重值,当所述断词表格的所述表格区块对应的所述词性或所述词性序列符合文法规则时,加总所述权重值,以及输出具有最高的所述权重值的所述剖析树。
10.根据权利要求1所述的语意处理方法,其特征是,将所述输入字串解析为所述多个字词的断词数目为所述断词表格的所述表格区块的数目。
11.一种电子装置,其特征是,包含:
储存媒体,储存至少一个程序指令以及词库数据库;
输入输出介面,用以取得输入字串;以及
处理器,耦接所述储存媒体以及所述输入输出介面,所述处理器载入并执行储存于所述储存媒体中的所述至少一个程序指令,所述处理器用以:
根据所述词库数据库对所述输入字串解析为多个字词;
建立断词表格,其中所述断词表格包含多个表格区块,并且所述多个表格区块分别位于所述断词表格的多个阶层,所述多个阶层各自的所述多个表格区块逐层递减,所述多个表格区块每一个包含所述多个字...
【专利技术属性】
技术研发人员:庞台铭,罗国峯,
申请(专利权)人:华硕电脑股份有限公司,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。