【技术实现步骤摘要】
语意分析装置、方法及其电脑存储介质
本专利技术系关于一种语意分析装置、方法及其电脑存储介质。更具体而言,本专利技术系关于一种中文语意分析装置、方法及其电脑存储介质。
技术介绍
随着科技的快速发展以及社群平台的兴盛,透过各种输入接口提供各种信息(例如:文字消息、语音消息)已成为人们日常生活中不可或缺的元素。在不同的应用领域(例如:人机接口)中,如何正确地解读人们所提供的信息,以便基于解读后的信息提供适当的响应或/及服务,是一个日益重要的议题。已知的中文语意分析技术可区分为二大类,其中一类是利用深度学习网络判断一中文字符串所代表的意图,而另一类则是采用关键词分析技术标出一中文字符串中的关键词。不论是哪一类技术,在进行中文语意分析之前,皆须先对该中文字符串进行断词(WordSegmentation)。已知的中文语意分析技术极度仰赖前端断词的正确性。尽管目前已有多种断词技术,但这些技术在对一中文字符串断词时,仍难以处理「歧义识别」及「新词识别」二个议题。歧异识别是指同一中文字符串可能有二种以上的断词结果。新词识别则是指中文字符串中含有未被登录的词汇,也就是那些未收录于字典但却被实际使用的词汇。由于已知的断词技术无法克服这些问题,导致后续的中文语意分析的结果不够精准。有鉴于此,本领域亟需一种能降低对断词技术的仰赖程度且能提高语意分析正确性的语意分析技术。
技术实现思路
本专利技术的一目的在于提供一种语意分析装置。该语意分析装置包含一输入接口、一储存器及一处理器,其中该处理器电性连接至该输入接口及该储存器。该储存器储存多个标签。该输入接口接收一中文字符串。该处理器对该中文 ...
【技术保护点】
1.一种语意分析装置,其特征在于包含:一输入接口,接收一中文字符串;一储存器,储存多个标签;以及一处理器,电性连接至该输入接口及该储存器,对该中文字符串进行词汇分析以得多个群组,将该中文字符串区分为多个汉字,对该等群组进行语意分析以得至少一第一机率分布,其中各该至少一第一机率分布包含多个第一机率值一对一地对应至该等标签,其中,该处理器更对该等汉字进行语意分析以得至少一第二机率分布,各该至少一第二机率分布包含多个第二机率值一对一地对应至该等标签,该处理器更根据该至少一第一机率分布及该至少一第二机率分布计算出至少一第三机率分布,且根据该至少一第三机率分布决定该中文字符串的至少一输出信息,其中该至少一输出信息与该等卷标其中之一相关。
【技术特征摘要】
1.一种语意分析装置,其特征在于包含:一输入接口,接收一中文字符串;一储存器,储存多个标签;以及一处理器,电性连接至该输入接口及该储存器,对该中文字符串进行词汇分析以得多个群组,将该中文字符串区分为多个汉字,对该等群组进行语意分析以得至少一第一机率分布,其中各该至少一第一机率分布包含多个第一机率值一对一地对应至该等标签,其中,该处理器更对该等汉字进行语意分析以得至少一第二机率分布,各该至少一第二机率分布包含多个第二机率值一对一地对应至该等标签,该处理器更根据该至少一第一机率分布及该至少一第二机率分布计算出至少一第三机率分布,且根据该至少一第三机率分布决定该中文字符串的至少一输出信息,其中该至少一输出信息与该等卷标其中之一相关。2.如权利要求1所述的语意分析装置,其特征在于,各该至少一第三机率分布包含多个第三机率值一对一地对应至该等标签,该处理器以各该至少一第三机率分布的最大的该第三机率值决定该至少一输出信息。3.如权利要求1所述的语意分析装置,其特征在于,该处理器对该等群组进行语意分析得多个第一机率分布,该处理器对该等汉字进行语意分析得多个第二机率分布,该处理器根据该等第一机率分布及该等第二机率分布计算出多个第三机率分布,且该处理器更根据该等第三机率分布决定该中文字符串的多个输出信息。4.如权利要求3所述的语意分析装置,其特征在于,该等群组一对一地对应至该等第一机率分布,该等汉字一对一地对应至该等第二机率分布,该处理器对各该汉字进行以下运作:(a)根据该汉字选取该等群组其中之一作为一选定群组,其中该选定群组包含该汉字,(b)根据该汉字所对应的该第二机率分布及该选定群组所对应的该第一机率分布计算出该汉字的一修正机率分布,其中该修正机率分布为该等第三机率分布其中之一,以及(c)根据该修正机率分布决定出该等输出信息其中之一。5.如权利要求1所述的语意分析装置,其特征在于,该处理器根据一第一权重值加权该至少一第一机率分布且根据一第二权重值加权该至少一第二机率分布以计算出该至少一第三机率分布。6.如权利要求1所述的语意分析装置,其特征在于,该处理器将该至少一第一机率分布及该至少一第二机率分布平均以计算出该至少一第三机率分布。7.一种语意分析方法,适用于一电子计算装置,其特征在于该分析方法包含下列步骤:(a)对一中文字符串进行词汇分析以得多个群组;(b)将该中文字符串区分为多个汉字;(c)对该等群组进行语意分析以得至少一第一机率分布,其中各该至少一第一机率分布包含多个第一机率值一对一地对应至多个标签;(d)对该等汉字进行语意分析以得至少一第二机率分布,各该至少一第二机率分布包含多个第...
【专利技术属性】
技术研发人员:许云凯,陈聪杰,火致力,许耕伟,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:中国台湾,71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。