【技术实现步骤摘要】
语意分析方法、语意分析系统及非暂态计算机可读取媒体
本案是有关于一种语意分析方法、语意分析系统以及非暂态计算机可读取媒体,且特别是有关于一种用以分析自然语言意图的语意分析方法、语意分析系统及非暂态计算机可读取媒体。
技术介绍
近年来自然语言理解技术(Naturallanguageunderstanding,NLU)的发展已逐渐成熟(例如:google的语音辨识或Siri),使用者在操作移动装置或个人计算机等电子产品时,也越来越常使用语音输入或语音控制的功能,然而,以往进行自然语言理解技术时通常是利用标记数据或关键信息进行类神经网络的训练,但通常也耗费时间过大以及准确率的问题。因此,如何让自然语言理解技术在不花费过多处理时间的情况下,增加自然语言分析的准确率,为本领域待改进的问题之一。
技术实现思路
本专利技术的主要目的是提供一种语意分析方法、语意分析系统以及非暂态计算机可读取媒体,其利用词汇的词性以及关联剖析找出关键词汇以及关联子句,达到提升自然语言理解技术准确率的功能。为达成上述目的,本案的第一态样是提供一种语意分析方法,此方法包含以下步骤:输入语音并辨识语音以产生输入语句;其中输入语句包含多个词汇,每一词汇具有对应的词汇向量;根据每一词汇对应的词性从词汇中选择至少一关键词汇;根据输入语句的词汇建立剖析树,并根据剖析树以及至少一关键词汇找出多个关联子句;其中,每一关联子句包含部分的词汇;计算关联子句之间的关联特征向量;串接关联特征向量与每一词汇对应的词汇向量,以产生每一词汇对应的词汇特征 ...
【技术保护点】
1.一种语意分析方法,其特征在于,包含:/n输入一语音并辨识该语音以产生一输入语句;其中该输入语句包含多个词汇,每一该词汇具有对应的词汇向量;/n根据每一该词汇对应的词性从所述多个词汇中选择至少一关键词汇;/n根据该输入语句的所述多个词汇建立一剖析树,并根据该剖析树以及该至少一关键词汇找出多个关联子句;其中,每一该关联子句包含部分的所述词汇;/n计算所述多个关联子句之间的一关联特征向量;/n串接该关联特征向量与每一该词汇对应的词汇向量,以产生每一该词汇对应的一词汇特征向量;以及/n利用一语意分析模型分析该词汇特征向量以产生一分析结果;其中,该分析结果包含每一该词汇对应的属性分类以及该输入语句对应的意图。/n
【技术特征摘要】
20181120 TW 1071413011.一种语意分析方法,其特征在于,包含:
输入一语音并辨识该语音以产生一输入语句;其中该输入语句包含多个词汇,每一该词汇具有对应的词汇向量;
根据每一该词汇对应的词性从所述多个词汇中选择至少一关键词汇;
根据该输入语句的所述多个词汇建立一剖析树,并根据该剖析树以及该至少一关键词汇找出多个关联子句;其中,每一该关联子句包含部分的所述词汇;
计算所述多个关联子句之间的一关联特征向量;
串接该关联特征向量与每一该词汇对应的词汇向量,以产生每一该词汇对应的一词汇特征向量;以及
利用一语意分析模型分析该词汇特征向量以产生一分析结果;其中,该分析结果包含每一该词汇对应的属性分类以及该输入语句对应的意图。
2.根据权利要求1所述的语意分析方法,其特征在于,还包含:
利用所述多个词汇、每一该词汇对应的词汇向量以及该关联特征向量作为训练数据,以产生该语意分析模型。
3.根据权利要求1所述的语意分析方法,其特征在于,还包含:
将该输入语句进行断词处理以产生一词汇集合;其中,该词汇集合包含所述多个词汇。
4.根据权利要求1所述的语意分析方法,其特征在于,每一该关联子句包含该至少一关键词汇的一部分。
5.根据权利要求1所述的语意分析方法,其特征在于,计算所述多个关联子句之间的该关联特征向量,还包含:
利用每一该关联子句的部分的所述词汇对应的词汇向量进行N元语法计算以产生多个第一N元语法特征;
根据所述多个第一N元语法特征进行一特征计算以产生一特征向量;以及
根据该特征向量进行一权重计算,以产生该关联特征向量。
6.根据权利要求1所述的语意分析方法,其特征在于,计算所述多个关联子句之间的该关联特征向量,还包含:
利用所述多个词汇对应的词汇向量进行N元语法计算以产生多个第一N元语法特征;
利用每一该关联子句的部分的所述词汇对应的词汇向量进行N元语法计算以产生多个第二N元语法特征;
将所述多个第一N元语法特征以及所述多个第二N元语法特征分别进行一特征计算以产生一第一特征向量以及一第二特征向量;以及
根据该第二特征向量进行一权重计算以产生一加权向量,将该第一特征向量与该加权向量串接,以产生该关联特征向量。
7.根据权利要求5或6所述的语意分析方法,其特征在于,该权重计算是利用所述多个关联子句中的该至少一关键词汇的数量决定一权重值。
8.一种语意分析系统,其特征在于,包含:
一音频接收器,用以接收一语音;
一处理器,与该音频接收器电性连接,该处理器包含:
一语音辨识元件,用以辨识该语音以产生一输入语句,其中该输入语句包含多个词汇,每一该词汇具有对应的词汇向量;
一关键词汇选择元件,与该语音辨识元件电性连接,用以根据每一该词汇对应的词性从所述多个词汇中选择至少一关键词汇;
一关联子句产生元件,与该关键词汇选择元件电性连接,用以根据该输入语句的所述多个词汇建立一剖析树,并根据该剖析树以及该至少一关键词汇找出多个关联子句;其中,每一该关联子句包含部分的...
【专利技术属性】
技术研发人员:邱育贤,杨伟桢,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。