基于依存句法分析和汉语语法的多轮语义分析方法技术

技术编号:26478727 阅读:34 留言:0更新日期:2020-11-25 19:22
本发明专利技术公开了一种基于依存句法分析和汉语语法的多轮语义分析方法,其特征在于,包括:定义知识图谱实体数据,构成实体库;对文本进行分词得到的词语在不同领域、不同意图下出现的总次数,构成准实时词库;在不同领域、不同意图下分别采用依存句法分析将准实时词库的词语形成一个个短语,并将短语出现的次数按照记忆曲线的规律变化,形成短语的频次;统计同一短语在不同领域下的频次,得到短语在不同领域下的关联程度,得到短语意图搜索库;对用户输入进行多轮语义解析,得到用户意图。本发明专利技术利用句法树和汉语言语法重组和重排多轮语句,进而判断领域意图,能够识别多轮任务型对话意图。

【技术实现步骤摘要】
基于依存句法分析和汉语语法的多轮语义分析方法
本专利技术涉及自然语言处理
,具体的说,是一种基于依存句法分析和汉语语法的多轮语义分析方法。
技术介绍
随着人工智能的兴起,自然语言处理作为人工智能领域的一个重要方向,其中多轮的语义解析贯穿整个自然语言理解。目前多轮的语义解析多采用算法生成多轮回复的方式,这种方式更适用于闲聊等非任务型多轮回复,不适用任务型定制多轮回复以及不适用于能够输出中间变量的闲聊。任务型多轮回复,旨在通过与用户的自然语言进行多次交互,得到所需要的信息或解答。任务型对话的意图就是用户想要达到的目标。采用算法生成多轮回复的多轮语义解析方法很难识别任务型对话的意图。
技术实现思路
本专利技术的目的在于提供一种基于依存句法分析和汉语语法的多轮语义分析方法,用于解决现有技术中无法识别多轮任务型对话意图的问题。本专利技术通过下述技术方案解决上述问题:一种基于依存句法分析和汉语语法的多轮语义分析方法,包括:步骤S100:定义知识图谱实体数据,构成实体库,知识图谱实体数据包括标签和标签类别下的本文档来自技高网...

【技术保护点】
1.一种基于依存句法分析和汉语语法的多轮语义分析方法,其特征在于,包括:/n步骤S100:定义知识图谱实体数据,构成实体库;/n步骤S200:获取每日用户日志数据,每日用户日志数据包含领域、意图、文本和出现的时刻,对文本进行分词并分别统计分词后得到的词语在不同领域、不同意图下出现的总次数,该总次数按照记忆曲线的规律变化,衰减后的总次数加上再次出现的次数作为当前该词语的词频,构成准实时词库;/n步骤S300:在不同领域、不同意图下分别采用依存句法分析将准实时词库的词语形成一个个短语,并将短语出现的次数按照记忆曲线的规律变化,形成短语的频次;统计同一短语在不同领域下的频次,得到短语在不同领域下的关...

【技术特征摘要】
1.一种基于依存句法分析和汉语语法的多轮语义分析方法,其特征在于,包括:
步骤S100:定义知识图谱实体数据,构成实体库;
步骤S200:获取每日用户日志数据,每日用户日志数据包含领域、意图、文本和出现的时刻,对文本进行分词并分别统计分词后得到的词语在不同领域、不同意图下出现的总次数,该总次数按照记忆曲线的规律变化,衰减后的总次数加上再次出现的次数作为当前该词语的词频,构成准实时词库;
步骤S300:在不同领域、不同意图下分别采用依存句法分析将准实时词库的词语形成一个个短语,并将短语出现的次数按照记忆曲线的规律变化,形成短语的频次;统计同一短语在不同领域下的频次,得到短语在不同领域下的关联程度,得到短语意图搜索库;
步骤S400:对用户输入进行多轮语义解析,得到用户意图,具体为:
步骤S410:将用户本轮输入和用户上N轮输入均利用依存句法分析方法获得词性和句法关系,将句法关系封装成句法树;
步骤S420:遍历句法树中每个节点,在实体库中查找对应的实体数据;
步骤S430:语句标准化处理;
步骤S440:语句整理,并重新拼接新的句法树:
步骤S450:意图判断,根据语句整理后的拼接的新的句法树,如果主谓宾关系存在,那么匹配成功并且返回当前领域意图及其每个节点的实体参数;如果不存在,判定核心词及其每个节点的关系在该领域意图下是否存在,如果存在,匹配成功,如果有任一节点不存在,匹配下一个领域意图。


2.根据权利要求1所述的基于依存句法分析和汉语语法的多轮语义分析方法,其特征在于,所述步骤S430包括将...

【专利技术属性】
技术研发人员:周红刘楚雄
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1