一种用于智能识别文本语义的方法技术

技术编号：22055249 阅读：26 留言：0更新日期：2019-09-07 15:15

本发明专利技术涉及自然语言处理技术领域，具体涉及用于智能识别文本语义的方法，包括步骤：对用户输入文本进行标准化处理；对输入文本进行正则的匹配识别，对满足相似度及命中规则的输入文本，直接做出响应，并替换为模型匹配更易识别的文本；构建任务场景流程，在任务型的多轮对话场景中，基于已经构建的任务场景流程，结合历史输入数据和当前输入数据进行场景流程的意图识别；模型匹配，根据句子间的语义注意力权重，实现局部推断，进一步实现全局推断，精准识别客户意图，从知识中挖掘问题答案。该方法区分文本的语义意图从而分发给相应业务引擎或处理模块，结合上下文语境及场景自动识别语义，并通过规则处理，提升识别的准确率及效率。

A Method for Intelligent Recognition of Text Semantics

全部详细技术资料下载

【技术实现步骤摘要】
一种用于智能识别文本语义的方法
本专利技术涉及自然语言处理
，具体涉及一种用于智能识别文本语义的方法。
技术介绍
客服机器人是一个比较复杂的对话系统，可以由多个处理不同任务的模块组成。其中，最为核心的就是语义中控，即理解用户想要表达什么意思，确定由机器人的哪个模块进行输出。现有的客服机器人大多缺少行之有效的语义中控，能力比较单一，往往只能对用户的问答型或闲聊型对话做出响应，而对于任务型的对话则需要人工服务来满足用户需求；或者在不同模块间的协调上表现不佳，难以捕捉用户真正的意图，进而无法满足用户的实际需求。智能语义中控以客服机器人的实际应用场景出发，基于对过往用户交互数据分析，归纳提炼出的应用模块，从而根据用户当前问句和该通会话中的历史交互数据，智能决策当前问题该由机器人的哪个模块进行回答，可改善客服机器人能力单一、无法满足用户切实需求的现状。
技术实现思路
为了解决现有技术所存在的问题，本专利技术提供一种用于智能识别文本语义的方法，该方法区分文本的语义意图从而分发给相应业务引擎或相应处理模块，在文本分析过程中结合上下文语境及场景自动识别语义，并通过一些规则的处理，从而提升识别的准确率及识别效率。本专利技术采用如下技术方案来实现：一种用于智能识别文本语义的方法，包括以下步骤：S1、对用户输入文本进行标准化处理；S2、对输入文本进行正则的匹配识别，对满足相似度及命中规则的输入文本，直接做出响应，并替换为模型匹配更易识别的文本；S3、构建任务场景流程，在任务型的多轮对话场景中，基于已经构建的任务场景流程，结合历史输入数据和当前输入数据进行场景流程的意图识别；S...

【技术保护点】
1.一种用于智能识别文本语义的方法，其特征在于，包括以下步骤：S1、对用户输入文本进行标准化处理；S2、对输入文本进行正则的匹配识别，对满足相似度及命中规则的输入文本，直接做出响应，并替换为模型匹配更易识别的文本；S3、构建任务场景流程，在任务型的多轮对话场景中，基于已经构建的任务场景流程，结合历史输入数据和当前输入数据进行场景流程的意图识别；S4、模型匹配，根据句子间的语义注意力权重，实现局部推断，进一步实现全局推断，精准识别客户意图，并从知识中挖掘问题答案。

【技术特征摘要】
1.一种用于智能识别文本语义的方法，其特征在于，包括以下步骤：S1、对用户输入文本进行标准化处理；S2、对输入文本进行正则的匹配识别，对满足相似度及命中规则的输入文本，直接做出响应，并替换为模型匹配更易识别的文本；S3、构建任务场景流程，在任务型的多轮对话场景中，基于已经构建的任务场景流程，结合历史输入数据和当前输入数据进行场景流程的意图识别；S4、模型匹配，根据句子间的语义注意力权重，实现局部推断，进一步实现全局推断，精准识别客户意图，并从知识中挖掘问题答案。2.根据权利要求1所述的用于智能识别文本语义的方法，其特征在于，步骤S2通过强规则匹配对输入文本进行正则的匹配识别。3.根据权利要求2所述的用于智能识别文本语义的方法，其特征在于，步骤S2将常见的话语及容易引起歧义的话语进行集合，然后加入强规则的知识库中；在强规则的知识库中，把多种不同的表述映射为统一的语义，然后再从强规则的知识库中找到相应的知识进行响应；根据语义情况，使用强正则或者弱正则方式进行匹配处理。4.根据权利要求3所述的用于智能识别文本语义的方法，其特征在于，所述强规则的知识库整体上呈现一个树状结构，每个知识节点有相应的节点id、响应文本以及要匹中的正则表达式规定。5.根据权利要求1所述的用于智能识别文本语义的方法，其特征在于，步骤S3中场景流程为任务型的多轮对话；在任务型的多轮对话中，基于已经构建的任务场景流程，结合用户的历史输入数据和当前输入数据进行场景意图识别，推断场景流程中符合用户预期的下一个流程，以此不断递进，完成对用户输入数据的决策，得到下一步应当采取的最佳动作。6.根据权利要求5所述的用...

【专利技术属性】
技术研发人员：杨钊，姜磊，赖招展，祝洋，潘镜宇，朱振航，何慧，沈广盈，屈吕杰，
申请(专利权)人：佰聆数据股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人