基于知识图谱的企业制度问答意图识别方法及装置制造方法及图纸

技术编号:25521782 阅读:18 留言:0更新日期:2020-09-04 17:12
本发明专利技术提供一种基于知识图谱企业制度问答意图识别方法和装置,以解决问答机器人技术中的对意图识别的多个技术问题,包括多意图识别,隐式意图识别等,其包括:步骤一,根据企业制度人工构建或者机器自动构建知识图谱,所述知识图谱中包括有若干意图节点以及连接意图节点的边;步骤二,获取用户的提问语句,对提问语句进行分词及实体识别,并由依存句法分析得出句式结构以便提取主、谓或宾词语;步骤三,根据所提取的主、谓、或宾词语以及知识图谱,搜索知识图谱路径;步骤四,结合搜索出的知识图谱路径,输出问答意图。

【技术实现步骤摘要】
基于知识图谱的企业制度问答意图识别方法及装置
本专利技术属于信息处理
,具体涉及一种基于知识图谱的企业制度问答意图识别方法及装置。
技术介绍
企业制度是对成员进行宣传教育、意识传达、规范工作的重要文件,规范了公司业务运作与行为准则。制度的定制者每次修订制度或者发布新制度都需要对员工进行不断的思想灌输和业务培训。随着人工智能技术的发展,大型企业开始采用问答机器人来解答员工对规章制度的疑问。员工通过自然语言与问答机器人来交谈,首先需要确定的是员工想问什么,也就是意图识别。所谓意图识别就是确定用户问题的目的,再根据这个目的找到相关的答案。例如“我出差到广州”,问题意图是查询差旅报销标准;“我可以坐飞机出差吗?”,问题意图是查询差旅费报销中的交通工具乘坐标准。有些问答意图是显式的,如“我要报销差旅费”;而有些问答意图是隐式的,如“我坐飞机去北京”,对方的意图可能是出差办事或者参加培训。对于隐式意图,问答机器人可以通过多轮对话来识别员工问答的多种意图,进一步引导或者反问员工来确定最终的问答意图。目前,对于意图识别方法主要为利用规则模板或机器学习模型。规则模板使用正则表达式的方式来提取句子中的关键词,对于命令式的句子有较好的效果,但是对于句式的变化和词语的位置等因素,意图识别泛化效果不佳。而采用机器学习模型,如支持向量机(SVN)或者深度机器学习中的卷积神经网络(CNN),长短期记忆网络(LSTM)等模型,虽然效果不错,需要海量的训练样本进行意图训练,并且随着企业制度问题域的不断变化和扩大,需要重新训练,并且准确率也在下降。不管是规则模板或机器学习模型,在隐式的意图识别中,难以对提问内容进行联想式的关联,导致意图识别效果不好。
技术实现思路
基于
技术介绍
中所提及的问题,本专利技术提供一种基于知识图谱企业制度问答意图识别方法和装置,以解决问答机器人技术中的对意图识别的多个技术问题,包括多意图识别,隐式意图识别等,其具体
技术实现思路
如下:本专利技术的基于知识图谱的企业制度问答意图识别方法,其包括:步骤一,根据企业制度人工构建或者机器自动构建知识图谱,所述知识图谱中包括有若干意图节点以及连接意图节点的边;步骤二,获取用户的提问语句,对提问语句进行分词及实体识别,并由依存句法分析得出句式结构以便提取主、谓或宾词语;步骤三,根据所提取的主、谓、或宾词语以及知识图谱,搜索知识图谱路径;其中:1)根据主语搜索知识图谱中的各意图节点以获得开始节点,如果主语不存在,则设置一个默认的主语;2)根据谓语搜索知识图谱中的边,识别出知识图谱路径行动的走向;3)根据宾语搜索知识图谱上的意图节点以获得结束节点,如果宾语不存在,则以谓语的边作为结束节点,如果谓语也不存在,则主语既是开始节点也是结束节点;4)根据开始节点、边和结束节点生成知识图谱路径,该知识图普路径包括由开始节点至结束节点之间的所有意图节点和边;步骤四,结合搜索出的知识图谱路径,输出问答意图;如果步骤三中获得的知识图谱路径为空时,则输出“不能识别意图”;如果步骤三中获得的知识图谱路径只有一条时,则输出离结束节点最近的图谱中意图节点;当存在多个意图节点距离结束节点距离一样时,则就输出多个意图节点;如果步骤三中获得的知识图谱路径有多条时,则合并路径上公共的意图节点,该公共的意图节点则是最大可能意图,输出离公共节点最近的图谱中的意图节点;如果知识图谱路径没有公共节点,那么输出每条路径涉及到的意图节点。于本专利技术的一个或多个实施例当中,在步骤二中提取主、谓或宾词语的规则是:A)对知识图谱中的所有词语和主、谓、宾词语进行向量化处理;采用词向量模型将知识图谱中意图节点的实体名词、边上关系的动词进行Word2vec处理;同样,对从步骤二得出的提取主、谓或宾词语也是如此处理;B)采用K最近邻算法,将主语,宾语与知识图谱中的意图节点中的实体名词进行分类;C)采用余弦相似度算法,将谓语与知识图谱中的边的动词进行计算,找出一个与谓语最接近的一个动词词语;D)输出经上述归类处理后的主、谓、宾词语。于本专利技术的一个或多个实施例当中,在步骤C计算时设置一个阈值,如果计算结果低于阈值时,谓语的值输出为空。于本专利技术的一个或多个实施例当中,在步骤二中采用中文命名实体识别模型对提问语句中的词进行实体识别。本专利技术的基于知识图谱的企业制度问答意图识别装置,其包括:知识图谱模块,用于企业制度知识图谱的编辑及查询;其包含有根据企业制度人工构建或者机器自动构建知识图谱,所述知识图谱中包括有若干意图节点以及连接意图节点的边;自然语言处理模块,用于对提问语句进行分词、实体识别以及依存句法分析,识别并输出提问语句中的主、谓或宾词语;意图识别服务模块,用于根据自然语言处理模块的输出、调用知识图谱模块进行意图识别,返回最终的问答意图。本专利技术的计算机设备,包括存储器、处理器、通讯接口及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。本专利技术的有益效果是:便于企业员工对企业制度的了解与学习,指引员工的日常工作,其中解决了问答机器人技术中的对意图识别的多个技术问题,其中包括多意图识别、隐式意图识别等,克服了传统规则模板识别方法中由于句式的变化和词语的位置等因素,导致意图识别泛化效果不佳的问题;同时,也克服了机器学习模型需要海量的训练样本进行意图训练、随着企业制度问题域的不断变化和扩大,需要重新训练,并且准确率也在下降的问题。附图说明图1为企业制度问答意图识别流程图。图2为知识图谱路径搜索算法流程图。图3为主谓宾词语归类算法流程图。图4为知识图谱路径融合算法流程。图5为企业制度知识图谱示意图。图6为基于知识图谱企业制度问答意图识别装置结构示意图。图7为计算机设备的结构示意图。具体实施方式如下结合附图,对本申请方案作进一步描述:参见附图1至5,本申请实施例提供了一种基于知识图谱企业制度问答意图识别方法,该方法工作步骤如下:步骤一、根据企业制度人工构建或者机器自动构建知识图谱,所述知识图谱中包括有若干意图节点以及连接意图节点的边;步骤二、获取用户的提问语句进行分词和实体识别,以及进行依存句法分析;对提问语句进行分词,采用中文命名实体识别模型对句子中的词进行实体识别。如:“总经理”识别为岗位实体,“7月1日”识别出时间,“广州”识别出城市等。对提问语句进行依存句法分析,得出主谓宾等句式结构。这里句式可能有主谓结构,动宾结构等;比如“我出差到广州”,分解出(主语:我,谓语:出差,宾语:广州)。而“出差广州”,那就是动宾结构,分解成(谓语:出差,宾语:广州);步骤三、根据主谓宾词语以及预先设置的知识图谱,搜索知识图谱路径企业的规则制度是规定企业员工的行为准则,每个企业管理本文档来自技高网
...

【技术保护点】
1.一种基于知识图谱的企业制度问答意图识别方法,其特征在于,包括:/n步骤一,根据企业制度人工构建或者机器自动构建知识图谱,所述知识图谱中包括有若干意图节点以及连接意图节点的边;/n步骤二,获取用户的提问语句,对提问语句进行分词及实体识别,并由依存句法分析得出句式结构以便提取主、谓或宾词语;/n步骤三,根据所提取的主、谓、或宾词语以及知识图谱,搜索知识图谱路径;其中:/n1)根据主语搜索知识图谱中的各意图节点以获得开始节点,如果主语不存在,则设置一个默认的主语;/n2)根据谓语搜索知识图谱中的边,识别出知识图谱路径行动的走向;/n3)根据宾语搜索知识图谱上的意图节点以获得结束节点,如果宾语不存在,则以谓语的边作为结束节点,如果谓语也不存在,则主语既是开始节点也是结束节点;/n4)根据开始节点、边和结束节点生成知识图谱路径,该知识图普路径包括由开始节点至结束节点之间的所有意图节点和边;/n步骤四,结合搜索出的知识图谱路径,输出问答意图;/n如果步骤三中获得的知识图谱路径为空时,则输出“不能识别意图”;/n如果步骤三中获得的知识图谱路径只有一条时,则输出离结束节点最近的图谱中意图节点;当存在多个意图节点距离结束节点距离一样时,则就输出多个意图节点;/n如果步骤三中获得的知识图谱路径有多条时,则合并路径上公共的意图节点,该公共的意图节点则是最大可能意图,输出离公共节点最近的图谱中的意图节点;如果知识图谱路径没有公共节点,那么输出每条路径涉及到的意图节点。/n...

【技术特征摘要】
1.一种基于知识图谱的企业制度问答意图识别方法,其特征在于,包括:
步骤一,根据企业制度人工构建或者机器自动构建知识图谱,所述知识图谱中包括有若干意图节点以及连接意图节点的边;
步骤二,获取用户的提问语句,对提问语句进行分词及实体识别,并由依存句法分析得出句式结构以便提取主、谓或宾词语;
步骤三,根据所提取的主、谓、或宾词语以及知识图谱,搜索知识图谱路径;其中:
1)根据主语搜索知识图谱中的各意图节点以获得开始节点,如果主语不存在,则设置一个默认的主语;
2)根据谓语搜索知识图谱中的边,识别出知识图谱路径行动的走向;
3)根据宾语搜索知识图谱上的意图节点以获得结束节点,如果宾语不存在,则以谓语的边作为结束节点,如果谓语也不存在,则主语既是开始节点也是结束节点;
4)根据开始节点、边和结束节点生成知识图谱路径,该知识图普路径包括由开始节点至结束节点之间的所有意图节点和边;
步骤四,结合搜索出的知识图谱路径,输出问答意图;
如果步骤三中获得的知识图谱路径为空时,则输出“不能识别意图”;
如果步骤三中获得的知识图谱路径只有一条时,则输出离结束节点最近的图谱中意图节点;当存在多个意图节点距离结束节点距离一样时,则就输出多个意图节点;
如果步骤三中获得的知识图谱路径有多条时,则合并路径上公共的意图节点,该公共的意图节点则是最大可能意图,输出离公共节点最近的图谱中的意图节点;如果知识图谱路径没有公共节点,那么输出每条路径涉及到的意图节点。


2.根据权利要求1所述的基于知识图谱的企业制度问答意图识别方法,其特征在于:在步骤二中提取主、谓或宾词语的规则是:
A)对...

【专利技术属性】
技术研发人员:张大志史玉洁袁志远吴恺欧阳少海喻勋勋
申请(专利权)人:广东飞企互联科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1