【技术实现步骤摘要】
一种应用税务领域的深度学习智能问答系统
本专利技术涉及一种自然语言处理技术,特别是一种应用税务领域的深度学习智能问答系统。
技术介绍
应用税务领域的深度学习智能问答系统主要是基于自然语言处理和AIML技术,构建一个应用于税务领域的智能问答系统。近年来,智能问答系统取得了很大的发展和进步,已经有很多智能问答系统产品问世,例如IBM研发的智能问答机器人Watson在美国智力竞赛节目中战胜了人类选手。苹果公司的Siri系统和微软公司的cortana分别在iPhone手机中和Windows10操作系统中都取得看很好的效果。在国内,众多企业和研究团体也推出了很多以智能问答技术为核心的机器人。例如:微软公司的“小冰”、百度公司的“度秘”和中科汇联公司的“爱客服”等。这些产品涉及众多业务领域,如日常生活,医疗,交通,电子商务,旅游业,金融,教育等,而在税务领域却鲜有应用,应用税务领域的深度学习智能问答系统专门针对税务领域而打造,弥补了税务领域智能问答系统的缺失。智能问答系统经过近几十年的发展,其技术也在不断改进,由早先提出的基于推理的方法,到后来的基于模板匹配的方法,基于检索的 ...
【技术保护点】
1.一种应用税务领域的基于模板匹配的和深度学习智能问答系统,其特征在于:包括问题分析模块、问题理解模块和答案生成模块;问题分析模块,利用自然语言处理NLP方法进行分析和理解问句;问题识别模块,在问题分析模块的基础之上,通过对问题类型的分析,与问题模板进行匹配,判断问题的类型L;答案生成模块,答案生成模块是根据问题类型生成相应的答案返回给用户,根据匹配到的问题类型依次从问答模板、知识库的检索和深度学习模型进行截断式的生成候选答案。
【技术特征摘要】
1.一种应用税务领域的基于模板匹配的和深度学习智能问答系统,其特征在于:包括问题分析模块、问题理解模块和答案生成模块;问题分析模块,利用自然语言处理NLP方法进行分析和理解问句;问题识别模块,在问题分析模块的基础之上,通过对问题类型的分析,与问题模板进行匹配,判断问题的类型L;答案生成模块,答案生成模块是根据问题类型生成相应的答案返回给用户,根据匹配到的问题类型依次从问答模板、知识库的检索和深度学习模型进行截断式的生成候选答案。2.根据权利要求1所述的应用税务领域的深度学习智能问答系统,其特征在于问题分析模块包括:预处理模块,关键词将口语化名词转为专业名词;分词模块,将上述预处理后的包含专业名词的句子通过Ansj分词器进行分词处理;词性标注模块,将包含专业名词的句子拆分为名词、谓词性疑问代词、动词,通过名词/n,谓词性疑问代词/ryv,动词/v的数据结构进行词性标注;依存句法分析模块,使用hanlp依存句法分析句法结构,生成依存句法树,句法结构包括定中关系、主谓关系、状中结构、核心关系、标点符号;去停用词模块,根据所述的词性标注模块和依存句法分析模块的结果,去除无实际语义的副词和疑问词;关键词识别模块,ansj分词器进行关键词提取;根据单词的词性、位置和出现的频率为权重,根据权重依次从大到小进行关键词提取。3.根据权利要求2所述的应用税务领域的深度学习智能问答系统,其特征在于问题分析模块中根据权重依次从大到小进行关键词提取具体为:首先对句子进行分词,然后遍历分词结果中的每一个词,调用返回权重,移除字符串两侧的空白字符或其他预定义字符后,判断词的长度,长度越大权重越大,如果小于预设字符数,则返回值为0;预定义词性变量,判断分词的词性是否为预设的词性,是的话取返回预设的对应权重值;判断分出来的词的位置,如果在标题位置则返回权预设标题权重值,如果不是标题位置,则返回的权重值为:(长度-词位置)*权重/长度;命名实体识别,对机构名、人名、实体名进行识别后标识成机构名/nt、人名/nr,实体名/n。4.根据权利要求3所述的应用税务领域的深度学习智能问答系统,其特征在于问题类型的分析,与问题模板进行匹配,判断问题的类型具体为:将问题类型主要分为七类:人物、地点、数字、时间、实体、描述以及未知;在问题类型后,便在问题模板中进行相应问题的匹配,匹配方式主要通过AIML技术进行匹配;时间模板匹配、动作模板匹配和12366数据库,使用关键字匹配的方式与知识库中的问题进行匹配,索引相应的答案。5.根据权利要求1所述的应用税务领域的深度学习智能问答系统,其特征在于:答案生成模块的问答模型的建立,具体过程为:S1:基于网络爬虫抓取的税务咨询问答对数据集data1,税务局12366服务热线问答数据库db1,根据税务相关法律法规条例抽取的税务有关知识问答对数据集data2,构建基础库Database1,基于Database1构建深度学习税务词典库Dic1;S2:基于S1中数据集data1和data2建立问答模板,构建基于AIML的...
【专利技术属性】
技术研发人员:张涛,薛胶,
申请(专利权)人:江苏索迩软件技术有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。