【技术实现步骤摘要】
一种机场服务的社区问答系统
本专利技术涉及自然语言处理领域,尤其涉及一种机场服务的社区问答系统。
技术介绍
问答系统是信息检索和自然语言处理领域下的一个细分方向,主要目的是构建一个程序或系统,使其能够自动地回答人类提出的、以自然语言方式阐述的问题。目前,已经有一系列商业化较为成功的问答系统应用到了人们的日常生活中,例如以苹果Siri为代表的一系列智能语音助手,以及微软公司的跨平台人工智能机器人微软小冰等等。当前,机场服务领域的问答系统大多是基于知识图谱构建,这种系统可以较好地回答事实型问题,例如机场安检区位置,值机窗口开放时间等等,但是对于“丢了东西怎么办”这类流程型问题则无法回答。另外,基于知识图谱的问答系统需要通过结构化的信息构建图谱,使得数据的预处理成本较高。本专利技术所实现的是一个应用于机场服务的社区问答系统。该系统是基于机场客服文档等非结构化的数据,从而能够以更低的处理成本利用更多的知识。此外,该系统针对的是机场服务相关的流程型问题,可以有效对当前主流问答系统起到功能补全的作用。本系统应用到航空助手app后 ...
【技术保护点】
1.一种机场服务的社区问答系统,其特征在于:包括输入模块,对用户输入信息依数据的流动方向从前到后设置的四个模块,依次是问题-问题匹配模块,问题分类模块,问题-答案匹配模块和可回答性判断模块,以及最终的信息输出模块,并设立用于问题匹配和答案生成的问答对库和答案库两个数据库;/n其中,数据处理模块将原始数据进行清理和重构,生成问题-答案库,用于问题-问题匹配模块;生成分类答案库,用于问题分类模块;生成未分类答案库,用于问题-答案匹配模块以回答无法被分类器分归类的问题;输入模块用于采集用户的问题并转化为可识别的文本,并将文本输入至所述问题-问题匹配模块采用采用TF-IDF向量相似 ...
【技术特征摘要】
1.一种机场服务的社区问答系统,其特征在于:包括输入模块,对用户输入信息依数据的流动方向从前到后设置的四个模块,依次是问题-问题匹配模块,问题分类模块,问题-答案匹配模块和可回答性判断模块,以及最终的信息输出模块,并设立用于问题匹配和答案生成的问答对库和答案库两个数据库;
其中,数据处理模块将原始数据进行清理和重构,生成问题-答案库,用于问题-问题匹配模块;生成分类答案库,用于问题分类模块;生成未分类答案库,用于问题-答案匹配模块以回答无法被分类器分归类的问题;输入模块用于采集用户的问题并转化为可识别的文本,并将文本输入至所述问题-问题匹配模块采用采用TF-IDF向量相似度匹配的模型识别并回答常见问题,如果所述问题-问题匹配模块不能匹配成功,那么问题被送入随后的所述问题分类模块进行处理,否则则将匹配生成的答案发送至信息输出模块;
所述问题分类模块为分类器,通过分类器在已经建立的存储答案的数据库中得到针对输入问题的答案库,并将所述答案库输入至所述问题-答案匹配模块;
所述问题-答案匹配模块为利用EmbeddingWeightedBM25模型改进OkapiBM25算法的词频计算方式的分类器对输入的问题请求进行分类的模型,并得到匹配得分,将所述匹配得分和所述答案库输入所述可回答性判断模块;
所述可回答性判断模块,通过对所述EmbeddingWeightedBM25方法的匹配得分进行归一化、得分设置阈值操作,对于可以回答的问题,生成给出准确的答案,而对于超出系统知识的问题或是不相关的问题,则生成“不可回答”的判断,并向所述信息输出模块返回准确有效的答案。
2.如权利要求1所述一种机场服务的社区问答系统,其特征在于:所述问题-问题匹配模块的所述TF-IDF向量相似度匹配的模型的运算分为两个步骤:第一步是通过设置匹配得分机制,将新的问题与问答对库中的问题集合做匹配,根据设定阈值选择出与问题最相近的问题,大于阈值的匹配可以认为是两个问题匹配成功,可以共享同一个答案,小于阈值的匹配则可以认为是两个不同的问...
【专利技术属性】
技术研发人员:张日崇,张明辉,张延钊,张淑慧,胡志元,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。