基于语言模型的问答匹配方法、系统、设备及存储介质技术方案

技术编号：21629076 阅读：34 留言：0更新日期：2019-07-17 11:08

本发明专利技术公开了一种基于语言模型的问答匹配方法、系统、设备及存储介质，其中方法包括步骤：S1、在接收到提问问题后，从提问数据库中获取与所述提问问题匹配的目标问题，然后获取答案数据库中与所述目标问题对应的每个答案数据；S2、采用语言模型对所述答案数据进行处理，生成相应的文本特征及行为特征，所述行为特征用于表征所述答案数据的状态和属性；S3、采用决策树模型计算所述文本特征和所述行为特征，并根据计算结果预测所述答案数据的排序结果。本发明专利技术通过语言模型和决策树模型，可以快速、准确地定位出用户需求和对答案数据智能排序，从而为用户筛选出最想看的答案，提升用户体验。

Question-Answer Matching Method, System, Equipment and Storage Media Based on Language Model

全部详细技术资料下载

【技术实现步骤摘要】
基于语言模型的问答匹配方法、系统、设备及存储介质
本专利技术涉及计算机
，特别涉及一种基于语言模型的问答匹配方法、系统、设备及存储介质。
技术介绍
在当今信息时代，计算机作为信息传递工具已经逐渐在全球范围内普及。随着人工智能的发展，可以让计算机理解语言，并能对用户的对话做出有价值的排序。现有技术中，问答系统一般采用以下两种方法来实现问题与答案的匹配：(1)问题和答案基于规则的匹配该方法主要包括字符串匹配查找，正则表达式等，通过编写复杂的正则表达式规则模板，模拟出每一个语境对应的关键词进行匹配关联，若提问句不存在对应的匹配规则，就会得到不靠谱的排序；(2)基于检索的语料系统，计算词向量这种方法通过对句子分词后形成词向量，然后根据相似度排序答案，由于算法并没有真正学习利用语言的内在逻辑关系，有可能有的答案者把问题在答案中复制了一遍，但是基于相似度计算会得到很高的相似度，显然不能保证用户体验。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中基于规则的问答方法需要复杂的正则表达式且答案可能不靠谱，而基于检索的语料系统通过计算问答句之间的词向量相似度，并没有...

【技术保护点】
1.一种基于语言模型的问答匹配方法，其特征在于，包括：S1、在接收到提问问题后，从提问数据库中获取与所述提问问题匹配的目标问题，然后获取答案数据库中与所述目标问题对应的每个答案数据；S2、采用语言模型对所述答案数据进行处理，生成相应的文本特征及行为特征，所述行为特征用于表征所述答案数据的状态和属性；S3、采用决策树模型计算所述文本特征和所述行为特征，并根据计算结果预测所述答案数据的排序结果。

【技术特征摘要】
1.一种基于语言模型的问答匹配方法，其特征在于，包括：S1、在接收到提问问题后，从提问数据库中获取与所述提问问题匹配的目标问题，然后获取答案数据库中与所述目标问题对应的每个答案数据；S2、采用语言模型对所述答案数据进行处理，生成相应的文本特征及行为特征，所述行为特征用于表征所述答案数据的状态和属性；S3、采用决策树模型计算所述文本特征和所述行为特征，并根据计算结果预测所述答案数据的排序结果。2.如权利要求1所述的基于语言模型的问答匹配方法，其特征在于，所述决策树模型包括GBDT模型。3.如权利要求1所述的基于语言模型的问答匹配方法，其特征在于，所述语言模型包括N-Gram模型、神经网络语言模型和循环神经网络，步骤S2具体包括：采用所述N-Gram模型将所述答案数据生成相应的答案词向量；采用所述神经网络语言模型训练所述答案词向量；采用所述循环神经网络训练所述神经网络语言模型输出的结果以获得所述文本特征及所述行为特征。4.如权利要求3所述的基于语言模型的问答匹配方法，其特征在于，所述N-Gram模型包括Skip-Gram模型。5.如权利要求1所述的基于语言模型的问答匹配方法，其特征在于，在步骤S3后，所述问答匹配方法还包括：评估所述排序结果的AUC指标和/或评估所述排序结果的曝光点击率。6.如权利要求1所述的基于语言模型的问答匹配方法，其特征在于，在步骤S3后，所述问答匹配方法还包括：将所述排序结果中排序靠前的若干个答案数据推送至用户。7.如权利要求6所述的基于语言模型的问答匹配方法，其特征在于，在将所述排序结果中排序靠前的若干个答案数据推送至用户的步骤前，所述问答匹配方法还包括：将所述排序结果进行ABTest测试。8.如权利要求6所述的基于语言模型的问答匹配方法，其特征在于，在将所述排序结果中排序靠前的若干个答案数据推送至用户的步骤后，所述问答匹配方法还包括：接收用户选取指令；根据所述选取指令从所述排序结果中选取最佳回答；对所述最佳回答标记标签。9.如权利要求1所述的基于语言模型的问答匹配方法，其特征在于，步骤S1具体包括：在接收到所述提问问题后，采用语言模型对所述提问问题进行处理，生成所述提问问题的问句词向量；计算所述问句词向量与提问数据库中每一问题对应的词向量的相似度；将提问数据库中与所述问句词向量的相似度最大的词向量对应的问题作为目标问题；将答案数据库中与所述目标问题对应的每个答案数据返回。10.一种基于语言模型的问答匹配系统，其特征在于，包括：获取模块、语言模块和决策树模块；所述获取模块用于在接收到提问问题后，从提问数据库中获取与所述提问问题匹配的目标问题，还用于获取答案数据库中与所述目标问题对应的每个答案数据；所述语言模块用于采用语言模型对所述答案数据进行处理，生成相应的文本特征及行为特征，所述行为特征用于表征所述答案...

【专利技术属性】
技术研发人员：王颖帅，李晓霞，苗诗雨，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人