一种基于自动扩展问答数据库的问答方法及设备技术

技术编号：22135292 阅读：38 留言：0更新日期：2019-09-18 09:00

本申请的目的是提供一种基于自动扩展问答数据库的问答方法及设备，本申请通过获取同义转写训练样本，通过所述同义转写训练样本优化神经网络转写模型；确定加入数据库中的问答对，其中，所述问答对包括问题句和问题句对应的答句；通过所述优化后的神经网络转写模型对所述数据库中的问答对中的问题句进行扩展，得到多个扩展问答对。利用将问答数据库中的问句扩展到多条同义或近义的句子的方式来提升问答数据对用户请求的覆盖率，从而优化问答系统的效果。

A Question Answering Method and Equipment Based on Automatic Expanded Question Answering Database

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自动扩展问答数据库的问答方法及设备
本申请涉及计算机领域，尤其涉及一种基于自动扩展问答数据库的问答方法及设备。
技术介绍
目前业内普遍采用的一种实现自动问答功能的方案是基于海量回答对数据库的查询匹配方法。用户发出了一个文本请求后，根据该文本内容对数据库中所有条目的“问句”字段进行查询，返回匹配到的条目的“答句”字段。使用该方案要求问答数据库中有尽可能多的问答对，以尽可能的覆盖用户发出的文本请求，才能使该自动问答系统达到较为理想的效果。在问答数据不够多的情况下，往往会发生数据库中匹配不到用户当前请求的情况。
技术实现思路
本申请的一个目的是提供一种基于自动扩展问答数据库的问答方法及设备，解决现有技术中数据库匹配用户请求的概率低，问答系统效果不佳的问题。根据本申请的一个方面，提供了一种基于自动扩展问答数据库的问答方法，该方法包括：获取同义转写训练样本，通过所述同义转写训练样本优化神经网络转写模型；确定加入数据库中的问答对，其中，所述问答对包括问题句和问题句对应的答句；通过所述优化后的神经网络转写模型对所述数据库中的问答对中的问题句进行扩展，得到多个扩展问答对。进一步地，获取同义转写训练样本包括：利用语义匹配系统从文本数据库中匹配含义相同程度达到预设阈值的句对，其中，所述句对包括含义相同的多个句子；将所述含义相同程度达到预设阈值的句对放入所述同义转写训练样本中。进一步地，利用语义匹配系统从文本数据库中匹配含义相同程度达到预设阈值的句对，包括：获取待匹配句子，根据字符串比较的方式从语句库中筛选出每一待匹配句子对应的候选句；根据所述语义匹配系统对所述待匹配句子及...

【技术保护点】
1.一种基于自动扩展问答数据库的问答方法，其中，所述方法包括：获取同义转写训练样本，通过所述同义转写训练样本优化神经网络转写模型；确定加入数据库中的问答对，其中，所述问答对包括问题句和问题句对应的答句；通过所述优化后的神经网络转写模型对所述数据库中的问答对中的问题句进行扩展，得到多个扩展问答对。

【技术特征摘要】
1.一种基于自动扩展问答数据库的问答方法，其中，所述方法包括：获取同义转写训练样本，通过所述同义转写训练样本优化神经网络转写模型；确定加入数据库中的问答对，其中，所述问答对包括问题句和问题句对应的答句；通过所述优化后的神经网络转写模型对所述数据库中的问答对中的问题句进行扩展，得到多个扩展问答对。2.根据权利要求1所述的方法，其中，获取同义转写训练样本包括：利用语义匹配系统从文本数据库中匹配含义相同程度达到预设阈值的句对，其中，所述句对包括含义相同的多个句子；将所述含义相同程度达到预设阈值的句对放入所述同义转写训练样本中。3.根据权利要求2所述的方法，其中，利用语义匹配系统从文本数据库中匹配含义相同程度达到预设阈值的句对，包括：获取待匹配句子，根据字符串比较的方式从语句库中筛选出每一待匹配句子对应的候选句；根据所述语义匹配系统对所述待匹配句子及其对应的候选句进行打分，得到匹配程度结果；根据所述匹配程度结果及预设阈值确定含义相同程度达到预设阈值的句对。4.根据权利要求3所述的方法，其中，所述字符串比较的方式包括：使用全文检索将待匹配的句子进行分词，得到分词结果；通过索引查询所述分词结果，并按照所述分...

【专利技术属性】
技术研发人员：陆晨昱，舒畅，李竹桥，郑思璇，朱婷婷，李先云，刘尧，
申请(专利权)人：义语智能科技广州有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人