【技术实现步骤摘要】
同义问句生成模型训练方法及系统、同义问句生成方法
本专利技术涉及计算机信息
,尤其涉及一种同义问句生成模型训练方法及系统、同义问句生成方法。
技术介绍
自然语言处理领域在近些年得到了飞速发展,而问答系统作为自然语言处理领域的重要内容也成为人们关注的热点。现阶段,问答系统广泛应用于智能客服,智能聊天机器人等。目前,常用的问答系统由用户交互模块、知识库、检索与排序模块、答案处理模块组成。用户问题与知识库内所表示的问题之间越相近,问答系统回答就越准确。否则会出现由于用户问题和存储的问答对表述差异较大,问答系统不能返回正确答案的情况。此时将用户问题更换为同义问句,问答系统就能返回正确答案。例如,假设问答系统知识库中存在问题“最早的手机是谁专利技术的?”,对用户问题“移动电话的专利技术人叫什么名字”,问答系统不能返回正确答案。对同义扩展问题“手机是谁专利技术的?”,问答系统则能返回正确答案。目前扩展同义问句的方法主要依靠人工进行近义词替换、主语替换等,具有人工工作量大,而且不能生成新句式等缺点。< ...
【技术保护点】
1.一种同义问句生成模型训练方法,包括:/n获取训练样本集,所述训练样本集中包含有多个同义问句集合,所述多个同义问句集合中的每一个同义问句集合分别包含多个问句对;/n以所述训练样本集中的问句对对所述同义问句生成模型进行训练。/n
【技术特征摘要】
1.一种同义问句生成模型训练方法,包括:
获取训练样本集,所述训练样本集中包含有多个同义问句集合,所述多个同义问句集合中的每一个同义问句集合分别包含多个问句对;
以所述训练样本集中的问句对对所述同义问句生成模型进行训练。
2.根据权利要求1所述的同义问句生成模型训练方法,其中,所述获取训练样本集包括:
获取问句集合;
对所述问句集合中的问句进行聚类,得到多个同义问句集合;
将所述多个同义问句集合中的每一个同义问句集合中的问句之间两两构成问句对,以得到相应的多个同义问句对集合。
3.根据权利要求2所述的方法,其中,
在将所述多个同义问句集合中的每一个同义问句集合中的问句之间两两构成问句对之前,所述方法还包括:
根据预设扩展词库,对所述多个同义问句集合中的问句进行同义句扩展。
4.根据权利要求3所述的方法,其中,所述根据预设扩展词库,对所述多个同义问句集合中的问句进行同义句扩展包括:
对于所述多个同义问句集合中的每一个问句进行分词处理,得到对应于所述每一个问句的多个分词;
从所述预设扩展词库中查找用于替换所述每一个问句的多个分词的扩展词,以得到扩展同义问句。
5.根据权利要求4所述的方法,其中,还包括:对于扩展...
【专利技术属性】
技术研发人员:钟丽娟,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。