用于计算机问答的方法及系统技术方案

技术编号:8271733 阅读:197 留言:0更新日期:2013-01-31 04:05
本发明专利技术提出了一种用于计算机问答的方法及系统,包括:接收多个待训练问题,获取每个问题的候选答案集合;确定所述候选答案集合包含正确答案的部分问题,用该部分问题对应的候选答案的第一特征集合构成第一输入训练数据集;对所述第一输入训练数据集进行机器学习得到第一数学模型;计算全部待训练问题的候选答案的第一置信度,并针对每个问题提取与所述第一置信度以及所述第一特征集合相关的第二特征集合;对所述多个待训练问题的第二特征集合构成的第二输入训练数据集进行机器学习得到第二数学模型。采用本发明专利技术的技术方案可以对现有的问题系统进行改善。

【技术实现步骤摘要】
本专利技术涉及用于计算机问答领域,特别是涉及一种改善了的计算机问答的机器学习方法和系统,以及对新问题进行回应的方法和系统。
技术介绍
问答系统(QuestionAnswering System),又称人机对话系统(Human MachineConversation, HMC),是指系统接受用户以自然语言形式描述的提问,从大量结构化、半结构化或者非结构化的数据中,获取能回答此自然语言形式问句的准确、简洁、个性化的答案。问答系统在各个领域中发挥着越来越重要的作用,例如,在保健/生命科学领域,可以辅助诊断、医疗自助等;在零售/消费领域,可用于呼叫中心(call-center),自助服务等;在企业的商业智能(BI)领域,也可以辅助企业的决策。然而,在现有技术中,当正确的答案未包含在候选答案集合中时,由于这些数据与机器学习无关,导致无论如何训练模型,都不能找到这些问题的正确答案,使得机器学习难于获得好的分辨力。由此可见,现有的问答方法及系统仍然存在着改进的空间。
技术实现思路
根据本专利技术的第一个方面,提供了一种用于计算机问答的机器学习方法,包括接收多个待训练问题,获取每个问题的候选答案集合;确定所述本文档来自技高网...

【技术保护点】
一种用于计算机问答的机器学习方法,包括:接收多个待训练问题,获取每个问题的候选答案集合;确定所述候选答案集合包含正确答案的部分问题,用该部分问题对应的候选答案的第一特征集合构成第一输入训练数据集;对所述第一输入训练数据集进行机器学习得到第一数学模型,所述第一数学模型用于根据所述第一特征集合计算所述候选答案为正确答案的第一置信度;计算全部待训练问题的候选答案的第一置信度,并针对每个问题提取与所述第一置信度以及所述第一特征集合相关的第二特征集合;对所述多个待训练问题的第二特征集合构成的第二输入训练数据集进行机器学习得到第二数学模型,所述第二数学模型用于根据所述第二特征集合计算所述候选答案为正确答案...

【技术特征摘要】
1.一种用于计算机问答的机器学习方法,包括 接收多个待训练问题,获取每个问题的候选答案集合; 确定所述候选答案集合包含正确答案的部分问题,用该部分问题对应的候选答案的第一特征集合构成第一输入训练数据集; 对所述第一输入训练数据集进行机器学习得到第一数学模型,所述第一数学模型用于根据所述第一特征集合计算所述候选答案为正确答案的第一置信度; 计算全部待训练问题的候选答案的第一置信度,并针对每个问题提取与所述第一置信度以及所述第一特征集合相关的第二特征集合; 对所述多个待训练问题的第二特征集合构成的第二输入训练数据集进行机器学习得到第二数学模型,所述第二数学模型用于根据所述第二特征集合计算所述候选答案为正确答案的第二置信度。2.如权利要求I所述的方法,其特征在于,所述第一特征集合包括以下特征的一种或多种 所述候选答案和所述待训练问题所问类型的匹配程度; 所述候选答案周围的文字和所述待训练问题文字的字面相似性; 所述候选答案的时间特征和所述待训练问题中出现时间的匹配程度; 所述候选答案的地理位置信息和所述待训练问题中出现地理位置的匹配程度。3.如权利要求I或2所述的方法,其特征在于,所述第一特征集合还包括所述候选答案是否为正确答案的信息。4.如权利要求I或2所述的方法,其特征在于,所述第二特征集合包括以下特征的一种或多种 所述第一置信度的最大值; 所述第一置信度的最大值与次大值的差; 所述第一置信度的平均值; 所述第一特征集合中重要特征的平均值; 所述第一特征集合中重要特征的标准差。5.如权利要求I所述的方法,其特征在于,在提取所述第二特征集合之前,根据所述第一置信度对所述待训练问题的候选答案进行排序。6.一种对新问题进行回应的方法,包括 接收所述新问题,获取该新问题的候选答案集合; 提取所述新问题的候选答案的第一特征集合,并应用权利要求I之方法得到的第一数学模型计算所述新问题的候选答案的第一置信度,所述第一特征集合与所述第一数学模型相对应; 提取所述新问题的候选答案的第二特征集合,并应用权利要求I之方法得到的第二数学模型计算所述新问题的候选答案的第二置信度,所述第二特征集合与所述第二数学模型相对应; 根据所述新问题的候选答案的第二置信度对所述新问题进行回应。7.如权利要求6所述的方法,其特征在于,在提取所述新问题的候选答案的第二特征集合之前,根据所述新问题的候选答案的第一置信度对所述待新问题的候选答案进行排序。8.如权利要求6所述的方法,其特征在于,所述对新问题进行回应是 响应于所述新问题的候选答案的第二置信度中的最大值超过预先设定的阈值,用对应的候选答案进行回答,否则,放弃回答。9.一种用于计算机问答的机器学习系统,包括 配置为接收多个待训练问题,获取每个问题的候选答案集合的...

【专利技术属性】
技术研发人员:张雷裘照明倪渊
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1