用于计算机问答的方法及系统技术方案

技术编号:8271733 阅读:185 留言:0更新日期:2013-01-31 04:05
本发明专利技术提出了一种用于计算机问答的方法及系统,包括:接收多个待训练问题,获取每个问题的候选答案集合;确定所述候选答案集合包含正确答案的部分问题,用该部分问题对应的候选答案的第一特征集合构成第一输入训练数据集;对所述第一输入训练数据集进行机器学习得到第一数学模型;计算全部待训练问题的候选答案的第一置信度,并针对每个问题提取与所述第一置信度以及所述第一特征集合相关的第二特征集合;对所述多个待训练问题的第二特征集合构成的第二输入训练数据集进行机器学习得到第二数学模型。采用本发明专利技术的技术方案可以对现有的问题系统进行改善。

【技术实现步骤摘要】
本专利技术涉及用于计算机问答领域,特别是涉及一种改善了的计算机问答的机器学习方法和系统,以及对新问题进行回应的方法和系统。
技术介绍
问答系统(QuestionAnswering System),又称人机对话系统(Human MachineConversation, HMC),是指系统接受用户以自然语言形式描述的提问,从大量结构化、半结构化或者非结构化的数据中,获取能回答此自然语言形式问句的准确、简洁、个性化的答案。问答系统在各个领域中发挥着越来越重要的作用,例如,在保健/生命科学领域,可以辅助诊断、医疗自助等;在零售/消费领域,可用于呼叫中心(call-center),自助服务等;在企业的商业智能(BI)领域,也可以辅助企业的决策。然而,在现有技术中,当正确的答案未包含在候选答案集合中时,由于这些数据与机器学习无关,导致无论如何训练模型,都不能找到这些问题的正确答案,使得机器学习难于获得好的分辨力。由此可见,现有的问答方法及系统仍然存在着改进的空间。
技术实现思路
根据本专利技术的第一个方面,提供了一种用于计算机问答的机器学习方法,包括接收多个待训练问题,获取每个问题的候选答案集合;确定所述候选答案集合包含正确答案的部分问题,用该部分问题对应的候选答案的第一特征集合构成第一输入训练数据集;对所述第一输入训练数据集进行机器学习得到第一数学模型,所述第一数学模型用于根据所述第一特征集合计算所述候选答案为正确答案的第一置信度;计算全部待训练问题的候选答案的第一置信度,并针对每个问题提取与所述第一置信度以及所述第一特征集合相关的第二特征集合;对所述多个待训练问题的第二特征集合构成的第二输入训练数据集进行机器学习得到第二数学模型,所述第二数学模型用于根据所述第二特征集合计算所述候选答案为正确答案的第二置信度。根据本专利技术的第二个方面,提供了一种对新问题进行回应的方法,包括接收所述新问题,获取该新问题的候选答案集合;提取所述新问题的候选答案的第一特征集合,并应用前述之方法得到的第一数学模型计算所述新问题的候选答案的第一置信度,所述第一特征集合与所述第一数学模型相对应;提取所述新问题的候选答案的第二特征集合,并应用前述之方法得到的第二数学模型计算所述新问题的候选答案的第二置信度,所述第二特征集合与所述第二数学模型相对应;根据所述新问题的候选答案的第二置信度对所述新问题进行回应。根据本专利技术的第三个方面,提供了一种用于计算机问答的机器学习系统,包括配置为接收多个待训练问题,获取每个问题的候选答案集合的装置;配置为确定所述候选答案集合包含正确答案的部分问题,用该部分问题对应的候选答案的第一特征集合构成第一输入训练数据集的装置;配置为对所述第一输入训练数据集进行机器学习得到第一数学模型的装置,所述第一数学模型用于根据所述第一特征集合计算所述候选答案为正确答案的第一置信度;配置为计算全部待训练问题的候选答案的第一置信度的装置,并针对每个问题提取与所述第一置信度以及所述第一特征集合相关的第二特征集合;配置为对所述多个待训练问题的第二特征集合构成的第二输入训练数据集进行机器学习得到第二数学模型的装置,所述第二数学模型用于根据所述第二特征集合计算候选答案为正确答案的第二置信度。根据本专利技术的第四个方面,提供了一种对新问题进行回应的系统,包括配置为接收所述新问题,获取该新问题的候选答案集合的装置;配置为提取所述新问题的候选答案的第一特征集合,并应用前述之系统得到的第一数学模型计算所述新问题的候选答案的第一置信度的装置,所述第一特征集合与所述第一数学模型相对应;配置为提取所述新问题的候选答案的第二特征集合,并应用前述之系统得到的第二数学模型计算所述新问题的候选答案的第二置信度的装置,所述第二特征集合与所述第二数学模型相对应;配置为根据所述新问题的候选答案的第二置信度对所述新问题进行回应的装置。 附图说明所附权利要求中阐述了被认为是本专利技术的特点的创造性特征。但是,通过参照附图阅读下面对说明性的实施例的详细说明可更好地理解专利技术本身以及其优选使用模式、目标、特征以及优点,在附图中图I示出了用来实现本专利技术实施方式的示例性计算系统。图2示出了本专利技术的机器学习方法流程示意图。图3示出了回答新问题的工作流程示意图。图4示出了图3中步骤304的另一种实施方式的示意图。具体实施例所属
的技术人员知道,本专利技术可以体现为系统、方法或计算机程序产品。因此,本专利技术可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组合。此外,本专利技术还可以采取体现在任何有形的表达介质(medium of expression)中的计算机程序产品的形式,该介质中包含计算机可用的程序码。可以使用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质,计算机可读存储介质例如可以是一但不限于一电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置、器件或传播介质、或前述各项的任何适当的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括以下有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPR0M或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或前述各项的任何适当的组合。在本文语境中,计算机可读存储介质可以是任何含有或存储供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的有形介质。计算机可读信号介质可以包括例如在基带中或作为载波的一部分传播的带有计算机可读程序代码的数据信号。这样一种传播信号可以采取任何适当的形式,包括-但不限于-电磁的、光的或其任何适当的组合。计算机可读信号介质可以是不同于计算机可读存储介质的、可以传达、传播或传输供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的任何一种计算机可读介质。包含在计算机可读介质中的程序代码可以采用任何适当的介质传输,包括-但不限于-无线、有线、光缆、射频等等、或上述各项的任何适当的组合。用于执行本专利技术的操作的计算机程序码,可以以一种或多种程序设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++之类,还包括常规的过程式程序设计语言-诸如”C”程序设计语言或类似的程序设计语言。程序码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何种类的网络一包括局域网(LAN)或广域网(WAN)-连接到用户的计算机,或者,可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。·以下参照按照本专利技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本专利技术。要明白的是,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的本文档来自技高网
...

【技术保护点】
一种用于计算机问答的机器学习方法,包括:接收多个待训练问题,获取每个问题的候选答案集合;确定所述候选答案集合包含正确答案的部分问题,用该部分问题对应的候选答案的第一特征集合构成第一输入训练数据集;对所述第一输入训练数据集进行机器学习得到第一数学模型,所述第一数学模型用于根据所述第一特征集合计算所述候选答案为正确答案的第一置信度;计算全部待训练问题的候选答案的第一置信度,并针对每个问题提取与所述第一置信度以及所述第一特征集合相关的第二特征集合;对所述多个待训练问题的第二特征集合构成的第二输入训练数据集进行机器学习得到第二数学模型,所述第二数学模型用于根据所述第二特征集合计算所述候选答案为正确答案的第二置信度。

【技术特征摘要】
1.一种用于计算机问答的机器学习方法,包括 接收多个待训练问题,获取每个问题的候选答案集合; 确定所述候选答案集合包含正确答案的部分问题,用该部分问题对应的候选答案的第一特征集合构成第一输入训练数据集; 对所述第一输入训练数据集进行机器学习得到第一数学模型,所述第一数学模型用于根据所述第一特征集合计算所述候选答案为正确答案的第一置信度; 计算全部待训练问题的候选答案的第一置信度,并针对每个问题提取与所述第一置信度以及所述第一特征集合相关的第二特征集合; 对所述多个待训练问题的第二特征集合构成的第二输入训练数据集进行机器学习得到第二数学模型,所述第二数学模型用于根据所述第二特征集合计算所述候选答案为正确答案的第二置信度。2.如权利要求I所述的方法,其特征在于,所述第一特征集合包括以下特征的一种或多种 所述候选答案和所述待训练问题所问类型的匹配程度; 所述候选答案周围的文字和所述待训练问题文字的字面相似性; 所述候选答案的时间特征和所述待训练问题中出现时间的匹配程度; 所述候选答案的地理位置信息和所述待训练问题中出现地理位置的匹配程度。3.如权利要求I或2所述的方法,其特征在于,所述第一特征集合还包括所述候选答案是否为正确答案的信息。4.如权利要求I或2所述的方法,其特征在于,所述第二特征集合包括以下特征的一种或多种 所述第一置信度的最大值; 所述第一置信度的最大值与次大值的差; 所述第一置信度的平均值; 所述第一特征集合中重要特征的平均值; 所述第一特征集合中重要特征的标准差。5.如权利要求I所述的方法,其特征在于,在提取所述第二特征集合之前,根据所述第一置信度对所述待训练问题的候选答案进行排序。6.一种对新问题进行回应的方法,包括 接收所述新问题,获取该新问题的候选答案集合; 提取所述新问题的候选答案的第一特征集合,并应用权利要求I之方法得到的第一数学模型计算所述新问题的候选答案的第一置信度,所述第一特征集合与所述第一数学模型相对应; 提取所述新问题的候选答案的第二特征集合,并应用权利要求I之方法得到的第二数学模型计算所述新问题的候选答案的第二置信度,所述第二特征集合与所述第二数学模型相对应; 根据所述新问题的候选答案的第二置信度对所述新问题进行回应。7.如权利要求6所述的方法,其特征在于,在提取所述新问题的候选答案的第二特征集合之前,根据所述新问题的候选答案的第一置信度对所述待新问题的候选答案进行排序。8.如权利要求6所述的方法,其特征在于,所述对新问题进行回应是 响应于所述新问题的候选答案的第二置信度中的最大值超过预先设定的阈值,用对应的候选答案进行回答,否则,放弃回答。9.一种用于计算机问答的机器学习系统,包括 配置为接收多个待训练问题,获取每个问题的候选答案集合的...

【专利技术属性】
技术研发人员:张雷裘照明倪渊
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1