回答生成装置、回答生成方法及计算机可读介质制造方法及图纸

技术编号:29954943 阅读:14 留言:0更新日期:2021-09-08 08:52
本发明专利技术提供回答生成装置、回答生成方法及计算机可读介质。回答生成装置具备:输入部,其输入提问及成为解析的对象的数据即解析对象数据;处理器;以及输出部,所述处理器通过执行程序而进行如下处理,在输入了所述提问及所述解析对象数据的情况下,使用事先准备的多个单一回答模型,从所述解析对象数据中分别独立地提取针对所述提问的回答,计算提取出的所述回答的每个标记的出现频度,基于所述出现频度,提取单一回答或多个回答并向所述输出部输出。提取单一回答或多个回答并向所述输出部输出。提取单一回答或多个回答并向所述输出部输出。

【技术实现步骤摘要】
回答生成装置、回答生成方法及计算机可读介质


[0001]本公开涉及回答生成装置、回答生成方法及计算机可读介质。

技术介绍

[0002]一直以来,提出了在给出了提问和关联文本时,从关联文本中提取适当的回答的技术。
[0003]在日本特开2019-220142号公报中记载了如下装置,该装置针对能够以极性进行回答的提问,能够高精度地以极性进行回答。机器读解部使用预先学习的读解模型,来估计该范围的始端及终端,该读解模型用于基于输入的文章及提问句,估计该文章中的成为针对该提问句的回答的根据的范围。判断部使用预先学习的判断模型,来判断针对该提问句的回答的极性,该判断模型用于基于通过机器读解部的处理而得到的信息,判断针对提问句的回答的极性是否准确。
[0004]在日本特开2019-191827号公报中,记载有用于实现高精度的提问应答的装置。装置具有回答生成单元,该回答生成单元将文档及提问作为输入,使用规定的第1词汇和由包含在文档及提问中的单词构成的第2词汇的和集合所包含的单词,通过学习完毕模型来执行生成针对提问的回答句的处理。学习完毕模型包括针对回答句所包含的单词是否包含在第2词汇中而预先进行了学习的学习完毕神经网络,通过该学习完毕神经网络,在生成回答句时,使选择第2词汇所包含的单词作为该回答句所包含的单词的概率增减。

技术实现思路

[0005]本公开的目的在于,提供如下技术:在给出了提问和与该提问关联的文本等成为解析对象的数据即解析对象数据时,能够从解析对象数据中提取针对该提问的多个回答。
>[0006]根据本公开的第1方案,提供一种回答生成装置,其中,
[0007]所述回答生成装置具备:输入部,其输入提问及成为解析的对象的数据即解析对象数据;处理器;以及输出部,所述处理器通过执行程序而进行如下处理,在输入了所述提问及所述解析对象数据的情况下,使用事先准备的多个单一回答模型,从所述解析对象数据中分别独立地提取针对所述提问的回答,计算提取出的所述回答的每个标记的出现频度,基于所述出现频度,提取单一回答或多个回答并向所述输出部输出。
[0008]根据本公开的第2方案,所述处理器使用第1阈值及比所述第1阈值小的第2阈值,在所述出现频度为所述第1阈值以上的情况下,将所述出现频度成为所述第1阈值以上的标记判定为单一回答并输出,在所述出现频度小于所述第1阈值且为所述第2阈值以上的情况下,将所述出现频度小于所述第1阈值且成为所述第2阈值以上的标记判定为多个回答并输出,在所述出现频度小于所述第2阈值的情况下,不选择对象标记作为回答。
[0009]根据本公开的第3方案,所述处理器在针对连续的多个所述标记的判定结果相同的情况下,代替输出各标记作为输出结果,而是以序列长度成为最大的方式连续地选择标记并输出。
[0010]根据本公开的第4方案,所述处理器在针对处理对象标记判定为单一回答之后,针对下一个处理对象标记判定为多个回答或者无回答的情况下,仅输出判定为单一回答的标记。
[0011]根据本公开的第5方案,所述处理器使用所述多个回答的回答数以上的所述多个单一回答模型。
[0012]根据本公开的第6方案,所述多个单一回答模型分别是如下模型:基于深度学习方法,将所述提问及所述解析对象数据编码为分布式表达,基于编码后的所述分布式表达,通过用于估计所述回答的开始点及结束点的全连接层从所述解析对象数据中提取最大概率的回答范围。
[0013]根据本公开的第7方案,所述多个单一回答模型分别使用针对提问仅给出了单一的回答的学习数据而进行学习。
[0014]根据本公开的第8方案,所述解析对象数据是文本数据,所述标记是所述文本数据中的单词或字符串。
[0015]根据本公开的第9方案,提供一种计算机可读介质,其存储有使计算机执行处理的程序,其中,所述处理具有如下步骤:输入提问及成为解析的对象的数据即解析对象数据;使用事先准备的多个单一回答模型,从所述解析对象数据中分别独立地提取针对所述提问的回答;计算提取出的所述回答的每个标记的出现频度;以及基于所述出现频度,提取单一回答或多个回答并输出。
[0016]根据本公开的第10方案,提供一种回答生成方法,其中,所述回答生成方法具有如下步骤:输入提问及成为解析的对象的数据即解析对象数据;使用事先准备的多个单一回答模型,从所述解析对象数据中分别独立地提取针对所述提问的回答;计算提取出的所述回答的每个标记的出现频度;以及基于所述出现频度,提取单一回答或多个回答并输出。
[0017]专利技术的效果
[0018]根据所述第1方案、第9方案或者第10方案,在给出了提问和解析对象数据时,能够从解析对象数据中提取针对该提问的多个回答。
[0019]根据所述第2方案、第3方案或者第4方案,能够进一步判定单一回答、多个回答、无回答中的任意一方并输出。
[0020]根据所述第5方案或第6方案,能够进一步提高回答的精度。
[0021]根据所述第7方案,能够进一步确保学习数据。
[0022]根据所述第8方案,能够进一步从文本数据中提取单词或字符串作为回答。
附图说明
[0023]图1是关联文本及提问的说明图(其1)。
[0024]图2是关联文本及提问的说明图(其2)。
[0025]图3是示出单一回答QA和多个回答QA的回答的平均不同数的图表。
[0026]图4是实施方式的回答生成装置的结构框图。
[0027]图5是实施方式的功能框图。
[0028]图6是实施方式的机器读解模型的结构图。
[0029]图7是实施方式的处理流程图。
具体实施方式
[0030]以下,基于附图,以将文本数据作为解析对象数据为例,对本公开的实施方式进行说明,该解析对象数据是成为解析的对象的数据。
[0031]<基本原理>
[0032]首先,对本实施方式的基本原理进行说明。
[0033]机器读解任务的目的在于对给出的文本进行读解,对提问进行回答,在对模型的读解能力进行基准测试(benchmark)的方面也是重要的任务。例如在SQuAD(Pranav Rajpurkar,Jian Zhang,Konstantin Lopyrev,and Percy Liang.SQuAD:100,000+questions for machine comprehension of text.In EMNLP,2016.)这样的提取型机器读解中,在给出提问及关联文本(上下文)时,从上下文中提取最适当的回答。
[0034]图1示出提问(Question)及关联文本(Context)的一例。作为关联文本中的针对提问的适当的回答而提取“Russel”。
[0035]但是,目前为止的提取型机器读解限定于基于针对提问的正解为一个的回答范围的提问应答(以下称为“单一回答QA”),无法应对多个回答同时成立的这种提问应答。
[0036]另一方面,为了提取多个范围内的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种回答生成装置,其中,所述回答生成装置具备:输入部,其输入提问及成为解析的对象的数据即解析对象数据;处理器;以及输出部,所述处理器通过执行程序而进行如下处理:在输入了所述提问及所述解析对象数据的情况下,使用事先准备的多个单一回答模型,从所述解析对象数据中分别独立地提取针对所述提问的回答,计算提取出的所述回答的每个标记的出现频度,基于所述出现频度,提取单一回答或多个回答并向所述输出部输出。2.根据权利要求1所述的回答生成装置,其中,所述处理器使用第1阈值及比所述第1阈值小的第2阈值,在所述出现频度为所述第1阈值以上的情况下,将所述出现频度成为所述第1阈值以上的标记判定为单一回答并输出,在所述出现频度小于所述第1阈值且为所述第2阈值以上的情况下,将所述出现频度小于所述第1阈值且成为所述第2阈值以上的标记判定为多个回答并输出,在所述出现频度小于所述第2阈值的情况下,不将对象标记选择为回答。3.根据权利要求2所述的回答生成装置,其中,所述处理器在针对连续的多个所述标记的判定结果相同的情况下,代替输出各标记作为输出结果,而是以序列长度成为最大的方式连续地选择标记并输出。4.根据权利要求2所述的回答生成装置,其中,所述处理器在针对处理对象标记判定为单一回答之后,针对下一个处理对象标记判定为多个回答或者无回答的情况下,仅输出判定为单一回答的标记。5.根据权利要求1至4中的任意一项所述的回答生成装置,其中,所述处...

【专利技术属性】
技术研发人员:高桥拓诚谷口元树谷口友纪大熊智子
申请(专利权)人:富士胶片商业创新有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1