基于多形态文档视图的智能问答系统及方法技术方案

技术编号:36523244 阅读:11 留言:0更新日期:2023-02-01 16:00
基于多形态文档视图的智能问答系统及方法,涉及自然语言处理领域。为解决现有技术中存在的传统的开放域问答系统针对不同类型的文档视图布局复杂的问题,难以将所有对象进行统一建模的问题,本发明专利技术提供的技术方案为:基于多形态文档视图的智能问答系统,所述系统包括:多形态文档视图分析模块、多形态文档视图检索模块和多形态文档视图问答模块;所述多形态文档视图分析模块用于对文本信息进行抽取;所述多形态文档视图检索模块用于检索文本中与预设信息相关的文档视图并进行优先级排列;所述多形态文档视图问答模块用于抽取优先级较高的所述文档视图并输出。适合应用于对多形态文档视图的智能问答应用中。态文档视图的智能问答应用中。态文档视图的智能问答应用中。

【技术实现步骤摘要】
基于多形态文档视图的智能问答系统及方法


[0001]涉及自然语言处理领域,具体涉及文档视图检索。

技术介绍

[0002]随着自然语言处理技术的不断发展,智能问答系统的能力也在不断取得突破。传统的搜索引擎会根据用户输入的关键词返回文档集合,并没有实现用户的确切需求,智能问答系统的出现就是为了能够将用户需要的答案直接进行返回,而无需用户自己查找,即以自然的方式与系统进行交互。因此,如何能够准确地匹配到与问题相关的文档,并将对应答案抽取出来,一直都是问答系统领域亟待解决的问题之一。
[0003]文档视图问答是根据用户提出的问题,从文档库中找到回答问题的相关文档视图,并能够准确定位到答案的过程。它涉及多个领域并可进行拓展,具有很大的应用价值,如分析企业文档,提高办公效率。目前的开放域问答系统中,会根据既定规则对不同类型的文档采取不同文本抽取方法。另外,这些开放域问答系统大都以纯文本的形态进行信息交互,通过对用户问题进行解析后,利用非结构化的文档库进行查询并返回相关答案,如开源的开放域问答系统DRQA。而现实中的信息是多样化的,文档中除了包括纯文本,还有图像等视觉信息,如PDF,网页等。。因此,目前的智能问答系统忽略了表格、图像、空间布局等其他异构信息,返回的答案也比较单一,并且大多是连续的纯文本格式,不具备通用性,效率低下,准确度不高。
[0004]综上,可以看出传统的开放域问答系统在从不同类型的文档抽取与问题相关的答案的过程中,仍存在以下问题:
[0005]需要针对不同类型的文档设计不同的文本抽取方法,从而提高了工程复杂度,不具备通用性。
[0006]问答系统的对象往往以纯文本为目标,从而忽略了文档中的其他信息,如文本外观图像、表格、空间布局等。
[0007]针对不同类型的文档视图布局复杂的问题,难以将所有对象进行统一建模,同时,当问题对应的答案不连续时,传统系统难以进行准确抽取。

技术实现思路

[0008]为解决现有技术中存在的传统的开放域问答系统针对不同类型的文档视图布局复杂的问题,难以将所有对象进行统一建模的问题,本专利技术提供的技术方案为:
[0009]基于多形态文档视图的智能问答系统,所述系统包括:多形态文档视图分析模块、多形态文档视图检索模块和多形态文档视图问答模块;
[0010]所述多形态文档视图分析模块用于对文本信息进行抽取;
[0011]所述多形态文档视图检索模块用于检索文本中与预设信息相关的文档视图并进行优先级排列;
[0012]所述多形态文档视图问答模块用于抽取优先级较高的所述文档视图并输出。
[0013]进一步,提供一个优选实施方式,所述文本信息包括:文本内容、文本外观图像和文本布局。
[0014]进一步,提供一个优选实施方式,所述多形态文档视图分析模块抽取所述文本信息的方法为:通过OCR工具进行抽取。
[0015]进一步,提供一个优选实施方式,所述多形态文档视图分析模块还用于保存所述文本信息。
[0016]进一步,提供一个优选实施方式,所述多形态文档视图检索模块检索文本的方法为:通过语义匹配方法。
[0017]进一步,提供一个优选实施方式,所述多形态文档视图检索模块具体用于:包括:
[0018]从文本信息中检索与预设信息相关的文档集合的功能,和对文档集合中的文档视图与预设信息匹配,并按相关度排序的功能。
[0019]基于同一专利技术构思,本专利技术还提供了基于多形态文档视图的智能问答方法,所述方法包括:多形态文档视图分析步骤、多形态文档视图检索步骤和多形态文档视图问答步骤;
[0020]所述多形态文档视图分析步骤为:对文本信息进行抽取;
[0021]所述多形态文档视图检索步骤为:检索文本中与预设信息相关的文档视图并进行优先级排列;
[0022]所述多形态文档视图问答步骤为:抽取优先级较高的所述文档视图并输出。
[0023]进一步,提供一个优选实施方式,所述多形态文档视图检索步骤具体为:包括:
[0024]从文本信息中检索与预设信息相关的文档集合的步骤,和对文档集合中的文档视图与预设信息匹配,并按相关度排序的步骤。
[0025]基于同一专利技术构思,本专利技术还提供了计算机储存介质,用于储存计算机程序,当计算机的处理器处理所述储存介质中储存的计算机程序时,所述计算机执行所述的基于多形态文档视图的智能问答方法。
[0026]基于同一专利技术构思,本专利技术还提供了计算机,包括处理器和储存介质,所述储存介质用于储存计算机程序,其特征在于,当所述计算机的处理器处理所述储存介质中储存的计算机程序时,所述计算机执行所述的基于多形态文档视图的智能问答方法。
[0027]本专利技术的有益之处在于:
[0028]本专利技术提供的基于多形态文档视图的智能问答系统,通过OCR技术对不同格式的文档进行统一的预处理,提取文本和图像的布局信息,解决传统系统需要额外针对不同类型文档制定不同提取算法的局限。
[0029]适合应用于对多形态文档视图的智能问答应用中。
附图说明
[0030]图1为实施方式一提到的基于多形态文档视图的智能问答系统的系统流程示意图;
[0031]图2为实施方式四提到的基于跨模态信息交互的语义匹配模型示意图;
[0032]图3为实施方式四提到的布局结构示意图;
[0033]图4为实施方式四提到的全局注意力交互层结构示意图;
[0034]图5为实施方式十一提到的系统测试实例示意图。
具体实施方式
[0035]为使本专利技术提供的技术方案的优点和有益之处体现得更清楚,现结合附图对本专利技术提供的技术方案进行进一步详细地描述,具体的:
[0036]实施方式一、结合图1说明本实施方式,本实施方式提供了基于多形态文档视图的智能问答系统,所述系统包括:多形态文档视图分析模块、多形态文档视图检索模块和多形态文档视图问答模块;
[0037]所述多形态文档视图分析模块用于对文本信息进行抽取;
[0038]所述多形态文档视图检索模块用于检索文本中与预设信息相关的文档视图并进行优先级排列;
[0039]所述多形态文档视图问答模块用于抽取优先级较高的所述文档视图并输出。
[0040]具体的:
[0041]包括多形态文档视图分析模块,多形态文档视图检索模块以及多形态文档视图问答模块。对于用户提出的问题,多形态文档视图分析模块首先运用OCR工具对文本内容、文本外观图像、布局等信息进行抽取;然后检索模块通过文本语义匹配技术检索与问题相关的文档视图并进行优先级排序;最后问答模块会从优先级较高的文档视图中抽取答案连同文档返回给用户。具体流程如图1所示。
[0042]实施方式二、本实施方式是对实施方式一提供的基于多形态文档视图的智能问答系统的进一步限定,所述文本信息包括:文本内容、文本外观图像和文本布局。
[0043]实施方式三、本实施方式是对实施方式一或二提供的基于多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多形态文档视图的智能问答系统,其特征在于,所述系统包括:多形态文档视图分析模块、多形态文档视图检索模块和多形态文档视图问答模块;所述多形态文档视图分析模块用于对文本信息进行抽取;所述多形态文档视图检索模块用于检索文本中与预设信息相关的文档视图并进行优先级排列;所述多形态文档视图问答模块用于抽取优先级较高的所述文档视图并输出。2.根据权利要求1所述的基于多形态文档视图的智能问答系统,其特征在于,所述文本信息包括:文本内容、文本外观图像和文本布局。3.根据权利要求1或2所述的基于多形态文档视图的智能问答系统,其特征在于,所述多形态文档视图分析模块抽取所述文本信息的方法为:通过OCR工具进行抽取。4.根据权利要求3所述的基于多形态文档视图的智能问答系统,其特征在于,所述多形态文档视图分析模块还用于保存所述文本信息。5.根据权利要求1所述的基于多形态文档视图的智能问答系统,其特征在于,所述多形态文档视图检索模块检索文本的方法为:通过语义匹配方法。6.根据权利要求1所述的基于多形态文档视图的智能问答系统,其特征在于,所述多形态文档视图检索模块具体用于:包括:从文本信息中检索与预设信息相关的文档集合的功能,和对文档集合中的文档视图与预设信...

【专利技术属性】
技术研发人员:张宇张津旭刘睿珩齐乐
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1