使用自然语言处理的文档标记和导航制造技术

技术编号:33720159 阅读:33 留言:0更新日期:2022-06-08 21:11
一种方法,包括获得文本文档,通过第一自然语言处理(NLP)模型生成文本文档的第一标记,并且显示文本文档和第一标记。所述方法还包括接收与第一标记的一部分的用户交互。文本文档的第一标记的所述部分可以与文本文档的一部分相关联。所述方法还包括,基于与第一标记的所述部分的用户交互,选择第二NLP模型,通过第二NLP模型来处理文本文档的所述部分,其中第二NLP模型与第一NLP模型不同。所述方法还包括基于选择第二NLP模型,通过由第二NLP模型处理文本文档的至少所述部分来生成文本文档的第二标记,并且显示文本文档和第二标记。并且显示文本文档和第二标记。并且显示文本文档和第二标记。

【技术实现步骤摘要】
【国外来华专利技术】使用自然语言处理的文档标记和导航

技术介绍

[0001]自然语言处理(NLP)算法允许计算设备分析自然语言数据,诸如书写的文本或说出的词。NLP算法可以采取基于规则的算法、统计算法和/或机器学习算法的形式。例如,各种人工神经网络架构可以被训练以执行NLP任务。NLP任务的示例包括文档解析、确定词、短语、句子或段落的语义表示、情感分析和文本的机器翻译等。

技术实现思路

[0002]自然语言处理(NLP)模型/算法可以被用于改进文本文档的方面的导航和有效表示两者。具体地,第一NLP模型可以生成表示文本文档的方面的第一标记。与第一标记的部分的交互可以表明读者对文本文档的相应部分或方面感兴趣。基于所述交互,第二NLP模型可以被用于生成指向文本文档的相应部分或方面的第二标记。因此,与文本文档的用户交互可以驱动用于处理文本文档的NLP模型的序列,从而生成为特定用户定制的标记序列,这与例如使用一个NLP模型以通用方式处理文本文档而不考虑用户交互——其中可能需要大量的计算处理资源——相反。
[0003]在第一示例实施例中,一种方法可以包括获得文本文档,通过由第一本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:获取文本文档;通过由第一自然语言处理(NLP)模型处理文本文档来生成文本文档的第一标记;通过用户接口显示文本文档和文本文档的第一标记;接收与文本文档的第一标记的一部分的用户交互,其中,文本文档的第一标记的所述部分与文本文档的一部分相关联;基于与文本文档的第一标记的一部分的用户交互,选择第二NLP模型,通过第二NLP模型来处理文本文档的所述部分,其中,第二NLP模型与第一NLP模型不同;基于选择第二NLP模型,通过由第二NLP模型处理文本文档的至少所述部分来生成文本文档的第二标记;以及通过用户接口显示文本文档和文本文档的第二标记。2.根据权利要求1所述的计算机实现的方法,其中:生成文本文档的第一标记包括通过由第一多个NLP模型处理文本文档来生成文本文档的第一多个标记,第一多个NLP模型包括第一NLP模型,第一多个标记包括第一标记,显示文本文档和文本文档的第一标记包括显示文本文档和文本文档的第一多个标记,接收与文本文档的第一标记的一部分的用户交互包括接收从第一多个标记中对第一标记的一部分的选择,选择第二NLP模型包括基于从第一多个标记中选择第一标记的一部分,从第二多个NLP模型中选择第二NLP模型,并且第二多个NLP模型中的每个相应NLP模型与第一多个标记的对应标记相关联。3.根据权利要求1

2中任一项所述的计算机实现的方法,其中:第一NLP模型包括摘要生成模型,第二NLP模型包括摘要映射模型,生成文本文档的第一标记包括由摘要生成模型生成提供文本文档的相应部分的摘要的一个或多个词的多个集合,与文本文档的第一标记的一部分的用户交互包括选择多个集合中的特定集合,生成文本文档的第二标记包括由摘要映射模型识别由特定集合概括的文本文档的部分,并且显示文本文档和文本文档的第二标记包括在文本文档内显示由特定集合概括的文本文档的一部分的视觉指示。4.根据权利要求1

2中任一项所述的计算机实现的方法,其中:第一NLP模型包括粗略摘要模型,第二NLP模型包括精细摘要模型,生成文本文档的第一标记包括由粗略摘要模型生成提供文本文档的相应部分的摘要的一个或多个词的多个集合,与文本文档的第一标记的一部分的用户交互包括选择多个集合中的特定集合,所述特定集合提供文本文档的所述部分的摘要,
生成文本文档的第二标记包括由精细摘要模型生成一个或多个词的一个或多个附加集合,所述集合提供文本文档的所述部分的相应子章节的摘要,以及显示文本文档和文本文档的第二标记包括显示一个或多个附加集合。5.根据权利要求1

2中任一项所述的计算机实现的方法,其中:第一NLP模型包括命名实体识别模型,第二NLP模型包括共指消解模型,生成文本文档的第一标记包括由命名实体识别模型生成文本文档中存在的多个实体,与文本文档的第一标记的一部分的用户交互包括选择多个实体中的特定实体,生成文本文档的第二标记包括由共指消解模型识别文本文档中与特定实体语义相关的一个或多个附加实体,文本文档的所述部分包括一个或多个附加实体,并且显示文本文档和文本文档的第二标记包括在文本文档内显示特定实体和一个或多个附加实体的视觉指示。6.根据权利要求1

2中任一项所述的计算机实现的方法,其中:第一NLP模型包括粗略文本分类模型,第二NLP模型包括精细文本分类模型,生成文本文档的第一标记包括由粗略文本分类模型生成文本文档中存在的多个文本类别,与文本文档的第一标记的一部分的用户交互包括选择多个文本类别中的特定类别,生成文本文档的第二标记包括由精细文本分类模型识别文本文档中与特定类别相关联的一个或多个句子,文本文档的所述部分包括一个或多个句子,并且显示文本文档和文本文档的第二标记包括在文本文档内显示一个或多个句子的视觉指示。7.根据权利要求1

2中任一项所述的计算机实现的方法,其中:第一NLP模型包括文本分类模型,第二NLP模型包括文本蕴含模型,生成文本文档的第一标记包括由文本分类模型生成文本文档中存在的文本的多个蕴含类别,与文本文档的第一标记的一部分的用户交互包括选择多个蕴含类别中的特定蕴含类...

【专利技术属性】
技术研发人员:A纳拉亚南L石
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1