【技术实现步骤摘要】
文档概述装置、文档概述系统、文档概述方法及存储介质
本专利技术涉及一种文档概述装置、文档概述系统、文档概述方法以及存储介质。
技术介绍
近年来,开发了一种技术:为了缩短新闻报道的阅读时间以及整理新闻报道的信息,生成所输入的文档的概述句(专利文献1)。专利文献1中公开了一种文档概述装置,其从输入的文档中提取重要的单词和重要单词之间的关系,并基于这些单词和关系生成文档的摘要。现有技术文献专利文献专利文献1:特开平11-282881号公报(1999年10月15日公开)
技术实现思路
本专利技术所要解决的技术问题然而,专利文献1的文档概述装置存在如下问题:为了生成输入文章的准确内容的概述句,概述句容易冗长。为了解决该问题,希望配置成输出尽可能短的概述句,但概述句越短,就越有可能将与输入文章不同的事实表示为概述句。本专利技术的一个方面是鉴于上述问题而完成的,其目的是实现一种文档概述装置,所述文档概述装置对显示与输入文档的内容不同的事实这一情况进行抑制,即使是简 ...
【技术保护点】
1.文档概述装置,其特征在于,包括:/n文档获取部,其获取输入文档;/n提取部,其从所述文档获取部所获取的输入文档中提取一个或多个重要词和与该一个或多个重要词相关的一个或多个关联词;/n判断部,其参照对所述输入文档进行词素分析获得的词素列表,对由所述一个或多个重要词与所述一个或多个关联词组成的概述句判断误解风险;以及/n输出信息生成部,其当所述判断部判断所述误解风险在规定值以上时,生成与判断结果对应的信息,并输出所生成的信息。/n
【技术特征摘要】
20190425 JP 2019-0842941.文档概述装置,其特征在于,包括:
文档获取部,其获取输入文档;
提取部,其从所述文档获取部所获取的输入文档中提取一个或多个重要词和与该一个或多个重要词相关的一个或多个关联词;
判断部,其参照对所述输入文档进行词素分析获得的词素列表,对由所述一个或多个重要词与所述一个或多个关联词组成的概述句判断误解风险;以及
输出信息生成部,其当所述判断部判断所述误解风险在规定值以上时,生成与判断结果对应的信息,并输出所生成的信息。
2.根据权利要求1所述的文档概述装置,其特征在于,当所述判断部判断所述误解风险在规定值以上时,所述输出信息生成部使用对所述输入文档进行主题分析所获得的主题词与所述一个或多个重要词而生成概述句,并输出所生成的概述句。
3.根据权利要求1所述的文档概述装置,其特征在于,当所述判断部判断所述误解风险在规定值以上时,所述输出信息生成部输出表示不能从所述输入文档生成概述句的信息。
4.根据权利要求1至3中的任一项所述的文档概述装置,其特征在于,所述判断部对设有所述误解风险分数的多个类别中的每一个类别执行判断所述输入文档是否符合该类别的判断处理,并使用判断为符合的类别的总所述误解风险分数,判断所述误解风险。
5.根据权利要求4所述的文档概述装置,其特征在于,
所述多个类别中的每一类别包括多个模式,并且所述误解风险分数针对所述多个模式的各自而设定,
所述判断部针对所述多个所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。