【技术实现步骤摘要】
本专利技术涉及基于由多个句子构成的文档,来制作该文档的摘要并显示 的文档处理装置。
技术介绍
由于网络通信技术、办公室自动化(OA)技术的发达,能够移动、 保存、阅览的信息量正在急速增加。用户在这样的环境下,必须在短时间内从大量的信息中适当地取舍 选择必要的信息,并将其保存或加工。为了选择必要的信息,利用信息的摘要是有效的。通过阅读摘要, 能够在短时间内看出信息整体的必要性。其中,为了适当地选择信息, 摘要的内容是否准确地反映了信息整体是重要的。由人来制作更为准确的、反映信息整体的摘要时,在暂且阅读了信 息的基础上,除了信息本身外,还可加上信息的要点是什么、是面向谁 的信息、是什么时候制作的信息等该信息以外的信息来制作准确的信 息。与此相对,由文档处理装置制作的摘要,即所谓自动摘要,必须仅 考虑信息本身中所包含的个别的信息来制作摘要。从而,以往以来对用于进行自动摘要的各种技术进行了各种研究。自动摘要技术基本上对文章中所含的各个句子算出重要度,并相应 于其重要度,取出规定数量的重要度高的句子、重要度高的段落等,将 取出的句子、段落的集合作为摘要。重要度的算出也有各 ...
【技术保护点】
一种文档处理装置,其特征在于, 具有: 输入部,其输入文档; 预处理部,其将由上述输入部输入的文档分离成多个单词; 重要度算出部,其算出由上述预处理部分离的单词的至少基于频度的特征值,并基于上述算出的特征值来算出每一 个由多个单词构成的句子的重要度; 摘要生成部,其基于由上述重要度算出部算出的每一个句子的重要度,并依照句子重要度从高到低的顺序来选择规定数量的句子,而生成所输入的文档的摘要; 显示部,其显示由上述摘要生成部生成的摘要; 关 键词输入部,其用于输入关键词,用户可以直接输入关键词,也可 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:王婍犇,乐宁,朱奇,许晨,吴波,
申请(专利权)人:夏普株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。