文档处理装置制造方法及图纸

技术编号:3774374 阅读:226 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种文档处理装置。根据该文档处理装置,若通过输入部(11)输入文档,则预处理部(12)将所输入的文档分离成多个单词。重要度算出部(14)算出基于单词的频度的特征值,并基于算出的特征值来算出每一个由多个单词构成的句子的重要度。用户可以直接输入关键词,也可以通过预处理部分离的单词中选择关键词,由用户确定了关键词后,可以算出基于单词的频度以及关键词的特征值,并基于算出的特征值来算出句子的重要度。摘要生成部(15)基于所算出的重要度,并依照句子重要度从高到低的顺序选择规定数量的句子,生成所输入的文档的摘要,显示部(16)显示所生成的摘要。

【技术实现步骤摘要】

本专利技术涉及基于由多个句子构成的文档,来制作该文档的摘要并显示 的文档处理装置
技术介绍
由于网络通信技术、办公室自动化(OA)技术的发达,能够移动、 保存、阅览的信息量正在急速增加。用户在这样的环境下,必须在短时间内从大量的信息中适当地取舍 选择必要的信息,并将其保存或加工。为了选择必要的信息,利用信息的摘要是有效的。通过阅读摘要, 能够在短时间内看出信息整体的必要性。其中,为了适当地选择信息, 摘要的内容是否准确地反映了信息整体是重要的。由人来制作更为准确的、反映信息整体的摘要时,在暂且阅读了信 息的基础上,除了信息本身外,还可加上信息的要点是什么、是面向谁 的信息、是什么时候制作的信息等该信息以外的信息来制作准确的信 息。与此相对,由文档处理装置制作的摘要,即所谓自动摘要,必须仅 考虑信息本身中所包含的个别的信息来制作摘要。从而,以往以来对用于进行自动摘要的各种技术进行了各种研究。自动摘要技术基本上对文章中所含的各个句子算出重要度,并相应 于其重要度,取出规定数量的重要度高的句子、重要度高的段落等,将 取出的句子、段落的集合作为摘要。重要度的算出也有各种方法,或者 根据句本文档来自技高网...

【技术保护点】
一种文档处理装置,其特征在于, 具有: 输入部,其输入文档; 预处理部,其将由上述输入部输入的文档分离成多个单词; 重要度算出部,其算出由上述预处理部分离的单词的至少基于频度的特征值,并基于上述算出的特征值来算出每一 个由多个单词构成的句子的重要度; 摘要生成部,其基于由上述重要度算出部算出的每一个句子的重要度,并依照句子重要度从高到低的顺序来选择规定数量的句子,而生成所输入的文档的摘要; 显示部,其显示由上述摘要生成部生成的摘要; 关 键词输入部,其用于输入关键词,用户可以直接输入关键词,也可以通过预处理部分离的...

【技术特征摘要】

【专利技术属性】
技术研发人员:王婍犇乐宁朱奇许晨吴波
申请(专利权)人:夏普株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1