【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及隐藏内容(content)的特定部分的内容处理技术,特别是 涉及经隐藏的事实以及被隐藏的信息不易被阅读者推测出、并且能够获得 具有与隐藏前的原信息相近的自然的信息的内容。
技术介绍
从提高业务效率和生产能力的观点来看,企业有时将业务委托给交易 户或相关公司等外部公司,即进行所谓的外包。在这种情况下,当在向交 易户委托开发业务等时,很多时候向承包方提供需求规范(requirements difmition documents)或说明书(specifications)等机密文件并请求合作开 发。在这种情况下,就委托方的企业来说, 一方面可确保人力资源以縮短 开发交货时间,但另一方面由于向公司外部提供文档和照片等机密性高的 信息(下面,也称为机密内容)而存在信息外泄的风险。因此,每当向公 司外部提供包含重要的开发信息的机密内容时,企业将采取以签保密协议 为主的各种措施。例如,作为向公司外部提供作为机密内容的机密文档时的通常的案 例,有将不想向公司外部公开的关键词替换成其它的字符串(或文字串) 以进行隐藏的方法。或者,有时采取如下方法代替向承包方提供包含企业秘密的信息的 说明书,而是获得与该说明书的数据相近的相似文档,并公开所获得的相 似文档和原来的说明书之间的差异。作为在这种情况下检索与某文档具有 相同信息或相似信息的文档的相似文档检索技术,例如有专利文件1中公 开的技术。专利文件1的专利技术公开了着眼于文本信息的相似性的相似检索技术。具体来说,专利文件1公开了以下技术当作为检索条件例示了内容的文 档时,分别对包含在例示的文档中的文本信息等的特征 ...
【技术保护点】
一种内容处理装置,其特征在于,包括: 检索单元,所述检索单元检索具有与原内容中除要隐藏的部分之外的部分的信息相似的信息的内容;以及 计算单元,所述计算单元计算非相似度,所述非相似度表示由所述检索单元获得的内容中的每一个内容与所述 原内容的要隐藏的部分之间不相似的程度。
【技术特征摘要】
【国外来华专利技术】JP 2007-4-27 119393/20071.一种内容处理装置,其特征在于,包括检索单元,所述检索单元检索具有与原内容中除要隐藏的部分之外的部分的信息相似的信息的内容;以及计算单元,所述计算单元计算非相似度,所述非相似度表示由所述检索单元获得的内容中的每一个内容与所述原内容的要隐藏的部分之间不相似的程度。2. 如权利要求1所述的内容处理装置,其特征在于,所述检索单元基于预先设定的容许的相似度来检索超过所述相似度的 内容,由此检索具有与除要隐藏的部分之外的部分的信息实质上相同的信息的内容。3. 如权利要求1或2所述的内容处理装置,其特征在于, 还包括选择单元,所述选择单元基于由所述计算单元算出的非相似度从由所述检索单元检索到的内容中选择与所述要隐藏的部分最不相似的内 容。4. 如权利要求1至3中任一项所述的内容处理装置,其特征在于, 所述内容为文档,所述计算单元计算由所述检索单元进行检索的结果而得的文档与包含 在所述要隐藏的部分中的文档之间的欧几里德距离,作为所述非相似度。5. 如权利要求1至3中任一项所述的内容处理装置,其特征在于, 所述内容处理装置具有包含单词的统计信息的计算距离用的数据库, 所述计算单元参考所述计算距离用的数据库,计算包含在由所述检索单元进行检索的结果而得的文档中的单词与包含在所述要隐藏的部分的文 档中的单词之间的各个共现频率的总和或者互信息量的总和,作为非相似 度。6. 如权利要求1至3中任一项所述的内容处理装置,其特征在于, 具有词库,该词库作为所述计算距离用的数据库,所述计算单元参考所述词库,计算包含在由所述检索单元进行检索的结果而得的相似文档中的单词与包含在所述被输入的文档中的被指定的范 围内的单词在词库上的距离的总和,作为非相似度。7. 如权利要求1至3中任一项所述的内容处理装置,其特征在于, 所述计算单元被构成为计算包含在由所述检索单元进行检索的结果而得的文档中的单词或字符串的出现频率和进行所述检索的结果而得的文档 的出现时刻中的至少一个,并基于所述计算的结果对所述非相似度进行修 正。8. 如权利要求7所述的内容处理装置,其特征在于, 在所述计算单元中对非相似度进行的修正是将算出的出现频率加到所述非相似度上的修正。9. 如权利要求7或8所述的内容处理装置,其特征在于, 在所述计算单元中对非相似度进行的修正是计算所算出的出现时刻和当前时刻的差值、并将与该差值相应的权重值加到所述非相似度上的修 正。10. 如权利要求1至9中任一项所述的内容处理装置,其特征在于, 具有用于指定被输入的文档中的要隐藏的部分的指定单元。11. 如权利要求IO所述的内容处理装置,其特征在于, 所述指定单元被构成为,在文档格式已预先定义的情况下,指定被输入到所述文档格式的预定位置的文档、单词或者词串。12. 如权利要求1至3中任一项所述的内容处理装置,其特征在于, 所述内容为图像,所述计算单元计算由所述检索单元进行检索的结果而得的图像的数据 与包含在所述要隐藏的部分中的图像数据之间的差量,作为所述非相似 度。13. —种内容处理方法,其特征在于,包括检索步骤,检索具有与原内容中除要隐藏的部分之外的部分的信息相 似的信息的内容;计算步骤,计算非相似度,所述非相似度表示通过所述检索步骤所获 得的内容中的每一个内容与所述原内容的要隐藏的部分之间不相似的程度;以及选择步骤,基于通过所述计算步骤算出的非相似度,从通过所述检索 步骤检索到的内容中选择与所述要隐藏的部分不相似的程度大的内容。14. 如权利要求13所述的内容处理方法...
【专利技术属性】
技术研发人员:花泽健,岩垂正宏,平田恭二,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。