【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及从大量的文本中提取矛盾的表现的装置,特别涉及从大量的文本中可靠性高地提取相互矛盾的表现的配对的装置。
技术介绍
若能在文本中检测矛盾的表现,就能将其结果使用在众多的目的中。例如,若能在庞大的文本中检测相互矛盾的表现,就能通过对它们做记号来唤起文本的作成者的注意。在对他人作成的文本进行审查的情况下,能验证其逻辑的一贯性。在比较不同的作者作成的文本的情况下,能确认其主张的异同。例如在日语记载的Web页经常能看到「アガリクスがガンを防ぐ(落叶松蕈防癌)」这样主旨的记载。这样的主张也被众多日本人所接受。但若用例如「アガリクスガン促進する(落叶松蕈癌症促进)」这样的关键词检索Web,则能找到「アガリクスによリラツトのガンが促進する(因落叶松蕈而促进小白鼠癌症)」这样的报告。该报告参考了销售的一部分落叶松蕈制品促进小白鼠的癌这样由厚生劳动省承认报告。根据这样的报导可知,存在与落叶松蕈防止癌症这样的主张矛盾的报告,其结果,对落叶松蕈怀有兴趣的人会进一步展开调查。另外,在灾害的发生时,在网络上的所谓的博客、微博客、社交媒体等涌来大量信息。这些信息在进行合适的避难、适时进行支援上非常有用。但在它们当中,包括较多没有根据的信息、以及所谓的捏造信息。这些信息看上去难以与真实的信息区别。为此,不仅在进行正确的判断上无益,还会妨碍正常的信息流通,有增大灾害引起的损失、或使推迟恢复的危险性。若能 ...
【技术保护点】
一种矛盾表现收集装置,与存储单词的包含关系的包含关系存储单元、和存储多个二元型式对的第1存储装置连接来使用,二元型式对含有2个二元型式,各二元型式含有一元型式作为副型式,所述矛盾表现收集装置包括:第1分类单元,其通过以从存储于所述第1存储装置的二元型式对选出的二元型式对作为学习数据的机器学习,来从存储于所述第1存储装置的多个所述二元型式对提取相互矛盾的二元型式对;导出单元,其对由所述第1分类单元提取的各个二元型式对,运用存储于所述包含关系存储单元的包含关系来改写一方的二元型式,从而导出新的二元型式对;学习数据扩展单元,其提取在由所述导出单元导出的新的二元型式对中由相互矛盾的二元型式构成的可能性高的二元型式对,通过追加到所述学习数据中来扩展所述学习数据;和第2分类单元,其通过利用了由所述学习数据扩展单元扩展过的学习数据的机器学习,将被赋予的二元型式对分类为相互矛盾的二元型式对和其他的二元型式对。
【技术特征摘要】
【国外来华专利技术】2013.10.08 JP 2013-2107931.一种矛盾表现收集装置,与存储单词的包含关系的包含关系存储
单元、和存储多个二元型式对的第1存储装置连接来使用,
二元型式对含有2个二元型式,各二元型式含有一元型式作为副型式,
所述矛盾表现收集装置包括:
第1分类单元,其通过以从存储于所述第1存储装置的二元型式对选
出的二元型式对作为学习数据的机器学习,来从存储于所述第1存储装置
的多个所述二元型式对提取相互矛盾的二元型式对;
导出单元,其对由所述第1分类单元提取的各个二元型式对,运用存
储于所述包含关系存储单元的包含关系来改写一方的二元型式,从而导出
新的二元型式对;
学习数据扩展单元,其提取在由所述导出单元导出的新的二元型式对
中由相互矛盾的二元型式构成的可能性高的二元型式对,通过追加到所述
学习数据中来扩展所述学习数据;和
第2分类单元,其通过利用了由所述学习数据扩展单元扩展过的学习
数据的机器学习,将被赋予的二元型式对分类为相互矛盾的二元型式对和
其他的二元型式对。
2.根据权利要求1所述的矛盾表现收集装置,其中,
所述矛盾表现收集装置还与存储一元型式的极性的极性存储单元连
接而使用,
所述第1分类单元包括:
第1型式对提取单元,其使用存储于所述极性存储单元的一元型式的
极性,来从所述第1存储装置提取含有极性相互相反的一元型式对的二元
型式对;和
机器学习单元,其将附加了表示是否由相互矛盾的二元型式构成的签
注的多个二元型式对作为学习数据,通过机器学习来学习选择由相互矛盾
的二元型式构成的二元型式对的功能,从存储于所述第1存储装置的所述
多个二元型式对选择由相互矛盾的二元型式构成的二元型式对,并输出。
3.根据权利要求2所述的矛盾表现收集装置,其中,
所述第1分类单元对输出的二元型式对附加表示该二元型式对是否由
相互矛盾的二元型式构成的可能性的分数,并输出,
所述学习数据扩展单元包括:
分数算出单元,其关于由所述第1分类单...
【专利技术属性】
技术研发人员:朱利安·克洛埃特泽,鸟泽健太郎,桥本力,佐野大树,吴钟勋,大竹清敬,
申请(专利权)人:国立研究开发法人情报通信研究机构,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。