询问应答系统及询问应答方法技术方案

技术编号:2872427 阅读:184 留言:0更新日期:2012-04-11 18:40
一种询问应答系统,它是对于用户以第一语言输入的询问应用具有此第一语言知识源的第一知识数据库和具有第二语言知识源的第二知识数据库求得应答的询问应答系统,其特征在于此系统具有:    对于上述询问,检索上述第一知识数据库,求得第一语言的应答候选的单元;    将上述询问机械翻译成第二语言的单元;    对于翻译成上述第二语言的询问,检索上述第二知识数据库,求得第二语言的应答候选的单元;    将上述第二语言的应答候选机械翻译成第一语言的单元;以及    将上述第一语言的应答候选与上述第二语言的应答候选机械翻译成第一语言的结果全都依据预定基准排序的单元。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对用户输入的询问输出应答的询问应答系统。
技术介绍
以因特网的检索引擎为代表的检索适合用户检索要求的文件并进行归类的文件检索技术正广为普及。但在文件检索中,“想阅读有关……的新闻报道”、“想查阅有关……的万维网页”之类的检索要求虽可满足,而对于“○×公司的经理是谁?”、“富士山高几许?”、“鲸鱼是否将要灭绝?”这类的询问,则不能应答。这就是说,文件检索不过是对文件或文件中的一节作出应答,用户还必须根据文件检索的输出结果,自己探索应答。作为对于输入的询问输出应答的机构已有询问应答系统。询问应答系统,例如对于“○×公司的经理是谁?”这类问题并不输出○×公司主页等有关○×公司的文件,而是输出○×公司的经理姓名的应答。此外,对于“富士山高几许”这种询问,则输出“富士山高3776m”的应答。询问应答系统例如非特许文献1Wendy G.Lehnert“TheProcess of Question Answering-A Computer Simulation ofCognition”,Lawrence Erlbaum Associates,Publishers,HillsdateNew Jersey,1978所示,过去都是作为扩展系统的一种进行研究,但近年来则作为信息检索与信息提取等研究的发展形式重新受到注意。例如接受日语询问,应用日语知识源生成应答的单语言询问应答系统,通过利用已有的信息检索技术(探索出包含特定单词的文本的技术)与信息提取技术(例如提取出人名、地名、数值等特定种类信息的技术)的组合,能够在某种程度上容易实现。但是在应用单语言知识源生成应答的单语言询问系统中存在下述问题。第一个问题是,为了制成对应于询问的应答,必要的信息量不充分,而这将关系到应答覆盖率与可靠性的降低。例如为了应答日语的询问,有时必要的信息虽于英语的万维网页上有记载但在日语的万维网页上却没有记述,因而不能在实际中应用这种英语信息,而日语单语言询问系统在构成应答时是失败的。这就是覆盖率的问题。又例如,对于“○×社の社長は誰か?”这样的询问,对于从日语知识源可以检索到“○×社の社長はA氏である”与“○×社の社長はB氏である”这样两种应答候选而从英语知识源只能检索到“The presidentof ○× Corporation is Mr.A”这样一种应答候选的情形,只能有效利用日语知识源的日语单语言询问应答系统,就不能判定应答A氏与B氏哪一个的可靠性高。但在实际中可以认为,作为综合了日语知识与英语知识的A氏的应答,其可靠性高。再有,与询问应答系统不同的技术,已知有这样的信息检索装置(例如参考特许文献1特开平11-219368号公报),它能在即使检索对象数据库的描述语言与输入关键词的描述语言不同的情形,也可对于输入的关键词获得确实的检索结果的输出。第二个问题是,为了构成对应于询问的应答,所需的信息在本质上会有偏见。例如对于“鲸鱼是否将要灭绝?”的询问,当作为知识源只利用由进行捕鲸的国家的语言所写成的万维网页上,就只能得到“鲸鱼并非将要灭绝,而是某种鲸鱼正在增殖”这样内容的应答,相反,当只把禁止捕鲸或反对捕鲸的国家语言所写成的万维网页用作知识源时,则仅仅能获得“鲸鱼由于捕鲸国的滥捕正处于灭绝中”这样的内容回答。这样,若将语言限定,就有可能将原本为多样性的观点加以限制。第三个问题是,每种语言知识源的充实度相异。由于知识源的充实度不同,在许多情形下,会对于某个特定的询问最好是利用对这种询问的应答有充实性的语言A的知识源,而对于另一特定的询问则最好不利用语言A而利用对于此询问的应答充实的语言B的知识源。例如对于有关伊丽莎白女王的询问,英语的万维网页也许是最充实的知识源,而有关相扑的询问则日语的万维网页或许是最充实的知识源。在这类情形下,不能处理此种充实度不同的单语言询问应答系统,取决于询问,应答在实质上有很大的偏离。
技术实现思路
本专利技术是在考虑到上述问题后而提出的,目的是在对于用户输入的询问输出应答的询问应答系统中,有效地利用语言不同的许多知识源,由此来提高应答的覆盖率、可靠性、多样性与稳定性。本专利技术的询问应答系统是包括对于用户以第一语言输入的询问,应用具有此第一语言知识源的第一知识数据库和具有第二语言知识源的第二知识数据库求得应答的询问应答系统,其特征在于此系统具有对于上述询问检索上述第一知识数据库求得第一语言的应答候选的单元;将上述询问机械翻译成第二语言的单元;对于翻译成上述第二语言的询问,检索上述第二知识数据库求得第二语言的应答候选的单元;将上述第二语言的应答候选机械翻译成第一语言的单元;以及将上述第一语言的应答候选与上述第二语言的应答候选机械翻译成第一语言的结果全都依据预定基准排序的单元。在上述询问应答系统的结构中,还具有基于上述排序从上述应答候选中确定其中之一应答的单元。也可以将上述第一与第二数据库中检索命中件数的多少作为上述基准。还具备有通过字句处理确定上述各个应答候选的简明性或网罗度的单元,而也可将此简明性或网罗度作为上述基准。本专利技术的询问应答方法是包括对于用户以第一语言输入的询问,应用具有此第一语言知识源的第一数据库和具有第二语言知识源的第二知识数据库求得应答的询问应答方法。其特征在于此方法具有对于上述询问检索上述第一知识数据库求得第一语言的应答候选的步骤;将上述询问机械翻译成第二语言的步骤;对于翻译成上述第二语言的询问,检查上述第二知识数据库求得第二语言的应答候选的步骤;将上述第二语言的应答候选机械翻译成第一语言的步骤;以及将上述第一语言的应答候选与上述第二语言的应答候选机械翻译成第一语言的结果全都依据预定基准排列顺序的步骤。在上述询问应答方法中,还具有基于上述顺序从上述应答候选中确定其中之一应答的步骤。也可以将上述第一与第二数据库中检索命中件数的多少作为上述基准。还具备有通过字句处理确定上述各个应答候选简明性或网罗度的步骤,而也可将此简明性或网罗度作为上述基准。本专利技术的询问应答程序是包括对于用户以第一语言输入的询问,应用具有此第一语言知识源的第一数据库和具有第二语言知识源的第二知识数据库求得应答的询问应答程序,其特征在于此程序包括对于上述询问检索上述第一知识数据库求得第一语言的应答候选的过程;将上述询问机械翻译成第二语言的过程;对于翻译成上述第二语言的询问,检查上述第二知识数据库求得第二语言的应答候选的过程;将上述第二语言的应答候选机械翻译成第一语言的过程;以及将上述第一语言的应答候选与上述第二语言的应答候选机械翻译成第一语言的结果全都依据预定基准排列顺序的过程。在上述询问应答程序中,还具有基于上述排列顺序从上述应答候选中确定其中之一应答的过程。还具备有通过字句处理确定上述各个应答候选简明性或网罗度的过程,而也可将此简明性或网罗度作为上述基准。如上所述,根据本专利技术的对于用户输入的询问而输出应答的询问应答系统,可以有效地利用语言不同的多个知识源,能够因此提高应答的覆盖率、可靠性、多样性与稳定性。附图说明图1是概示本专利技术一实施形式的询问应答系统结构的框图。图2是例示实施形式的信息提取单元中处理步骤的流程图。图3是例示实施形式的检索单元中处理步骤的流程图。图4是例示实施形式的翻译单元中处理步骤的流程图。图5本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:酒井哲也
申请(专利权)人:株式会社东芝
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利