对话系统以及用于其的计算机程序技术方案

技术编号:20596319 阅读:32 留言:0更新日期:2019-03-16 11:57
提供不管话题如何都能与用户进行自然的对话的对话系统。对话系统(30)包含:提问生成部(120),其接受来自用户的输入句(100),使用修饰被修饰关系来生成利用了输入句(100)中所含的表达的提问;回答取得部(122),其将由提问生成部(120)生成的提问输入到提问‑应答系统(104),从提问‑应答系统(104)取得针对该提问的回答;和发声生成部(124),其基于回答取得部(122)取得的回答来生成正对输入句(100)的输出句(106)。

Dialogue systems and computer programs for them

Provides a natural dialogue system with users regardless of the topic. The dialog system (30) includes: a question generation unit (120), which receives input sentences (100) from users, generates questions using the expressions contained in the input sentence (100) by modifying the modified relationship, and an answer acquisition unit (122), which inputs the questions generated by the question generation unit (120) into the question answering system (104), and obtains the answers to the questions from the question answering system (104); The voice generating unit (124) generates an output sentence (106) of a positive input sentence (100) based on the answer obtained by the answer acquisition unit (122).

【技术实现步骤摘要】
【国外来华专利技术】对话系统以及用于其的计算机程序
本专利技术涉及在与用户之间进行对话的对话系统,特别涉及能进行自然的对话的对话系统。
技术介绍
关于计算机与用户进行对话的系统,到目前为止进行过许多尝试。最简单的是预先准备决定了对话的规则的脚本,计算机按照该脚本进行发声。在脚本中包含被任意的单词置换的变量,通过对用户的发声进行声音识别,来从那里提取某些单词来置换该变量,从而进行应答。如稍后会知道的那样,这样的对话系统由于脚本的数量受到限制,因此应答的模式(pattern)也受到制约。由于对话中会产生的情况的数量是无限的,因此不能在这样的系统中进行自然的对话。另外,还有对众多对话数据中的句的修饰被修饰关系进行解析,利用其结果的方案。例如对某句进行解析的结果,从“由于今天买了游戏机,因此玩MARCOCARGO”(“MARCOCARGO”设为游戏的名字)这句提取“(今天)买了游戏机”和“玩MARCOCARGO”的组合,作为模式存储。对话时,若在用户发声中出现“今天买了游戏机”这样的表达,就提取与该表达建立对应的“玩MARCOCARGO”这样的表达,进行词尾变换,例如生成“能打MARCOCARGO呢”这样的系统发声。进一步,在其他的解决方案中,从用户的发声提取关键词,进行关键词检索并将其结果用在系统发声的生成中。例如若用户发声“今天买游戏机”,则以“游戏机”和“买”为关键词对WEB进行检索,收集多个文书,提取其中与关键词接近地出现的单词(例如“MARCOCARGO”)。将单词嵌套在预先准备的模板来生成系统发声。但这些都有不能正确理解用户发声或WEB上的句的修饰被修饰的意义上的关系(原因、结果、并列等)的问题。由此,有时会生成不合适的系统发声。例如以“去秋叶原卖游戏机,吃拉面。”这样的发声为例。从发声提取“买游戏机”这样的表达和“吃拉面”这样的表达,将两者姑且建立关系。但对话时,若针对“今天买游戏机”这样的用户发声仅基于该关系生成“能吃拉面了”这样的系统发声,通常就不能理解,不能维持自然的对话。在使用关键词检索的情况下,由于检索结果的文书所包含的单词的词汇过多,因此在检索结果中不需要的信息多,难以提取本来想要的信息。另外,由于利用基于用户发声中所含的关键词的检索结果,因此不能控制系统侧的发声意图(例如是否希望给用户提供信息,是否希望说出感想,是否希望共鸣等)。在后述的专利文献1中给出了用于解决这样的问题的提案。专利文献1记载的声音对话系统包含:声音识别装置,其识别用户的发声;意图理解部,其为了理解该发声的意图,理解希望知道特定的领域中的怎样的信息,使用预先学习完毕的意图理解模型以及问题解决知识来理解发声的意图;和对话管理部,其为了生成与该意图对应的应答句,从信息源取得用于应答的信息。在专利文献1中,作为该信息源而能举出因特网上的特定的WEB网站和保存了与各种电影相关的人们的感想的感想数据库,并对应于发声者的意图而选择任意一方。例如若用户的发声是希望知道电影的导演,就在WEB网站上检索该电影的导演。若用户的发声是希望知道电影的感想,就检索感想数据库来取出与该电影相关的他人的感想。专利文献1记载的声音对话系统进一步包含记述了在被输入各种意图时应进行怎样的交互的对话的流程的对话剧本。该系统进一步包含:使用对话管理部从信息源取得的信息生成针对发声者的发声的应答句的应答句生成部;将应答句生成部生成的应答句进行声音合成来生成声音信号的声音合成部;和将该声音信号变换成声音的扬声器。现有技术文献专利文献专利文献1:JP特开2016-99381号公报(图2)
技术实现思路
专利技术要解决的课题上述的专利文献1记载的系统虽然从大的范围收集针对用户的回答,但其范围被限定在特定的领域(例如电影)。而且,在对方的发声是提问且能容易地判定其意图的情况下,虽然有能生成有意义的应答的可能性,但在并非这样的情况下,有完全无法预测怎样进行了应答的问题。本来,用户只能发出提问的对话就很难说是自然的对话。为此在该系统中不能与用户进行自然的对话。因此,本专利技术的目的在于,提供不管发声的话题如何都能基于用户的发声与用户进行自然的对话的对话系统。用于解决课题的手段本专利技术的第1方面所涉及的对话系统包含:包含:参数生成单元,其接受来自用户的输入发声,使用该输入发声中所含的表达来生成用于利用提问-应答系统的参数;回答取得单元,其将由参数生成单元生成的参数输入到提问-应答系统,取得针对该参数的回答;和应答生成单元,其基于回答取得单元取得的回答来生成针对输入发声的应答。优选地,参数生成单元包含:发声解析单元,其对输入发声进行词素解析以及句法解析;主题估计单元,其根据由发声解析单元解析的结果来估计输入发声的主题;和仿真陈述型提问生成单元,其基于由主题估计单元估计的主题来生成包含构成该主题的部分表达的仿真陈述型提问。更优选地,参数生成单元包含:部分表达确定单元,其根据由发声解析单元解析的结果来确定代表输入发声的部分表达;和非仿真陈述型提问生成单元,其基于由部分表达确定单元确定的部分表达来生成非仿真陈述型提问。进一步优选地,可以,应答生成单元包含:发声候补生成单元,其通过对回答运用预先准备的发声生成规则来生成发声候补;和发声整形单元,其对发声候补按照预先准备的发声整形规则进行整形,来生成针对输入发声的应答。进一步优选地,提问-应答系统针对1个参数输出多个回答,应答生成单元包含:发声候补生成单元,其通过对多个回答各自运用预先准备的发声生成规则来生成多个发声候补;和发声整形单元,其选择多个发声候补的任一者,按照预先准备的发声整形规则进行整形,来生成针对输入发声的应答。应答生成单元可以包含:发声生成模型,其预先进行了学习,使得若被提供针对提问的回答,则从该回答来生成发声;和发声整形单元,其按照预先准备的发声整形规则对发声生成模型生成的发声进行整形,来生成针对输入发声的应答。提问-应答系统可以针对1个参数输出多个回答,应答生成单元包含:发声生成模型,其预先进行了学习,使得若被提供针对提问的回答,则从该回答来生成发声;和发声整形单元,其选择发声生成模型针对多个回答各自生成的发声的任一者,按照预先准备的发声整形规则进行整形,来生成针对输入发声的应答。本专利技术的第2方面所涉及的计算机程序使计算机作为上述的任意的对话系统发挥功能。附图说明图1是表示本专利技术的第1实施方式所涉及的对话系统的整体结构的框图。图2是表示第1实施方式所涉及的对话系统的输入句-应答句对收集部的概略结构的框图。图3是表示第1实施方式所涉及的对话系统的什么型提问/对话学习文集构建部的概略结构的框图。图4是表示第1实施方式所涉及的对话系统的模式比对部的概略结构的框图。图5是表示第1实施方式所涉及的对话系统的为什么型提问/对话学习文集构建部的概略结构的框图。图6是表示第1实施方式所涉及的对话系统的提问生成部的概略结构的框图。图7是表示第1实施方式所涉及的对话系统的发声生成部的概略结构的框图。图8是表示第2实施方式所涉及的对话系统的提问生成部的概略结构的框图。图9是表示第2实施方式所涉及的对话系统的发声生成部的概略结构的框图。图10是表示第3实施方式所涉及的对话系统的发声生成部的概略结构的框图。图11是表示第4实施方式所涉及的对话系统的整体结构的框本文档来自技高网
...

【技术保护点】
1.一种对话系统,其特征在于,包含:参数生成单元,其接受来自用户的输入发声,使用该输入发声中所含的表达来生成用于利用提问‑应答系统的参数;回答取得单元,其将由所述参数生成单元生成的参数输入到所述提问‑应答系统,取得针对该参数的回答;和应答生成单元,其基于所述回答取得单元取得的回答来生成针对所述输入发声的应答。

【技术特征摘要】
【国外来华专利技术】2016.08.16 JP 2016-1595051.一种对话系统,其特征在于,包含:参数生成单元,其接受来自用户的输入发声,使用该输入发声中所含的表达来生成用于利用提问-应答系统的参数;回答取得单元,其将由所述参数生成单元生成的参数输入到所述提问-应答系统,取得针对该参数的回答;和应答生成单元,其基于所述回答取得单元取得的回答来生成针对所述输入发声的应答。2.根据权利要求1所述的对话系统,其特征在于,所述参数生成单元包含:发声解析单元,其对所述输入发声进行词素解析以及句法解析;主题估计单元,其根据由所述发声解析单元解析的结果来估计所述输入发声的主题;和仿真陈述型提问生成单元,其基于由所述主题估计单元估计的主题来生成包含构成该主题的部分表达的仿真陈述型提问。3.根据权利要求1所述的对话系统,其特征在于,所述参数生成单元包含:部分表达确...

【专利技术属性】
技术研发人员:阿部宪幸大西可奈子鸟泽健太郎卡纳萨·库恩卡莱吴钟勋饭田龙木俵丰
申请(专利权)人:国立研究开发法人情报通信研究机构
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1