语言存储方法和语言对话系统技术方案

技术编号：18350404 阅读：29 留言：0更新日期：2018-07-01 23:36

本发明专利技术涉及一种语言存储方法和语言对话系统。根据本发明专利技术的一方面的语言存储方法包括：向量化步骤，用于使用针对每个词预先创建的词向量来对累积在对话日志数据库中的语言进行向量化；确定步骤，用于确定是否采用已被向量化的语言作为响应数据；以及存储步骤，用于将已被确定为要被采用作为响应数据的语言累积在响应数据库中，其中，用于降低在向量化步骤中被向量化的语言的向量维数的维度降低步骤被包括在向量化步骤与确定步骤之间，并且在确定步骤中，确定在维度降低步骤中已被降低维度的语言的向量属于采用组与未采用组中的哪一个。

全部详细技术资料下载

【技术实现步骤摘要】
语言存储方法和语言对话系统
本专利技术涉及语言存储方法和语言对话系统，并且涉及例如在交互式机器人中执行的语言存储方法和使用该方法的语言对话系统。
技术介绍
近些年，已经提出了许多交互式机器人。交互式机器人响应于讲话者的(例如，用户的)讲出语言而输出语言。交互式机器人从存储在数据库中的语言中选择要被用于该响应的语言。因此，为了改善交互式机器人的交互能力，需要增加被存储的响应语言的数量。在日本未审查专利申请公布第2003-248497号中公开了存储语言的方法的一个示例。日本未审查专利申请公布第2003-248497号公开了：当讲话者说出未被登记在识别字典中的语言时，通过讲话单元询问该语言属于哪个语义属性(例如，汽车、运动或食物)，并且将未登记在识别字典中的语言的语音数据与识别已经获得的语义属性的结果相关联地登记在语音数据字典中。在语音数据字典中登记上述语言之后，当讲话者说出未被登记在识别字典中的语言时，系统在语音数据字典中搜索与由讲话者讲出的未被登记在识别字典中的语言相同的语音数据，并且当该语言存在于语音数据字典中时，通过用已经获得的语义属性替换该语音数据来继续对话。
技术实现思路
在对话中，讲话者的讲出语言不会总是适合用于响应的语言。换言之，在交互式机器人中，机器人应当记住的语言需要被适当地选择以改善交互能力。然而，在日本未审查专利申请公布第2003-248497号中公开的技术中，不可能确定讲话者的讲出语言不应当被采用作为要被存储在响应数据库中的语言。可以通过对从讲话者获得的语言进行向量化并且对该向量执行处理以确定是否采用从讲话者获得的语言来选择机器人应当记住的...
语言存储方法和语言对话系统

【技术保护点】
1.一种语言存储方法，其将讲话者的讲出语言累积在对话日志数据库中并且通过计算来确定是否采用累积在所述对话日志数据库中的语言作为响应数据库中的响应数据，所述响应数据库存储要被用于对所述讲话者的讲出语言进行响应的语言，所述方法包括：对话日志累积步骤，用于将所述讲话者的讲出语言累积在所述对话日志数据库中；向量化步骤，用于使用针对每个词预先创建的词向量来对累积在所述对话日志数据库中的语言进行向量化；确定步骤，用于确定是否采用已被向量化的语言作为所述响应数据；以及存储步骤，用于将已被确定为要被采用作为所述响应数据的语言累积在所述响应数据库中，其中，用于降低在所述向量化步骤中被向量化的语言的向量维数的维度降低步骤被包括在所述向量化步骤与所述确定步骤之间，在所述确定步骤中，确定在所述维度降低步骤中已被降低维数的语言的向量属于采用组与未采用组中的哪一个，并且在所述存储步骤中，已被确定为属于所述采用组的语言被累积在所述响应数据库中。

【技术特征摘要】
2016.12.14 JP 2016-2422971.一种语言存储方法，其将讲话者的讲出语言累积在对话日志数据库中并且通过计算来确定是否采用累积在所述对话日志数据库中的语言作为响应数据库中的响应数据，所述响应数据库存储要被用于对所述讲话者的讲出语言进行响应的语言，所述方法包括：对话日志累积步骤，用于将所述讲话者的讲出语言累积在所述对话日志数据库中；向量化步骤，用于使用针对每个词预先创建的词向量来对累积在所述对话日志数据库中的语言进行向量化；确定步骤，用于确定是否采用已被向量化的语言作为所述响应数据；以及存储步骤，用于将已被确定为要被采用作为所述响应数据的语言累积在所述响应数据库中，其中，用于降低在所述向量化步骤中被向量化的语言的向量维数的维度降低步骤被包括在所述向量化步骤与所述确定步骤之间，在所述确定步骤中，确定在所述维度降低步骤中已被降低维数的语言的向量属于采用组与未采用组中的哪一个，并且在所述存储步骤中，已被确定为属于所述采用组的语言被累积在所述响应数据库中。2.根据权利要求1所述的语言存储方法，其中，在所述维度降低步骤中，在保持所述向量化步骤中被向量化的语言的向量的全局结构和局部结构的状态下，降低所述语言的向量维数。3.根据权利要求1或2所述的语言存储方法，其中，在所述维度降低步骤中，使用t分布随机相邻嵌入(t-SNE)、随机相邻嵌入(SNE)和主成分分析中之一来降低所述语言的向量维数。4.根据权利要求1至3中任一项所述的语言存...

【专利技术属性】
技术研发人员：山口亨，下川原英理，平田和晖，高谷智哉，
申请(专利权)人：公立大学法人首都大学东京，丰田自动车株式会社，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人