一种k-means自学习系统技术方案

技术编号：24121639 阅读：101 留言：0更新日期：2020-05-13 03:15

本发明专利技术涉及一种k‑means自学习系统，包括如下步骤：S1：记录语音质料，将语音识别的内容用json的形式储存下来，并且按照要求标注一些标签；S2：对数据进行清洗，把每个中文句子进行一次清洗，去掉噪音；S3：把规定格式的语料放入kmeans的模型，进行迭代训练；S4：根据Calinski‑Harabasz分数来确定k值；S5：根据每个簇的质心，获得最靠近质心的句子；S6：将句子保存为csv模式的文档输出发送到运维人员的邮箱；S7：运维人员按照要求填写答案之后上传；S8：把规定格式的新内容通过训练添加到机器人的知识库。该发明专利技术中通过kmeans的模型，进行迭代训练另外根据Calinski‑Harabasz分数来确定k值，能够快速找到一堆中文文本中的最核心内容并提取输出，提高工作效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种k-means自学习系统
本专利技术涉及人工智能
，具体为一种k-means自学习系统。
技术介绍
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学，而自学习系统也是人工智能的一部分。现有的自学习系统在使用时不能快速的找出最核心内容并提取输出，也不能为交互机器人快速增加知识库，鉴于现有的自学习系统中的缺陷，有必要将其进行改进，来完善此项装置，为工作人员提供更大的便利。
技术实现思路
本专利技术的目的在于提供一种k-means自学习系统，以解决上述
技术介绍
提出的唤醒词是众多语音公司提供的交互流程入口，通过开发者提供的唤醒词，语音公司对唤醒词的声学特征打包编译，预置到开发者的系统中，但这种方式开发的设备并不能称之为智能，相对而言太过于机械化，并且对于一个刚入门的用户，如果不知道唤醒词，则整个交互都无从谈起，极大的限制用户体验的问题。为实现上述目的，本专利技术提供如下技术方案：一种k-means自学习系统，包括如下步骤：S1：记录语音质料，将语音识别的内容用json的形式储存下来，并且按照要求标注一些标签；S2：对数据进行清洗，把每个中文句子进行一次清洗，去掉噪音；S3：把规定格式的语料放入kmeans的模型，进行迭代训练；S4：根据Calinski-Harabasz分数来确定k值；S5：根据每个簇的质心，获得最靠近质心的句子；S6：将句子保存为csv模式的文档输出发送到运维人员的邮箱...

【技术保护点】
1.一种k-means自学习系统，其特征在于：包括如下步骤：/nS1：记录语音质料，将语音识别的内容用json的形式储存下来，并且按照要求标注一些标签；/nS2：对数据进行清洗，把每个中文句子进行一次清洗，去掉噪音；/nS3：把规定格式的语料放入kmeans的模型，进行迭代训练；/nS4：根据Calinski-Harabasz分数来确定k值；/nS5：根据每个簇的质心，获得最靠近质心的句子；/nS6：将句子保存为csv模式的文档输出发送到运维人员的邮箱；/nS7：运维人员按照要求填写答案之后上传；/nS8：把规定格式的新内容通过训练添加到机器人的知识库。/n

【技术特征摘要】
1.一种k-means自学习系统，其特征在于：包括如下步骤：
S1：记录语音质料，将语音识别的内容用json的形式储存下来，并且按照要求标注一些标签；
S2：对数据进行清洗，把每个中文句子进行一次清洗，去掉噪音；
S3：把规定格式的语料放入kmeans的模型，进行迭代训练；
S4：根据Calinski-Harabasz分数来确定k值；
S5：根据每个簇的质心，获得最靠近质心的句子；
S6：将句子保存为csv模式的文档输出发送到运维人员的...

【专利技术属性】
技术研发人员：王琦，
申请(专利权)人：杭州睿沃科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人