用户数据的统计方法及装置制造方法及图纸

技术编号:21547677 阅读:27 留言:0更新日期:2019-07-06 21:19
本发明专利技术属于数据分析技术领域,尤其涉及用户数据的统计方法及装置,通过接收用户输入的控制指令,从控制指令中提取出关键词,并将预设单位时间内的所有关键词写入一个日志文件;基于所述日志文件内各个所述关键词的出现次数,生成日志统计文件;基于多个所述日志统计文件中的关键词与出现次数的对应关系,计算各个关键词的出现总次数,以对控制指令中的关键词进行计算,从而充分分析控制指令,为后续的用户行为的分析提供充足的数据支持。

Statistical Method and Device of User Data

【技术实现步骤摘要】
用户数据的统计方法及装置
本专利技术属于数据分析
,尤其涉及用户数据的统计方法及装置。
技术介绍
在现实生活中,为了控制终端设备,用户往往通过各种方式为终端设备下达控制指令,这些控制指令中可能暗含着用户行为习惯以及兴趣爱好的信息。另一方面,用户的行为习惯以及兴趣爱好对商家而言是非常重要的数据,如果一个商家可以准确地把握用户的行为习惯以及兴趣爱好,则可以针对性地为用户推荐用户可能喜欢的产品,或者预先做出一系列操作,从而提高用户感受。当前,对于控制指令的利用率比较低,终端设备往往只是根据控制指令做出相关的操作,而缺乏对于控制指令更深层次的数据分析。
技术实现思路
有鉴于此,本专利技术实施例提供了用户数据的统计方法及装置,以解决现有技术中对于控制指令的利用率较低的问题。本专利技术实施例的第一方面提供了一种用户数据的统计方法,包括:接收用户输入的控制指令;从所述控制指令中提取出关键词,并将预设单位时间内的所有关键词写入一个日志文件;计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件。本专利技术实施例的第二方面提供了一种用户数据的统计装置,包括:接收模块,用于接收用户输入的控制指令;提取模块,用于从所述控制指令中提取出关键词,并将预设单位时间内的所有关键词写入一个日志文件;第一计算模块,用于计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件。本专利技术实施例的第三方面提供了一种用户数据的统计终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如下用户数据的统计方法的步骤:接收用户输入的控制指令;从所述控制指令中提取出关键词,并将预设单位时间内的所有关键词写入一个日志文件;计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件。所述用户数据的统计方法还包括:基于多个所述日志统计文件中的关键词与出现次数的对应关系,计算各个关键词的出现总次数。所述从所述控制指令中提取出关键词,包括:若所述控制指令为按键指令,则根据预设的按键指令与关键词的对应关系,确定所述控制指令对应的关键词;若所述控制指令为字符指令,则首先将所述字符指令拆分为一个以上的指令词语,并基于预设的词组数据库,计算所述指令词语在所述词组数据库中的出现频率,将所述出现频率大于预设频率阈值的指令词语作为所述字符指令对应的关键词;若所述控制指令为语音指令,则首先识别出所述语音指令对应的文字,将所述语音指令对应的文字拆分为一个以上的指令词语,并基于预设的词组数据库,计算所述指令词语在所述词组数据库中的出现频率,将所述出现频率大于预设频率阈值的指令词语作为所述语音指令对应的关键词。所述计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件,包括:从所述日志文件内逐一选取关键词作为特定关键词;判断所述特定关键词是否已经存在于所述日志统计文件中;若所述特定关键词不存在于所述日志统计文件中,则将所述特定关键词写入所述日志统计文件中,并将所述特定关键词对应的出现次数记为1;若所述特定关键词已存在于所述日志统计文件中,则将所述特定关键词对应的出现次数增加1次,并返回执行所述从所述日志文件内逐一选取关键词作为特定关键词,判断所述特定关键词是否已经存在于所述日志统计文件中的操作。所述基于多个所述日志统计文件中的关键词与出现次数的对应关系,计算各个关键词的出现总次数,包括:选取预设数量的所述日志统计文件,生成候选日志统计文件集合;从所述候选日志统计文件集合中,提取出全部关键词与出现次数的对应关系;计算相同的关键词的出现次数之和,作为该关键词的出现总次数。所述用户数据的统计方法,还包括:将所述关键词与出现总次数的对应关系,根据所述出现总次数由大到小排列,并生成.csv格式的关键词累计统计文件。本专利技术实施例的第四方面提供了一种用户数据的统计终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如下用户数据的统计方法的步骤:接收用户输入的控制指令;从所述控制指令中提取出关键词,并将预设单位时间内的所有关键词写入一个日志文件;计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件。所述用户数据的统计方法还包括:基于多个所述日志统计文件中的关键词与出现次数的对应关系,计算各个关键词的出现总次数。所述从所述控制指令中提取出关键词,包括:若所述控制指令为按键指令,则根据预设的按键指令与关键词的对应关系,确定所述控制指令对应的关键词;若所述控制指令为字符指令,则首先将所述字符指令拆分为一个以上的指令词语,并基于预设的词组数据库,计算所述指令词语在所述词组数据库中的出现频率,将所述出现频率大于预设频率阈值的指令词语作为所述字符指令对应的关键词;若所述控制指令为语音指令,则首先识别出所述语音指令对应的文字,将所述语音指令对应的文字拆分为一个以上的指令词语,并基于预设的词组数据库,计算所述指令词语在所述词组数据库中的出现频率,将所述出现频率大于预设频率阈值的指令词语作为所述语音指令对应的关键词。所述计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件,包括:从所述日志文件内逐一选取关键词作为特定关键词;判断所述特定关键词是否已经存在于所述日志统计文件中;若所述特定关键词不存在于所述日志统计文件中,则将所述特定关键词写入所述日志统计文件中,并将所述特定关键词对应的出现次数记为1;若所述特定关键词已存在于所述日志统计文件中,则将所述特定关键词对应的出现次数增加1次,并返回执行所述从所述日志文件内逐一选取关键词作为特定关键词,判断所述特定关键词是否已经存在于所述日志统计文件中的操作。所述基于多个所述日志统计文件中的关键词与出现次数的对应关系,计算各个关键词的出现总次数,包括:选取预设数量的所述日志统计文件,生成候选日志统计文件集合;从所述候选日志统计文件集合中,提取出全部关键词与出现次数的对应关系;计算相同的关键词的出现次数之和,作为该关键词的出现总次数。所述用户数据的统计方法,还包括:将所述关键词与出现总次数的对应关系,根据所述出现总次数由大到小排列,并生成.csv格式的关键词累计统计文件。本专利技术实施例与现有技术相比存在的有益效果是:通过接收用户输入的控制指令,从控制指令中提取出关键词,并将预设单位时间内的所有关键词写入一个日志文件;基于所述日志文件内各个所述关键词的出现次数,生成日志统计文件;基于多个所述日志统计文件中的关键词与出现次数的对应关系,计算各个关键词的出现总次数,以对控制指令中的关键词进行计算,从而充分分析控制指令,为后续的用户行为的分析提供充足的数据支持。附图说明为了更清楚地说明本文档来自技高网...

【技术保护点】
1.一种用户数据的统计方法,其特征在于,包括:接收用户输入的控制指令;从所述控制指令中提取出关键词,并将预设单位时间内的所有关键词写入一个日志文件;计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件。

【技术特征摘要】
1.一种用户数据的统计方法,其特征在于,包括:接收用户输入的控制指令;从所述控制指令中提取出关键词,并将预设单位时间内的所有关键词写入一个日志文件;计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件。2.如权利要求1所述的用户数据的统计方法,其特征在于,还包括:基于多个所述日志统计文件中的关键词与出现次数的对应关系,计算各个关键词的出现总次数。3.如权利要求1所述的用户数据的统计方法,其特征在于,所述从所述控制指令中提取出关键词,包括:若所述控制指令为按键指令,则根据预设的按键指令与关键词的对应关系,确定所述控制指令对应的关键词;若所述控制指令为字符指令,则首先将所述字符指令拆分为一个以上的指令词语,并基于预设的词组数据库,计算所述指令词语在所述词组数据库中的出现频率,将所述出现频率大于预设频率阈值的指令词语作为所述字符指令对应的关键词;若所述控制指令为语音指令,则首先识别出所述语音指令对应的文字,将所述语音指令对应的文字拆分为一个以上的指令词语,并基于预设的词组数据库,计算所述指令词语在所述词组数据库中的出现频率,将所述出现频率大于预设频率阈值的指令词语作为所述语音指令对应的关键词。4.如权利要求1所述的用户数据的统计方法,其特征在于,所述计算所述日志文件内各个所述关键词的出现次数,生成关键词与出现次数的对应关系,将全部所述关键词与出现次数的对应关系写入一个日志统计文件,包括:从所述日志文件内逐一选取关键词作为特定关键词;判断所述日志文件内是否存在未被选取的关键词;若日志文件内存在未被选取的关键词,则判断所述特定关键词是否已经存在于所述日志统计文件中;若所述特定关键词不存在于所述日志统计文件中,则将所述特定关键词写入所述日志统计文件中,并将所述特定关键词对应的出现次数记为1,并返回执行从所述日志文件内逐一选取关键词作为特定关键词,判断所述日志文件内是否存在未被选取的关键词的操作;若所述特定关键词已存在于所述日志统计文件中,则将所述特定关键词对应的出现次数增加1次,并返回执行从所述日志文件内逐一选取关键词作为特定关键词,判断所述日志文件内是否存在未被选取的关键词的操作。5.如权利要求2所述的用户数据的统计方法,其特征在于,所述基于多个所述日志统计文件中的关键词与出现次数的对应关系,计算各个关键词的出现总次数,包括:选取预设数量的所述日志统计文件,生成候选日志统...

【专利技术属性】
技术研发人员:邓林飞
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1