商品推荐方法及系统技术方案

技术编号:11053631 阅读:77 留言:0更新日期:2015-02-18 17:46
本发明专利技术公开了一种商品推荐方法及系统。该商品推荐方法包括以下步骤:接收目标用户输入的语音信息;将语音信息识别转换为文本信息;处理文本信息生成结构化文本;查询获取语音查询结果;将结构化文本记录至目标用户的日志中;聚类分析并确定目标用户所属的用户聚类;搜索目标用户的最近邻用户;根据最近邻用户对商品的评分及目标用户的平均评分计算目标用户对商品的潜在评分,根据潜在评分筛选商品以生成候选商品集;根据结构化文本从候选商品集中选取出若干商品并推荐给目标用户。本发明专利技术的商品推荐方法及系统避免了电子商务中用户搜索所需商品所产生的浏览中的大量无关信息,大大提高了电子商务的效率,同时大大改善了用户的使用体验。

【技术实现步骤摘要】
商品推荐方法及系统
本专利技术涉及一种商品推荐方法及系统。
技术介绍
随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。 另一方面,语音查询功能在各行业中都有非常实际的应用。随着移动终端的普及,越来越多的语音识别应用被开发。利用语音识别技术能够在一定程度上便于用户的搜索或操作,若能够将语音识别技术辅以主动根据用户需求对商品进行筛选推荐的系统,则有望更快、更便利地推荐最适合用户的产品,以达到使得用户能够更便捷地找寻所需商品的目的,从而大大改善用户的使用体验。
技术实现思路
本专利技术要解决的技术问题是为了现有电子商务中用户需要花费大量的时间才能找到自己想买的商品,而在这种浏览中必然产生大量无关的信息,因而会大大降低电子商务的效率,同时严重影响用户的使用体验的缺陷,提出一种商品推荐方法及系统。 本专利技术是通过下述技术方案来解决上述技术问题的: 本专利技术提供了一种商品推荐方法,其特点在于,在一数据库中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录,该商品推荐方法包括以下步骤: S1、接收一用户输入的语音信息,并将这一用户作为目标用户; S2、对语音信息进行语音识别转换为一文本信息; S3、对该文本信息进行结构化处理,以生成一结构化文本; S4、根据结构化文本在数据库中进行查询,以获取一语音查询结果; S5、若在该数据库中记录有该目标用户的用户日志,则将该结构化文本记录至该目标用户的用户日志中,若在该数据库中未记录有该目标用户的用户日志,则在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中; S6、根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征; S7、确定该目标用户所属的用户聚类; S8、根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户; S9、根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集; Sltl、根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。 其中用户日志可以是用户的历史语音查询日志,用户日志中收集了用户的历史行为等内容,用于作为聚类分析、近邻用户确定等后续分析处理的基础。 上述步骤S9可以为根据用户日志建立用于分析用户喜好的模型,根据收集的用户信息的行为记录,按照多种维度抽取出用户的信息,建立用户喜好或偏好的模型。在用户喜好或偏好的基础上,利用用户的历史信息较为准确地预测目标用户对特定商品的喜欢程度,并根据这一喜好程度对目标用户进行推荐商品。 较佳地,该步骤S2包括以下步骤: S21、对语音信息进行音频特征的提取; S22、获取以马尔科夫模型为基础建立的声学模型,然后根据该声学模型解析得到和提取的首频特征匹配度最闻的词序列; S23、将该词序列生成为该文本信息。 上述步骤中,以马尔科夫模型为基础建立声学模型,并建立包含系统所能处理的词汇集和其发音的发音模型(可包含于声学模型中),在发音模型中,包含了声学模型建模单元与语言模型建模单元之间的映射。根据声学模型打分,寻找一个词模型序列以描述输入语音信号,从而得到对应的词解码序列。上述过程也可理解为,对输入的信号,根据声学模型及词典,找寻最大概率输出的词串或词序列。 较佳地,该步骤S3包括以下步骤: S31、利用预设的分词和词性标注算法对该文本信息进行分词和词性标注; S32、对分词后的该文本信息进行同义词替换,以进行归一化处理; S33、找出该文本信息所包含的第一类词,并以预设的通配符代替该文本信息中的第一类词,以形成该结构化文本。 较佳地,该步骤S21为:对语音信息进行模数转换、端点检测、预加重、加窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征。其中的LPC为LinearPredictive Coding,译为线性预测编码,也称为声源编码。 较佳地,该步骤S7为:计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类。 经过上述步骤S7的处理所形成的聚类结果,实质上是大体将对商品具有相近似的兴趣点的用户放入同一聚类中。 本专利技术还提供了一种商品推荐系统,其包括: 数据库,其中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录; 输入模块,用于接收一用户输入的语音信息,并将这一用户作为目标用户; 语音识别模块,用于对语音信息进行语音识别转换为一文本信息; 结构化模块,用于对该文本信息进行结构化处理,以生成一结构化文本; 查询模块,用于根据结构化文本在数据库中进行查询,以获取一语音查询结果; 日志记录模块,用于在该数据库中记录有该目标用户的用户日志的情况下将该结构化文本记录至该目标用户的用户日志中,在该数据库中未记录有该目标用户的用户日志的情况下在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中; 聚类分析模块,用于根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征; 属类确定模块,用于确定该目标用户所属的用户聚类; 近邻搜索模块,用于根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户; 筛选模块,用于根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集; 推荐模块,用于根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。 较佳地,语音识别模块包括音频特征提取单元、词序列匹配单元和文本生成单元。 音频特征提取单元用于对语音信息进行音频特征的提取。词序列匹配单元用于获取以马尔科夫模型为基础建立的声学模型,然后根据该声学模型解析得到和提取的音频特征匹配度最高的词序列。文本生成单元用于将该词序列生成为该文本信息。 较佳地,结构化模块包括词性标注单元、同义词替换单元、通配符单元。 词性标注单元用于利用预设的分词和词性标注算法对该文本信息进行分词和词性标注。同义词替换单元用于对分词后的该文本信息进行同义词替换,以进行归一化处理。通配符单元用于找出该文本信息所包含的第一类词,并采用预设的通配符代替该文本信息中的第一类词以形成该结构化文本。其中涉及的用于替换的同义词、通配符以及其替换规则应当理解为预存在系统中。 较佳地,音频特征提取单元用于对语音信息进行模数转换、端点检测、预加重、力口窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征。 较佳地,属类确定模块用于计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类。 在符合本领域常识的基础上,上述各优选条件,可任意组合本文档来自技高网...

【技术保护点】
一种商品推荐方法,其特征在于,在一数据库中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录,该商品推荐方法包括以下步骤:S1、接收一用户输入的语音信息,并将这一用户作为目标用户;S2、对语音信息进行语音识别转换为一文本信息;S3、对该文本信息进行结构化处理,以生成一结构化文本;S4、根据结构化文本在数据库中进行查询,以获取一语音查询结果;S5、若在该数据库中记录有该目标用户的用户日志,则将该结构化文本记录至该目标用户的用户日志中,若在该数据库中未记录有该目标用户的用户日志,则在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中;S6、根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征;S7、确定该目标用户所属的用户聚类;S8、根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户;S9、根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集;S10、根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。...

【技术特征摘要】
1.一种商品推荐方法,其特征在于,在一数据库中记录有多个用户的多个用户日志,用户日志一一对应地记录有用户的历史记录,该商品推荐方法包括以下步骤: 51、接收一用户输入的语音信息,并将这一用户作为目标用户; 52、对语音信息进行语音识别转换为一文本信息; 53、对该文本信息进行结构化处理,以生成一结构化文本; 54、根据结构化文本在数据库中进行查询,以获取一语音查询结果; 55、若在该数据库中记录有该目标用户的用户日志,则将该结构化文本记录至该目标用户的用户日志中,若在该数据库中未记录有该目标用户的用户日志,则在该数据库中创建该目标用户的用户日志、并将该结构化文本记录至该目标用户的用户日志中; 56、根据该数据库中记录的该多个用户的用户日志对用户进行聚类分析,以得到聚类结果,该聚类结果包括若干用户聚类及其特征; 57、确定该目标用户所属的用户聚类; 58、根据协同过滤推荐算法,在对应的用户聚类中搜索该目标用户的最近邻用户; 59、根据该最近邻用户对商品的评分及该目标用户的平均评分计算该目标用户对商品的潜在评分,根据潜在评分筛选商品以生成一候选商品集; Sltl、根据该结构化文本从该候选商品集中选取出若干商品,并将该若干商品推荐给该目标用户。2.如权利要求1所述的商品推荐方法,其特征在于,该步骤S2包括以下步骤: 521、对语音信息进行音频特征的提取; 522、获取以马尔科夫模型为基础建立的声学模型,然后根据该声学模型解析得到和提取的首频特征匹配度最闻的词序列; 523、将该词序列生成为该文本信息。3.如权利要求1所述的商品推荐方法,其特征在于,该步骤S3包括以下步骤: 531、利用预设的分词和词性标注算法对该文本信息进行分词和词性标注; 532、对分词后的该文本信息进行同义词替换,以进行归一化处理; 533、找出该文本信息所包含的第一类词,并以预设的通配符代替该文本信息中的第一类词,以形成该结构化文本。4.如权利要求2所述的商品推荐方法,其特征在于,该步骤S21为:对语音信息进行模数转换、端点检测、预加重、加窗、自相关序列、LPC系数、和/或倒频谱系数的计算,以提取音频特征。5.如权利要求1-4中任意一项所述的商品推荐方法,其特征在于,该步骤S7为:计算用户对商品的关注性和用户对商品的评分的相似性,并将关注性和评分两者线性组合以构成一聚类分析参数,然后利用该聚类分析参数对用户进行聚类。6.—种商品推荐系统,其特征在于,包括: 数据库,其中记录有多个用户的多个用户日志,用户日志一...

【专利技术属性】
技术研发人员:何玉
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1