消除关键词歧义的方法、电视及可读存储介质技术

技术编号:19551203 阅读:27 留言:0更新日期:2018-11-24 21:55
本发明专利技术公开了一种消除关键词歧义的方法、电视及可读存储介质,消除关键词歧义的方法包括:在接收到待搜索的关键词时,若关键词数据库中存在至少两个与所述关键词对应的第一维度,则判定所述关键词为歧义关键词;基于所述第一维度对影视数据库进行检索,得到各第一维度对应的结果数量;若节目热度数据库存在与所述关键词对应的数据,则基于所述数据分别计算各个所述结果数量对应的权重值;获取各个所述权重值中的最高权重值,将所述最高权重值对应的维度输出。本发明专利技术的最高权重值即最接近用户搜索意图的维度,消除了只要与关键词相关的维度都呈现出来的混乱,实现对关键词歧义的消除,尽量满足输出较符合客户预期的搜索结果。

The Method of Eliminating Keyword Ambiguity, TV and Readable Storage Media

The invention discloses a method for eliminating keyword ambiguity, a television and a readable storage medium. The method for eliminating keyword ambiguity includes: when a keyword to be searched is received, if there are at least two first dimensions corresponding to the keyword in the keyword database, the keyword is determined to be an ambiguous keyword; In the first dimension, the video database is retrieved to obtain the number of results corresponding to the first dimension; if the program heat database has the data corresponding to the keyword, the weight values corresponding to the number of results are calculated based on the data; the highest weight values among the weight values are obtained. The dimension output corresponding to the highest weight value is described. The maximum weight value of the present invention is the dimension closest to the user's search intention, eliminating the confusion as long as the dimension related to keywords appears, realizing the elimination of keyword ambiguity, and satisfying the output of search results that are more in line with customer expectations.

【技术实现步骤摘要】
消除关键词歧义的方法、电视及可读存储介质
本专利技术涉及电视
,尤其涉及消除关键词歧义的方法、电视及可读存储介质。
技术介绍
现在的语音搜索影视节目的产品,主要的实现方法是通过语音识别技术将音频转换成文字,再通过识别文字中的关键词,进行搜索。影视节目一般分为影视名、演员、导演、风格类型、关联热词等属性,搜索可以针对这些属性进行单独或组合检索。但是如果某个关键词在多个维度都出现的时候,一般做法会将所有可能的结果都搜索出来,大量可能不是用户要的结果,这样的体验非常不好。
技术实现思路
本专利技术的主要目的在于提供一种消除关键词歧义的方法、电视及可读存储介质,旨在解决现有技术中搜索影视节目的过程中对歧义关键词无法智能消除的技术问题。为实现上述目的,本专利技术提供一种消除关键词歧义的方法,所述消除关键词歧义的方法包括以下步骤:在接收到待搜索的关键词时,若关键词数据库中存在至少两个与所述关键词对应的第一维度,则判定所述关键词为歧义关键词;基于所述第一维度对影视数据库进行检索,得到各第一维度对应的结果数量;若节目热度数据库存在与所述关键词对应的数据,则基于所述数据分别计算各个所述结果数量对应的权重值;获取各个所述权重值中的最高权重值,将所述最高权重值对应的维度输出。优选地,所述获取各个所述权重值中的最高权重值,将所述最高权重值对应的维度输出的步骤包括:对各个所述权重值进行倒序排列,并存储于维度权重数据库中;获取各个所述权重值中的最高权重值,将所述最高权重值对应的维度输出。优选地,所述获取所述维度权重数据库中的最高权重值,将所述最高权重值对应的维度输出的步骤之后,所述消除关键词歧义的方法还包括:统计设定时长范围内的用户点播行为数据,得到统计结果;基于所述统计结果对所述维度权重数据库进行修正。优选地,所述统计设定时长范围内的用户点播行为数据,得到统计结果的步骤包括:在所述设定时长范围内接收到最高权重值对应的第二维度的第一点播指令后,获取在所述设定时长范围内接收到指定维度关键词的第二点播指令;根据所述第一点播指令产生的第一正向数据、所述设定时长范围内未点播最高权重值对应的第二维度的第一反向数据、第二点播指令产生的第二正向数据及所述设定时长范围内未点播指定维度关键词的第二反向数据,计算所述关键词对应的误判率;若所述误判率大于1,则基于预设规则修正维度权重数据库。优选地,所述若所述误判率大于1,则基于预设规则修正维度权重数据库的步骤包括:若所述误判率大于1,则基于所述第一正向数据统计第一正向数据对应的第一最高维度;基于所述第二正向数据统计第二正向数据对应的第二最高维度;基于所述第一最高维度和所述第二最高维度计算播放次数最高维度值;若所述播放次数最高维度值与所述维度权重数据库中的最高权重值不匹配,则采用播放次数最高维度值更新最高权重值。优选地,所述若节目热度数据库存在与所述关键词对应的数据,则基于所述数据分别计算各个所述结果数量对应的权重值的步骤包括:通过影视排行榜数据获取节目热度数据库;和/或;通过搜索引擎搜索的热度排行榜获取节目热度数据库;若所述节目热度数据库存在与所述关键词对应的数据,则基于所述数据分别计算各个所述结果数量对应的权重值。优选地,所述在接收到待搜索的关键词时,若关键词数据库中存在至少两个与所述关键词对应的第一维度,则判定所述关键词为歧义关键词步骤包括:在接收到待搜索的关键词时,判定所述关键词是否为指定维度的关键词,若是,则输出所述关键词的指定维度;若否,则在关键词数据库中是否存在至少两个与所述关键词对应的第一维度时,判定所述关键词为歧义关键词。此外,为实现上述目的,本专利技术还提供一种电视,所述电视包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的消除关键词歧义的程序,所述消除关键词歧义的程序被所述处理器执行时实现上述中任一项所述的消除关键词歧义的方法的步骤。此外,为实现上述目的,本专利技术还提供一种可读存储介质,所述可读存储介质上存储有消除关键词歧义的程序,所述消除关键词歧义的程序被处理器执行时实现上述中任一项所述的消除关键词歧义的方法的步骤。本专利技术中,针对搜索影视节目过程中输入的关键词,首选判断待搜索的关键词是否为歧义关键词,若是,则基于关键词对应的第一维度对影像数据库进行检索,同时获取节目热度数据库,并基于各个结果数量及节目热度数据库中与关键词对应的数据分别权重值,并且,将各个权重值中的最高权重值输出,最高权重值即最接近用户搜索意图的维度,消除了只要与关键词相关的维度都呈现出来的混乱,即尽可能的给出比较符合用户预期的搜索结果。本专利技术通过对关键词相关的维度的处理,实现对关键词歧义的消除,尽量满足输出较符合客户预期的搜索结果,使得对搜索影视节目时输入的关键词的反馈更加智能化。附图说明图1为本专利技术实施例方案涉及的电视硬件结构示意图;图2为本专利技术消除关键词歧义的方法第一实施例的流程示意图;图3为本专利技术消除关键词歧义的方法第二实施例的流程示意图;图4为本专利技术消除关键词歧义的方法第三实施例的流程示意图;图5为本专利技术消除关键词歧义的方法第四实施例的流程示意图;图6为本专利技术消除关键词歧义的方法第五实施例的流程示意图;图7为本专利技术消除关键词歧义的方法第七实施例的流程示意图;图8为本专利技术消除关键词歧义的方法第八实施例的流程示意图。本专利技术目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的电视结构示意图。如图1所示,该电视可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。可选地,电视还可以包括摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。当然,电视还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。本领域技术人员可以理解,图1中示出的电视结构并不构成对电视的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及消除关键词歧义的程序。在图1所示的电视中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的消除关键词歧义的程序,并执行以下操作:在接收到待搜索的关键词时,若关键词数据库中存在至少两个与所述关键词对应的第一维度,则判定所述关键词为歧义关本文档来自技高网...

【技术保护点】
1.一种消除关键词歧义的方法,其特征在于,所述消除关键词歧义的方法包括以下步骤:在接收到待搜索的关键词时,若关键词数据库中存在至少两个与所述关键词对应的第一维度,则判定所述关键词为歧义关键词;基于所述第一维度对影视数据库进行检索,得到各第一维度对应的结果数量;若节目热度数据库存在与所述关键词对应的数据,则基于所述数据分别计算各个所述结果数量对应的权重值;获取各个所述权重值中的最高权重值,将所述最高权重值对应的维度输出。

【技术特征摘要】
1.一种消除关键词歧义的方法,其特征在于,所述消除关键词歧义的方法包括以下步骤:在接收到待搜索的关键词时,若关键词数据库中存在至少两个与所述关键词对应的第一维度,则判定所述关键词为歧义关键词;基于所述第一维度对影视数据库进行检索,得到各第一维度对应的结果数量;若节目热度数据库存在与所述关键词对应的数据,则基于所述数据分别计算各个所述结果数量对应的权重值;获取各个所述权重值中的最高权重值,将所述最高权重值对应的维度输出。2.如权利要求1所述的消除关键词歧义的方法,其特征在于,所述获取各个所述权重值中的最高权重值,将所述最高权重值对应的维度输出的步骤包括:对各个所述权重值进行倒序排列,并存储于维度权重数据库中;获取各个所述权重值中的最高权重值,将所述最高权重值对应的维度输出。3.如权利要求2所述的消除关键词歧义的方法,其特征在于,所述获取所述维度权重数据库中的最高权重值,将所述最高权重值对应的维度输出的步骤之后,所述消除关键词歧义的方法还包括:统计设定时长范围内的用户点播行为数据,得到统计结果;基于所述统计结果对所述维度权重数据库进行修正。4.如权利要求3所述的消除关键词歧义的方法,其特征在于,所述统计设定时长范围内的用户点播行为数据,得到统计结果的步骤包括:在所述设定时长范围内接收到最高权重值对应的第二维度的第一点播指令后,获取在所述设定时长范围内接收到指定维度关键词的第二点播指令;根据所述第一点播指令产生的第一正向数据、所述设定时长范围内未点播最高权重值对应的第二维度的第一反向数据、第二点播指令产生的第二正向数据及所述设定时长范围内未点播指定维度关键词的第二反向数据,计算所述关键词对应的误判率;若所述误判率大于1,则基于预设规则修正维度权重数据库。5.如权利要求4所述的消除关键词歧义的方法,其特征在于,所述若所述误判率大于1,则基于预设规则修正维度权重数据库的步骤包括:若误判率大于1,则基于所述第一正向数据统计第一正向数据对应的第...

【专利技术属性】
技术研发人员:姚凯曾志辉
申请(专利权)人:深圳创维数字技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1