The invention relates to the technical field of content search, providing a method and device for obtaining content through user corpus, including key words for extracting user corpus; obtaining an address list for providing content corresponding to the key words according to the key words, and selecting an address from the address list to find out whether there exists content corresponding to the key words; and when searching for the content corresponding to the key words, finding the content corresponding to the key words; When the content corresponding to the keyword is found, the content corresponding to the keyword is grabbed and output; when the content corresponding to the keyword is not found, it is automatically switched to another unknown address in the address list to continue searching until the content corresponding to the keyword is found. Achieve fast access to users'search intentions, and always get search results.
【技术实现步骤摘要】
一种基于用户语料获取内容的方法和装置
本专利技术涉及内容搜索
,尤指一种基于用户语料获取内容的方法和装置。
技术介绍
手机APP或者其他应用程序通过搜索第三方网站获取用户需要的内容是已知的,传统的应用程序通过要求用户输入需要查找的内容关键词,前往第三方搜索与关键词相关的内容反馈给用户。这一类应用程序往往需要用户自行进行提炼关键词,然后通过键盘或者虚拟键盘打字输入关键词,这种方式降低了用户从产生疑问到获取答案过程的效率。当用户完成输入后,应用程序使用内部已经存储好地址的第三方搜索对应的内容,当这些预先存储的第三方的地址有时发生变化,或者需要关键词对应的内容的地址发生变化时,搜索就会失败。如何应对这些情况,一方面增加用户搜索的效率,一方面使用户始终可以搜索到所需的内容,成为新的问题。
技术实现思路
本专利技术提供一种基于用户语料获取内容的方法和装置,通过识别用户语料快速获取用户的搜索意图,在使用预先存储的第三方内容进行搜索失败后,切换另一个地址进行新的搜索,使用户始终可以获得搜索结果。本专利技术提供的技术方案如下:本专利技术提供一种基于用户语料获取内容的方法和装置,包括:提取用户的语料的关键词;依据所述关键词,获取提供与所述关键词对应的内容的地址列表,并从所述地址列表中选取某一地址查找是否存在与所述关键词对应的内容;当查找到与所述关键词对应的内容时,抓取并输出与所述关键词对应的内容;当未查找到与所述关键词对应的内容时,则自动切换至所述地址列表中的另一未经查找的地址中继续查找,直至查找到与所述关键词对应的内容。具体地,用户的语料可以是用户使用键盘或者虚拟键盘输 ...
【技术保护点】
1.一种基于用户语料获取内容的方法,其特征在于,包括:提取用户的语料的关键词;依据所述关键词,获取提供与所述关键词对应的内容的地址列表,并从所述地址列表中选取某一地址查找是否存在与所述关键词对应的内容;当查找到与所述关键词对应的内容时,抓取并输出与所述关键词对应的内容;当未查找到与所述关键词对应的内容时,则自动切换至所述地址列表中的另一未经查找的地址中继续查找,直至查找到与所述关键词对应的内容。
【技术特征摘要】
1.一种基于用户语料获取内容的方法,其特征在于,包括:提取用户的语料的关键词;依据所述关键词,获取提供与所述关键词对应的内容的地址列表,并从所述地址列表中选取某一地址查找是否存在与所述关键词对应的内容;当查找到与所述关键词对应的内容时,抓取并输出与所述关键词对应的内容;当未查找到与所述关键词对应的内容时,则自动切换至所述地址列表中的另一未经查找的地址中继续查找,直至查找到与所述关键词对应的内容。2.根据权利要求1所述的一种基于用户语料获取内容的方法,其特征在于,所述提取用户的语料的关键词包括:解析所述语料中的语句的语义,转换为实体语义槽的形式;提取所述实体语义槽中的关键词,作为所述语料的关键词。3.根据权利要求2所述的一种基于用户语料获取内容的方法,其特征在于,所述获取提供与所述关键词对应的内容的地址列表,并从所述地址列表中选取某一地址查找是否存在与所述关键词对应的内容具体包括:提取预先已存储的与所述关键词相关的第三方内容网站列表,所述第三方内容网站列表中的地址依据历史搜索所述语料的关键词时,接入次数从大到小的顺序进行排列;根据排列的顺序,依次对所述地址进行编号,编号最大的优先被选取,从编号最大的地址接入查找内容。4.根据权利要求2所述的一种基于用户语料获取内容的方法,其特征在于,所述获取提供与所述关键词对应的内容的地址列表,并从所述地址列表中选取某一地址查找是否存在与所述关键词对应的内容具体包括:在搜索引擎中输入所述语料的关键词,获取第二搜索结果,所述第二搜索结果中的网站顺序列表作为所述地址列表,依据所述顺序列表的顺序,接入网站查找内容。5.根据权利要求4所述的一种基于用户语料获取内容的方法,所述在搜索引擎中输入所述语料的关键词前包括:提取预先已存储的搜索引擎列表,所述搜索引擎列表包括按顺序排列的多个搜索引擎;根据排列的顺序,依次对所述搜索引擎的地址进行编号,编号最大的优先被选取,从...
【专利技术属性】
技术研发人员:魏誉荧,
申请(专利权)人:广东小天才科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。