内容查询方法和装置制造方法及图纸

技术编号:23212834 阅读:30 留言:0更新日期:2020-01-31 21:53
本申请实施例公开了内容查询方法和装置。该方法的一具体实施方式包括:获取查询请求,查询请求包括基于对内容标签的需求生成的查询式;将查询式与已存储的互联网内容所关联的内容标签相匹配,以查找出满足内容标签需求的目标互联网内容,其中,互联网内容关联的内容标签是通过将互联网内容输入预设的内容标签模型得到的;推送目标互联网内容。该实施方式提升了内容定位精准度,提升了内容查询效率。

Content query methods and devices

【技术实现步骤摘要】
内容查询方法和装置
本申请实施例涉及计算机
,具体涉及数据分析
,尤其涉及内容查询方法和装置。
技术介绍
随着互联网技术的发展,产生了越来越多的互联网数据。如何从海量的互联网数据中精准地抓取需要的数据,是互联网
中的一个重要研究方向。目前的数据查询技术中,通常根据用户输入的查询词与互联网内容的匹配程度来确定查询结果。对查询词的可选词库或查询格式没有限制,用户输入查询词操作的自由度较大。由于互联网内容数据量庞大,每条互联网内容所包含的内容较多,查询过程中的匹配计算需要花费较多的时间。
技术实现思路
本申请实施例提出了内容查询方法和装置。第一方面,本申请实施例提供了一种内容查询方法,包括:获取查询请求,所述查询请求包括基于从预设内容标签库中选择的目标内容标签生成的查询式;将所述查询式与已存储的互联网内容所关联的内容标签相匹配,以查找出目标互联网内容,其中,所述互联网内容关联的内容标签是通过将互联网内容输入预设的内容标签模型得到的;推送目标互联网内容。在一些实施例中,上述方法还包括:将待分本文档来自技高网...

【技术保护点】
1.一种内容查询方法,包括:/n获取查询请求,所述查询请求包括基于从预设内容标签库中选择的目标内容标签生成的查询式;/n将所述查询式与已存储的互联网内容所关联的内容标签相匹配,以查找出目标互联网内容,其中,所述互联网内容关联的内容标签是通过将互联网内容输入预设的内容标签模型得到的;/n推送目标互联网内容。/n

【技术特征摘要】
1.一种内容查询方法,包括:
获取查询请求,所述查询请求包括基于从预设内容标签库中选择的目标内容标签生成的查询式;
将所述查询式与已存储的互联网内容所关联的内容标签相匹配,以查找出目标互联网内容,其中,所述互联网内容关联的内容标签是通过将互联网内容输入预设的内容标签模型得到的;
推送目标互联网内容。


2.根据权利要求1所述的方法,其中,所述方法还包括:
将待分析的互联网内容输入预设的内容标签分类模型,得到用于表征待分析的互联网内容的内容特征的标签,作为所述互联网内容关联的内容标签。


3.根据权利要求2所述的方法,其中,所述方法还包括:
构建所述内容标签分类模型,包括:
基于已标注关联的内容标签的样本内容,采用机器学习方法对内容标签分类的初始模型进行训练,得到所述内容标签分类模型。


4.根据权利要求3所述的方法,其中,所述基于已标注关联的内容标签的样本内容,采用机器学习方法对内容标签分类的初始模型进行训练,得到所述内容标签分类模型,包括:
在预设的内容库中查找出与所述样本内容相似的内容作为扩展内容,将所述样本内容关联的内容标签与对应的扩展内容相关联,得到扩展内容关联的内容标签,基于所述样本内容和与所述样本内容相似的扩展内容生成样本数据;
将样本数据中的样本内容和与所述样本内容相似的扩展内容输入所述内容标签分类的初始模型进行标签分类,并比对所述内容标签分类的初始模型的标签分类结果与所述样本内容关联的内容标签和所述扩展内容关联的内容标签,基于比对结果迭代调整所述内容标签分类的初始模型的参数,使调整参数后的内容标签分类的初始模型的标签分类结果与所述样本内容关联的内容标签和所述扩展内容关联的内容标签的比对结果满足预设的收敛条件,得到训练完成的内容标签分类模型。


5.根据权利要求2-4任一项所述的方法,其中,所述内容标签分类模型包括以下至少一项:内容生产者标签分类模型、内容主题标签分类模型、内容分类角度标签分类模型。


6.一种内容查询装置,包括:
获取单元,被配置成获取查询请求,所述查询请求包括基于从预设内容标签库中选择的目标内容标签生成的查询式;
匹配单元,被配置成将所述查询式与已存储的互联网内容所关联的内容标签相...

【专利技术属性】
技术研发人员:张梦
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1