文章搜索方法、装置及电子设备制造方法及图纸

技术编号:19647120 阅读:16 留言:0更新日期:2018-12-05 20:33
本发明专利技术公开了一种文章搜索方法、装置及电子设备。该方法包括:接收用户的文章搜索操作,获取对应的目标搜索词的搜索分词集合;根据搜索分词集合,获取目标搜索词与文章数据库所包括的每个候选文章之间的相关性评分;将相关性评分符合预设的搜索条件的候选文章,作为搜索结果提供给用户。根据本发明专利技术,可以在用户搜索文章时向用户提供与搜索词相关性较高的文章,更精准满足用户的文章搜索需求。

Article Search Method, Device and Electronic Equipment

The invention discloses an article search method, a device and an electronic device. The method includes: receiving user's article search operation, obtaining the corresponding target search word search word segmentation set; obtaining the correlation score between the target search word and each candidate article included in the article database according to the search word set; and making the correlation score of candidate articles that meet the preset search conditions, as Provide search results to users. According to the present invention, articles with high relevance to search terms can be provided to users when they search articles, so as to more accurately satisfy users'article search needs.

【技术实现步骤摘要】
文章搜索方法、装置及电子设备
本专利技术涉及搜索
,更具体地,涉及一种文章搜索方法、装置及电子设备。
技术介绍
文章搜索功能是计算机软件程序、移动终端应用(APP)中可支持的最基本的应用功能。目前文章搜索功能的实现,通常是根据用户输入的搜索词进行搜索,搜索到包括与该搜索词匹配的关键词的文章时,将该文章作为搜索结果提供给用户。但是,这种文章搜索方法并不能搜索到包括与搜索词存在相关性的相关词的文章,例如,用户输入搜索词“理财”,可以搜索出包括“理财”这一关键词的文章,但是,却无法搜索出不包括“理财”但是包括与“理财”存在相关性的相关词“投资”或者“基金”的文章。
技术实现思路
本专利技术的一个目的是提供一种用于文章搜索的新技术方案。根据本专利技术的第一方面,提供了一种文章搜索方法,其中,包括:接收用户的文章搜索操作,获取对应的目标搜索词的搜索分词集合;根据所述搜索分词集合,获取所述目标搜索词与文章数据库所包括的每个候选文章之间的相关性评分;将所述相关性评分符合预设的搜索条件的候选文章,作为搜索结果提供给用户。可选地,所述获取搜索分词集合的步骤包括:获取与所述文章搜索操作对应的目标搜索词;将所述目标搜索词进行分词处理,得到多个搜索分词以构成所述搜索分词集合。可选地,所述获取所述目标搜索词与每个所述候选文章之间的相关性评分的步骤包括:对该候选文章进行分词处理,得到多个候选文章分词以构成对应的候选文章分词集合;根据所述搜索分词集合、所述候选文章分词集合,计算目标搜索词与该候选文章之间的相关性评分。可选地,所述计算目标搜索词与该候选文章之间的相关性评分的步骤包括:对所述搜索分词集合中包括的每一个搜索分词,分别获取该搜索分词与每个所述候选文章分词之间的分词相关值;根据所述搜索分词集合包括搜索分词的数目、所述候选文章分词集合中的候选文章分词的数目以及全部所述分词相关值,计算得到所述相关性评分。可选地,所述获取分词相关值的步骤包括:对所述文章数据库中包括的全部所述候选文章进行分词,获取包括所述搜索分词的候选文章的第一文章集合以及包括所述候选文章分词的第二文章集合;获取所述第一文章集合与所述第二文章集合的文章交集,以及所述第一文章集合与所述第二文章集合的文章并集;根据所述文章交集所包括的文章数目,以及所述文章并集所包括的文章数目,计算获取所述分词相关值。可选地,所述计算得到所述相关性评分的步骤包括:根据所述搜索分词的数目、所述候选文章分词的数目,计算得到相关性系数;根据全部所述分词相关值求和得到的结果值以及所述相关性系数,计算所述相关性评分。可选地,所述计算得到所述相关性评分的步骤包括:根据所述搜索分词的数目、所述候选文章分词的数目以及预设的平滑系数,计算得到相关性系数;根据全部所述分词相关值求和得到的结果值以及所述相关性系数,计算所述相关性评分。可选地,所述搜索条件是该候选文章的相关性评分的降序排序值在预设的排序值范围之内。根据本专利技术的第二方面,提供一种文章搜索装置,其中,包括:搜索分词获取单元,用于接收用户的文章搜索操作,获取对应的目标搜索词的搜索分词集合;相关性评分获取单元,用于根据所述搜索分词集合,获取所述目标搜索词与文章数据库所包括的每个候选文章之间的相关性评分;搜索结果提供单元,用于将所述相关性评分符合预设的搜索条件的候选文章,作为搜索结果提供给用户。根据本专利技术的第三方面,提供一种电子设备,其中,包括:存储器,用于存储可执行的指令;处理器,用于根据所述可执行的指令的控制,运行所述电子设备执行本专利技术第一方面提供的文章搜索方法。根据本公开的一个实施例,基于所获取用户的目标搜索词的搜索分词集合,获取用户的目标搜索词与可被搜索的候选文章直接的相关性评分,将相关性评分较高的候选文章作为搜索结果提供给用户,在用户搜索文章时向用户提供与目标搜索词相关性较高的文章,更精准满足用户的文章搜索需求。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1是显示可用于实现本专利技术的实施例的电子设备1000的硬件配置的例子的框图。图2示出了本专利技术的实施例的搜索方法的流程图。图3示出了本专利技术的实施例的获取搜索分词集合步骤流程图。图4示出了本专利技术的实施例的获取相关性评分步骤的流程图。图5示出了本专利技术的实施例的计算相关性评分步骤的流程图。图6示出了本专利技术的实施例的计算分词相关值步骤的流程图。图7示出了本专利技术的实施例的计算相关性评分步骤的又一流程图。图8示出了本专利技术的实施例的文章搜索装置的框图。图9示出了本专利技术的实施例的电子设备的框图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。<硬件配置>图1是示出可以实现本专利技术的实施例的电子设备1000的硬件配置的框图。电子设备1000可以是便携式电脑、台式计算机、手机、平板电脑等。如图1所示,电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中,处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、耳机接口等。通信装置1400例如能够进行有线或无线通信,具体地可以包括Wifi通信、蓝牙通信、2G/3G/4G/5G通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。图1所示的电子设备仅仅是说明性的并且决不意味着对本专利技术、其应用或使用的任何限制。应用于本专利技术的实施例中,电子设备1000的存储器1200用于存储指令,指令用于控制处理器1100进行操作以执行本专利技术实施例提供的任意一项文章搜索方法。本领域技术人员应当理解,尽管在图1中对电子设备1000示出了多个装置,但是,本专利技术可以仅涉及其中的部分装置,例如,电子设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本专利技术所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。<实施例>本实施例的总体构思,是提供一种新的文章搜索方案,通过评估用户搜索文章使用的本文档来自技高网...

【技术保护点】
1.一种文章搜索方法,其中,包括:接收用户的文章搜索操作,获取对应的目标搜索词的搜索分词集合;根据所述搜索分词集合,获取所述目标搜索词与文章数据库所包括的每个候选文章之间的相关性评分;将所述相关性评分符合预设的搜索条件的候选文章,作为搜索结果提供给用户。

【技术特征摘要】
1.一种文章搜索方法,其中,包括:接收用户的文章搜索操作,获取对应的目标搜索词的搜索分词集合;根据所述搜索分词集合,获取所述目标搜索词与文章数据库所包括的每个候选文章之间的相关性评分;将所述相关性评分符合预设的搜索条件的候选文章,作为搜索结果提供给用户。2.根据权利要求1所述的方法,其中,所述获取搜索分词集合的步骤包括:获取与所述文章搜索操作对应的目标搜索词;将所述目标搜索词进行分词处理,得到多个搜索分词以构成所述搜索分词集合。3.根据权利要求1所述的方法,其中,所述获取所述目标搜索词与每个所述候选文章之间的相关性评分的步骤包括:对该候选文章进行分词处理,得到多个候选文章分词以构成对应的候选文章分词集合;根据所述搜索分词集合、所述候选文章分词集合,计算目标搜索词与该候选文章之间的相关性评分。4.根据权利要求3所述的方法,其中,所述计算目标搜索词与该候选文章之间的相关性评分的步骤包括:对所述搜索分词集合中包括的每一个搜索分词,分别获取该搜索分词与每个所述候选文章分词之间的分词相关值;根据所述搜索分词集合包括搜索分词的数目、所述候选文章分词集合中的候选文章分词的数目以及全部所述分词相关值,计算得到所述相关性评分。5.根据权利要求4所述的方法,其中,所述获取分词相关值的步骤包括:对所述文章数据库中包括的全部所述候选文章进行分词,获取包括所述搜索分词的候选文章的第一文章集合以及包括所述候选文章分词的第二文章集合;获取所述第...

【专利技术属性】
技术研发人员:潘岸腾
申请(专利权)人:广州优视网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1