当前位置: 首页 > 专利查询>陈包容专利>正文

一种自动化搜索的方法技术

技术编号:20389804 阅读:50 留言:0更新日期:2019-02-20 02:49
本发明专利技术公开了一种自动化搜索的方法,包括以下步骤:第一步:创建用户搜索意图计算系统,所述用户搜索意图计算系统,包括子系统:创建用户的个人场景事件图谱;搜索前,用户操作的复制、剪切、粘贴事件中的一种或多种组合;搜索前,用户在设备上接触的具体事件;搜索前,基于用户的消息、语音、视频、电邮通讯内容;基于用户的疑问;基于最近的热点新闻事件;新知识点;基于联系人;基于用户的拍照、视频;基于用户的个人场景搜索记录库;基于深度学习的猜测;第二步:获取用户的搜索意图;第三步:基于意图,生成搜索文本;第四步:自动弹框显示不少于一个搜索文本,点击打开搜索网页;直接显示搜索文本的搜索页面。

【技术实现步骤摘要】
一种自动化搜索的方法
专利技术涉及搜索的方法
,具体为一种自动化搜索的方法。
技术介绍
搜索引擎可以被用来定位文档集合中的特定文档。此外,搜索引擎可以被用来定位文档中的特定关键词或短语。搜索引擎可以使用一个或多个索引来定位特定文档、关键词或短语。此外,搜索引擎可以在定位特定信息的过程中执行布尔和其它运算。为了设计一种使搜索更加快速、更加精确以及目的性较强的自动化搜索的方法显得非常必要。
技术实现思路
专利技术的目的在于提供一种自动化搜索的方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,专利技术提供如下技术方案:一种自动化搜索的方法,包括以下步骤:第一步:创建用户搜索意图计算系统,所述用户搜索意图计算系统,包括子系统:(1)创建用户的个人场景事件图谱;(2)搜索前,用户操作的复制、剪切、粘贴事件中的一种及多种组合;(3)搜索前,用户在设备上接触的具体事件;(4)搜索前,基于用户的消息、语音、视频、电邮通讯内容;(5)基于用户的疑问;(6)基于最近的热点新闻事件;(7)基于新知识点;(8)基于联系人、联系方式和通讯录附属信息;所述通讯录附属信息包括:单位、地址与备注信息;(9)基于用户的拍照、视频;(10)基于用户的个人场景搜索记录库;(11)基于深度学习的概率预测;(12)基于用户编辑的文档内容。第二步:获取用户的搜索意图;第三步:基于意图,生成搜索文本;所述生成搜索文本,包括:(1)直接采用已有的文本;(2)在已有的文本基础上,优化生成搜索文本;首先对已有的文本通过词条初始URL进行解析,然后页面链接解析器基于定义的HTML规则将该页面中所包含的其它词条URL保存至词条URL库中,之后对解析的URL发出抓取请求,将获取的数据发送至知识数据解析器,由知识数据解析器负责在每个词条页面中获取所需要的知识数据去重,最后对过滤后的知识数据进行三元组存储集合处理,达到优化生成搜索文本;(3)智能生成搜索文本;所述智能生成搜索文本包括:①将图片、音频、视频、动漫转换成文本;②将长句子、篇章文本通过文本摘要技术智能生成符合预先设定的搜索关键词的字数阈值;自动文摘过程包括三个基本步骤:S1、文本分析过程:对长句子、篇章文本进行分析处理,识别出冗余信息;S2、文本内容的选取和泛化过程:从文档中辨认重要信息,通过摘录式文摘和理解式文摘的方法压缩文本,形成文摘表示;摘录型文摘由原文中抽取出来的片段组成,理解型文摘是对原文只要内容重新组织后形成的;S3、文摘的转换和生成过程:实现对原文内容的重组或根据语义表示生成文摘,并确保文摘的连贯性;第四步:自动弹框显示不少于一个搜索文本,点击打开搜索网页;或/和直接显示基于搜索文本的搜索页面。优选的,所述创建用户的个人场景事件图谱步骤包括:步骤1:预设多层次场景标签库,并预设对应的场景逻辑关系、场景间的关联概率计算规则、以及场景之间的时序关系、链式串联表达关系;步骤2:通过用户手机使用的基站与卫星定位系统动获得获取与计算用户的多层次场景标签值,对应存储到预设的多层次场景标签库中,根据预设的所述场景逻辑关系,生成用户个人场景;步骤3:基于多个独立的用户个人场景,根据场景间的关联概率计算规则,计算预设时间段内多个独立的用户个人场景之间关联概率,根据预设的场景之间的时序关系、链式串联表达关系,生成用户个人场景图谱。优选的,所述个人场景搜索记录库存储为区块链云服务器,包括私有区块链设备、公有区块链设备、节点服务器、中央服务器、硬件防火墙、区块链存储模块、发送模块和接收模块;其中私有区块链设备、公有区块链设备通过区块链存储模块存储个人的公有和私有的事件采集数据,实时的通过发送模块分布式发送到节点服务器中,通过接收模块接受实时采集的事件数据并通过节点服务器上传到中央服务器中,所述云服务器还包括硬件防火墙;区块链存储模块中数据划分为区块链备份模块、区块链隔离模块和区块链节点模块,将现有区块链数据按照功能隔离为单独的模块,区块链节点模块设置在节点服务器中,支持跨网络访问,在模块出现运行错误时,区块链备份模块、区块链隔离模块针对单一模块进行升级修复更新。优选的,所述基于深度学习的猜测包括:应用于个人场景搜索记录库,对生成的数据做滤波、去除伪迹预处理操作,然后提取数据的人、时间、天气、地点、性别、职业、年龄、实时等特征参数,进行PCA相关性主成分分析,提取主成分特征参数,然后训练识别模型,选择径向基函数为核函数的支持向量机作为情绪识别模型。与现有技术相比,专利技术的有益效果是:通过组建预设多层次场景库,生成用户的个人场景;研究得到的用户模型的过程中主题数量丰富,解决了原始数据的稀疏性;创建个人场景数据,使得功能推荐更具针对性,提升了功能推荐的有效率,使得一些多维新特征场景信息补充通过功能推荐迅速获得大量用户大数据;通过多维度形态相关异构的信息连接在一起而得到的一个拓扑网络,信息样本全面;有效帮助用户快速发现感兴趣和高质量的信息,语义关联提供了背景知识搜索更加快速、更加精确以及目的性较强,具有超前精确的预测效果。可以精准定位文档集合中的特定文档。此外,该搜索引擎可以进一步被用来定位文档中的特定关键词或短语和使用一个或多个索引来定位特定文档、关键词或短语。快速的在定位特定信息的过程中执行布尔和其它运算。对生成的数据做滤波、去除伪迹等预处理操作,然后提取数据的人、时间、天气、地点、性别、职业、年龄、实时等特征参数,进行PCA相关性主成分分析,提取主成分特征参数,然后训练识别模型,选择径向基函数为核函数的支持向量机作为情绪识别模型,不仅提高了推介效果、精确度,经过前PCA主成分分析的特征前处理有利于数据的收敛。附图说明图1为一种自动化搜索的方法的流程示意图;图2为一种自动化搜索的方法的优化生成搜索文本流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1:请参阅图1和图2,专利技术提供一种技术方案:一种自动化搜索的方法,包括以下步骤:第一步:创建用户搜索意图计算系统,所述用户搜索意图计算系统,包括子系统:(1)创建用户的个人场景事件图谱;(2)搜索前,用户操作的复制、剪切、粘贴事件中的一种及多种组合;(3)搜索前,用户在设备上接触的具体事件;(4)搜索前,基于用户的消息、语音、视频、电邮通讯内容;(5)基于用户的疑问;(6)基于最近的热点新闻事件;(7)基于新知识点;(8)基于联系人、联系方式和通讯录附属信息;所述通讯录附属信息包括:单位、地址与备注信息;(9)基于用户的拍照、视频;(10)基于用户的个人场景搜索记录库;(11)基于深度学习的概率预测;(12)基于用户编辑的文档内容。第二步:获取用户的搜索意图;第三步:基于意图,生成搜索文本;所述生成搜索文本,包括:(1)直接采用已有的文本;(2)在已有的文本基础上,优化生成搜索文本;首先对已有的文本通过词条初始URL进行解析,然后页面链接解析器基于定义的HTML规则将该页面中所包含的其它词条URL保存至词条URL库中,之后对解析本文档来自技高网...

【技术保护点】
1.一种自动化搜索的方法,其特征在于:包括以下步骤:第一步:创建用户搜索意图计算系统,所述用户搜索意图计算系统,包括子系统:(1)创建用户的个人场景事件图谱;(2)搜索前,用户操作的复制、剪切、粘贴事件中的一种及多种组合;(3)搜索前,用户在设备上接触的具体事件;(4)搜索前,基于用户的消息、语音、视频、电邮通讯内容;(5)基于用户的疑问;(6)基于最近的热点新闻事件;(7)基于新知识点;(8)基于联系人、联系方式和通讯录附属信息;所述通讯录附属信息包括:单位、地址与备注信息;(9)基于用户的拍照、视频;(10)基于用户的个人场景搜索记录库;(11)基于深度学习的概率预测;(12)基于用户编辑的文档内容。第二步:获取用户的搜索意图;第三步:基于意图,生成搜索文本;所述生成搜索文本,包括:(1)直接采用已有的文本;(2)在已有的文本基础上,优化生成搜索文本;首先对已有的文本通过词条初始URL进行解析,然后页面链接解析器基于定义的HTML规则将该页面中所包含的其它词条URL保存至词条URL库中,之后对解析的URL发出抓取请求,将获取的数据发送至知识数据解析器,由知识数据解析器负责在每个词条页面中获取所需要的知识数据去重,最后对过滤后的知识数据进行三元组存储集合处理,达到优化生成搜索文本;(3)智能生成搜索文本;所述智能生成搜索文本包括:①将图片、音频、视频、动漫转换成文本;②将长句子、篇章文本通过文本摘要技术智能生成符合预先设定的搜索关键词的字数阈值;自动文摘过程包括三个基本步骤:S1、文本分析过程:对长句子、篇章文本进行分析处理,识别出冗余信息;S2、文本内容的选取和泛化过程:从文档中辨认重要信息,通过摘录式文摘和理解式文摘的方法压缩文本,形成文摘表示;摘录型文摘由原文中抽取出来的片段组成,理解型文摘是对原文只要内容重新组织后形成的;S3、文摘的转换和生成过程:实现对原文内容的重组或根据语义表示生成文摘,并确保文摘的连贯性;第四步:自动弹框显示不少于一个搜索文本,点击打开搜索网页;或/和直接显示基于搜索文本的搜索页面。...

【技术特征摘要】
1.一种自动化搜索的方法,其特征在于:包括以下步骤:第一步:创建用户搜索意图计算系统,所述用户搜索意图计算系统,包括子系统:(1)创建用户的个人场景事件图谱;(2)搜索前,用户操作的复制、剪切、粘贴事件中的一种及多种组合;(3)搜索前,用户在设备上接触的具体事件;(4)搜索前,基于用户的消息、语音、视频、电邮通讯内容;(5)基于用户的疑问;(6)基于最近的热点新闻事件;(7)基于新知识点;(8)基于联系人、联系方式和通讯录附属信息;所述通讯录附属信息包括:单位、地址与备注信息;(9)基于用户的拍照、视频;(10)基于用户的个人场景搜索记录库;(11)基于深度学习的概率预测;(12)基于用户编辑的文档内容。第二步:获取用户的搜索意图;第三步:基于意图,生成搜索文本;所述生成搜索文本,包括:(1)直接采用已有的文本;(2)在已有的文本基础上,优化生成搜索文本;首先对已有的文本通过词条初始URL进行解析,然后页面链接解析器基于定义的HTML规则将该页面中所包含的其它词条URL保存至词条URL库中,之后对解析的URL发出抓取请求,将获取的数据发送至知识数据解析器,由知识数据解析器负责在每个词条页面中获取所需要的知识数据去重,最后对过滤后的知识数据进行三元组存储集合处理,达到优化生成搜索文本;(3)智能生成搜索文本;所述智能生成搜索文本包括:①将图片、音频、视频、动漫转换成文本;②将长句子、篇章文本通过文本摘要技术智能生成符合预先设定的搜索关键词的字数阈值;自动文摘过程包括三个基本步骤:S1、文本分析过程:对长句子、篇章文本进行分析处理,识别出冗余信息;S2、文本内容的选取和泛化过程:从文档中辨认重要信息,通过摘录式文摘和理解式文摘的方法压缩文本,形成文摘表示;摘录型文摘由原文中抽取出来的片段组成,理解型文摘是对原文只要内容重新组织后形成的;S3、文摘的转换和生成过程:实现对原文内容的重组或根据语义表示生成文摘,并确保文摘的连贯性;第四步:自动弹框显示不...

【专利技术属性】
技术研发人员:陈包容
申请(专利权)人:陈包容
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1