本发明专利技术涉及一种网络搜词方法及系统,该方法通过将单词提交到指定网站,对返回结果进行编码;根据HTML标签,截取返回结果中的解释内容,按设定的模式对解释内容进行拆分,最后,将拆分后的内容放入对应字符串数据集中汇总并输出。网络搜词系统,该系统包括:链接模块,建立与多个网站的链接;获取模块,用于获取用户提交的待搜索单词、查询条件以及网站信息;输入模块,用于将单词提交到指定网站,对返回结果进行编码;拆分、汇总模块,根据HTML标签,截取返回结果中的解释内容,按设定模式对其进行拆分,并将拆分后的内容放入对应的数据集中汇总;全部搜索结果由输出模块输出。本发明专利技术的方法及系统大大减少了用户进行网络搜词的时间。
【技术实现步骤摘要】
本专利技术涉及网络翻译领域,具体涉及一种网络搜词方法及系统。
技术介绍
随着社会科技与经济的飞速发展,不同语种之间的信息交流已经成为信息交往中的重要部分,随之而来的各种翻译需求也越来越广泛。网络词汇翻译工具像谷歌、金山词霸、灵格斯、海词等都是我们工作中常用到的,每个软件都有自身的特点,如何在使用中的过程扬长避短,发挥各工具的最大优点是用户最关心的,通常用户在搜词过程中总是先在一个工具中搜索后,再到另外一个工具中进行搜索,这样的操作在不经意间增加了用户的工作量,降低了工作效率。
技术实现思路
本专利技术的目的是提供一种让用户在最短时间内和最简洁的方式下搜索词汇的方法和系统。为实现上述目的,本专利技术采用如下技术方案:一种网络搜词方法,该方法包括步骤:S1.建立与多个网站的链接;S2.获取用户提交的待搜索单词、查询条件以及网站信息;S3.将所述单词提交到用户指定的网站,等待返回结果,对所述返回结果进行编码;S4.根据HTML标签,截取所述返回结果中的解释内容,按设定的模式对所述解释内容进行拆分,并将拆分后的内容放入对应字符串数据集中汇总;S5.若用户继续指定对所述单词需进行搜索的网站,则返回步骤S3,否则执行步骤S6;-->S6.保存本次搜索的所有结果到解释数据集,并输出。其中,步骤S4进一步包括:S4.1对所述编码后的返回结果进行字符查找,根据HTML标签截取解释内容放入临时数组;S4.2将所述放入临时数组的解释内容按照HTML标签以分内容、分段、分行的模式进行打散处理,并将打散后的内容放入各自的临时数组;S4.3对所述打散的内容逐一按字符串进行去重检查,并添加到对应的字符串数据集中汇总。其中,所述指定网站为一个或多个。其中,步骤S3中若无返回结果,则返回步骤S2获取用户重新提交的网站信息,或重新提交的待搜索单词、查询条件以及网站信息。其中,所述步骤S4.1中根据HTML标识截取解释结果内容放入临时数组时要对所述内容进行正则处理,剔除网页格式的代码,只将解释内容放入所述临时数组。其中,所述步骤S4.2分内容中的内容为单词的词性、释义以及例句。其中,所述步骤S4.3中,若所述数据集中所述打散的内容的字符串不存在,则添加该字符串,若已存在,则不进行任何处理。一种网络搜词系统,该系统包括:链接模块,用于建立与多个网站的链接;获取模块,用于获取用户提交的待搜索单词、查询条件以及网站信息;输入模块,用于将所述单词提交到用户指定网站,对返回结果进行编码;拆分、汇总模块,根据HTML标签,截取所述返回结果中的解释内容,按设定的模式对所述解释内容进行拆分,并将拆分后的内容放入对应的字符串数据集中汇总;输出模块,用于保存一次搜索的所有结果到解释数据集,并输出。其中,所述拆分、汇总模块进一步包括:截取子模块,对所述编-->码后的返回结果进行字符查找,根据HTML标签截取解释内容放入临时数组;拆分子模块,将所述放入临时数组的解释内容按照HTML标签以分内容、分段、分行的模式进行打散处理,并将打散后的内容放入各自的临时数组;去重、汇总子模块,对所述打散的内容逐一按字符串进行去重检查,并添加到对应的结果字符串数据集中。附图说明图1为本专利技术的网络搜词方法流程图;图2为对解释内容进行拆分的流程图;图3为本专利技术的网络搜词系统构成框图。具体实施方式本专利技术提出的网络搜词方法及系统,结合附图和实施方式详细说明如下。如图1所示,本实施方式的网络搜词方法可一次从多个网站获取单词的解释内容,并分类,以最快的速度得到用户想要的结果,该方法包括步骤:S1.建立与多个网站的链接;S2.获取用户提交的待搜索单词、查询条件以及需进行查询的搜索网站信息;S3.将待搜索的单词提交到用户指定的网站,等待返回结果,对返回结果进行编码,若无返回结果,则返回步骤S2,获取用户重新提交的其他网站的信息,或重新提交的待搜索的其他单词、查询条件以及需搜索的网站的信息,并对返回结果进行编码,以便接下来要进行的处理;S4.根据HTML标签,截取返回结果中的解释内容,按设定的模式对解释内容进行拆分,并将拆分后的内容放入对应的字符串数据集中汇总;S5.若还需对单词进行其他网站的搜索,则返回步骤S3,否则执-->行步骤S6;S6.清理各临时数据组,保存本次搜索的所有结果到解释数据集,按照规定的排版格式将解释数据集中的结果显示输出。其中,如图2所示,步骤4进一步包括:S4.1对编码后的返回结果进行字符查找,根据HTML标签截取解释内容放入临时数组;S4.2将放入临时数组的解释内容按照HTML标签以分内容、分段、分行的模式进行打散处理,并将打散后的内容分别放入各自的临时数组,其中,分内容的内容指单词的词性、释义以及例句等;S4.3对逐一对打散后的内容按字符串进行去重检查,并添加到对应的结果字符串数据集中汇总,若结果字符串数据集中某一打散的内容的字符串不存在,则添加该字符串,若已存在,则不进行任何处理;其中,步骤S4.1中根据HTML标识截取解释结果内容放入临时数组时要对所述内容进行正则处理,剔除网页格式的代码,只将解释内容放入所述临时数组;如图3所示,本实施方式中的网络搜词系统,包括:链接模块,用于建立与多个网站的链接;获取模块,用于获取用户提交的待搜索单词、查询条件以及网站信息;输入模块,用于将待搜索的单词提交到用户指定网站,对返回结果进行编码;拆分、汇总模块,根据HTML标签,截取返回结果中的解释内容,按设定的模式对解释内容进行拆分,并将拆分后的内容放入对应的字符串数据集中汇总;输出模块,用于保存一次搜索的所有结果到解释数据集,并输出。其中,拆分、汇总模块进一步包括:截取子模块,对编码后的返回结果进行字符查找,根据HTML标签截取解释内容放入临时数组;拆分子模块,将放入临时数组的解释内容按照HTML标签以分内容、分段、分行的模式进行打散处理,并将打散后的内容放入各自的临时-->数组;去重、汇总子模块,对打散的内容逐一按字符串进行去重检查,并添加到对应的结果字符串数据集中。以上实施方式仅用于说明本专利技术,而并非对本专利技术的限制,有关
的普通技术人员,在不脱离本专利技术的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本专利技术的范畴,本专利技术的专利保护范围应由权利要求限定。-->本文档来自技高网...
【技术保护点】
一种网络搜词方法,其特征在于,该方法包括步骤: S1.建立与多个网站的链接; S2.获取用户提交的待搜索单词、查询条件以及网站信息; S3.将所述单词提交到用户指定的网站,等待返回结果,对所述返回结果进行编码; S4.根据HTML标签,截取所述返回结果中的解释内容,按设定的模式对所述解释内容进行拆分,并将拆分后的内容放入对应字符串数据集中汇总; S5.若用户继续指定对所述单词需进行搜索的网站,则返回步骤S3,否则执行步骤S6; S6.保存本次搜索的所有结果到解释数据集,并输出。
【技术特征摘要】
1、一种网络搜词方法,其特征在于,该方法包括步骤:S1.建立与多个网站的链接;S2.获取用户提交的待搜索单词、查询条件以及网站信息;S3.将所述单词提交到用户指定的网站,等待返回结果,对所述返回结果进行编码;S4.根据HTML标签,截取所述返回结果中的解释内容,按设定的模式对所述解释内容进行拆分,并将拆分后的内容放入对应字符串数据集中汇总;S5.若用户继续指定对所述单词需进行搜索的网站,则返回步骤S3,否则执行步骤S6;S6.保存本次搜索的所有结果到解释数据集,并输出。2、如权利要求1所述的网络搜词方法,其特征在于,步骤S4进一步包括:S4.1对所述编码后的返回结果进行字符查找,根据HTML标签截取解释内容放入临时数组;S4.2将所述放入临时数组的解释内容按照HTML标签以分内容、分段、分行的模式进行打散处理,并将打散后的内容放入各自的临时数组;S4.3对所述打散的内容逐一按字符串进行去重检查,并添加到对应的字符串数据集中汇总。3、如权利要求1所述的网络搜词方法,其特征在于,所述指定网站为一个或多个。4、如权利要求1所述的网络搜词方法,其特征在于,步骤S3中若无返回结果,则返回步骤S2获取用户重新提交的网站信息,或重新提交的待搜索单词、查询条件以及网站信息。5、如权利要求2所述的网络搜词方法,其特征在于,所述步骤S4.1中根据HTML标识截取解释...
【专利技术属性】
技术研发人员:何战涛,
申请(专利权)人:传神联合北京信息技术有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。