一种文档中指定单词查找方法、装置、设备以及存储介质制造方法及图纸

技术编号:20916672 阅读:20 留言:0更新日期:2019-04-20 09:43
本发明专利技术公开了一种文档中指定单词查找方法,通过逐行读取文件数据;当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串;将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。本申请通过将跨行单词拼接为完整的单词,在拼接后再进行指定单词的匹配查找,从而不会漏掉跨行的字符串,使得查找过程更加高效,查找结果也更加准确。此外,本申请还提供了一种具有上述技术效果的文档中指定单词查找装置、设备以及计算机可读存储介质。

A method, device, device and storage medium for finding specified words in documents

The invention discloses a method for searching specified words in documents by reading file data line by line; when judging that the end of the current read file line is a hyphen, splicing the end character of the current read file line with the beginning character of the next line into a string; matching the generated cross-line string with the specified word; and outputting the specified word store if the match is successful Finding results in. By splicing cross-line words into complete words and matching the specified words after splicing, the application will not omit the cross-line strings, making the search process more efficient and the search results more accurate. In addition, the application also provides a word search device, device and computer readable storage medium specified in the document with the above technical effect.

【技术实现步骤摘要】
一种文档中指定单词查找方法、装置、设备以及存储介质
本专利技术涉及计算机
,特别是涉及一种文档中指定单词查找方法、装置、设备以及计算机可读存储介质。
技术介绍
现有技术大都采用逐行读文件去匹配字符串的方法。实现方式具体为:逐行读文件,将文件内容每一行读到字符串中,逐个将获得的字符串存入一个列表,读完文件,将列表中的内容逐个拿出来逐个进行判断,如果指定单词存在于列表中,则生成查找存在的匹配结果,遍历完毕没有找到,则生成查找不存在的匹配结果。然而,现有实现方式对于单词跨行存在的情况,即出现在一行末尾下一行开头的字符串,往往搜索不到。例如,“protection”出现在一行的末尾,由于换行被分为上一行末尾的“pro-”以及下一行开头的“tection”。由于“pro”不等于“protection”,在进行特定单词查找时会漏掉存在于第一行结尾没有写完,第二行开头又继续写的单词,导致查找准确性不高。还比如,文件内容为:……ofactioncustomizerstodefinethedetailedbehaviorofInstallAny-whereactionsandapplyrulestoanaction。要查找指定单词InstallAnywhere是否在文件中时,单独匹配第一行或者第二行,都不能获得完全匹配,故而匹配结果是不存在,没有此字符串。
技术实现思路
本专利技术的目的是提供一种文档中指定单词查找方法、装置、设备以及计算机可读存储介质,以解决现有指定单词查找方法准确性不高的问题。为解决上述技术问题,本专利技术提供一种文档中指定单词查找方法,包括:逐行读取文件数据;当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串;将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。可选地,所述将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串包括:将当前所读的文件行与下一行的全部字符拼接成为一个字符串。可选地,所述将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果包括:将当前所读的文件行与下一行的全部字符拼接成的字符串保存至预设列表中;遍历所述预设列表中的所有字符串,将所述字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。可选地,所述当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串包括:当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的字符串保存到变量str中,置标志位为1,将下一行读取到的字符串添加到变量str中当前所读的文件行的字符串的后面。可选地,在所述将当前所读的文件行与下一行的全部字符拼接成的字符串保存至预设列表中之后还包括:将变量str中保存的字符串清空。本专利技术还提供了一种文档中指定单词查找装置,包括:数据读取模块,用于逐行读取文件数据;拼接模块,用于当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串;查找模块,用于将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。可选地,所述拼接模块用于:将当前所读的文件行与下一行的全部字符拼接成为一个字符串。可选地,所述查找模块用于:将当前所读的文件行与下一行的全部字符拼接成的字符串保存至预设列表中;遍历所述预设列表中的所有字符串,将所述字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。本专利技术还提供了一种文档中指定单词查找设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述任一种所述文档中指定单词查找方法的步骤。本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种所述文档中指定单词查找方法的步骤。本专利技术所提供的文档中指定单词查找方法,通过逐行读取文件数据;当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串;将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。本申请通过将跨行单词拼接为完整的单词,在拼接后再进行指定单词的匹配查找,从而不会漏掉跨行的字符串,使得查找过程更加高效,查找结果也更加准确。此外,本申请还提供了一种具有上述技术效果的文档中指定单词查找装置、设备以及计算机可读存储介质。附图说明为了更清楚的说明本专利技术实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术所提供的文档中指定单词查找方法的一种具体实施方式的流程图;图2为本专利技术所提供的文档中指定单词查找方法的另一种具体实施方式的流程图;图3为本专利技术所提供的文档中指定单词查找方法的另一种具体实施方式的示意图;图4为本专利技术所提供的文档中指定单词查找方法的又一种具体实施方式的示意图;图5为本专利技术实施例提供的文档中指定单词查找装置的结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术所提供的文档中指定单词查找方法的一种具体实施方式的流程图如图1所示,该方法具体包括:步骤S101:逐行读取文件数据;步骤S102:当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串;对读取到的每一行的文件数据进行分析,如果判断当前所读的文件行末尾去掉换行符之后,最后一个字符是英文连字符“-”,则说明存在于该行结尾的单词跨两行书写,分别跨上一行的结尾和下一行的开头。将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串这一步骤的一种实施方式可以为:将当前所读的文件行的字符串与下一行的全部字符串拼接为一个字符串,以使该字符串中跨行的单词成为一个完整的单词,从而进行单词匹配。另一种实施方式可以为:仅截取当前所读的文件行最后一个空格后面连字符前面的字符串,即本行最后一个单词,与下一行第一个空格前的单词拼接,成为一个完整的单词,与指定单词进行匹配。步骤S103:将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。将生成的跨行字符串与指定单词进行匹配。在匹配成功时,可以输出指定单词存在的查找结果。若匹配不成功,则输出指定单词不存在的查找的结果。本专利技术所提供的文档中指定单词查找方法,通过逐行读取文件数据;当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串;将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。本申请通过将跨行单词拼接为完整的单词,在拼接后再进行指定单词的匹配查本文档来自技高网
...

【技术保护点】
1.一种文档中指定单词查找方法,其特征在于,包括:逐行读取文件数据;当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串;将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。

【技术特征摘要】
1.一种文档中指定单词查找方法,其特征在于,包括:逐行读取文件数据;当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串;将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。2.如权利要求1所述的文档中指定单词查找方法,其特征在于,所述将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串包括:将当前所读的文件行与下一行的全部字符拼接成为一个字符串。3.如权利要求2所述的文档中指定单词查找方法,其特征在于,所述将生成的跨行字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果包括:将当前所读的文件行与下一行的全部字符拼接成的字符串保存至预设列表中;遍历所述预设列表中的所有字符串,将所述字符串与指定单词进行匹配;如果匹配成功,则输出指定单词存在的查找结果。4.如权利要求3所述的文档中指定单词查找方法,其特征在于,所述当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的末尾字符与下一行的开头字符拼接为一个字符串包括:当判断当前所读的文件行末尾为连字符时,将当前所读的文件行的字符串保存到变量str中,置标志位为1,将下一行读取到的字符串添加到变量str中当前所读的文件行的字符串的后面。5.如权利要求4所述的文档中指定单词查找方法,其...

【专利技术属性】
技术研发人员:王雁群高隆林王立建陈森
申请(专利权)人:山东中创软件商用中间件股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1