一种文案处理方法及设备技术

技术编号:18763787 阅读:167 留言:0更新日期:2018-08-25 10:29
本发明专利技术提供一种文案处理方法及设备,该方法包括:获得文案、以及包含文案来源标识词的输入词组;对所述输入词组进行分词处理,得到分词组;根据预置的常用词词库与所述分词组的比对结果,筛选出能完整组合成所述输入词组的常用词以及所述文案来源标识词;将所述文案中的所述文案来源标识词替换为预定符号。通过本发明专利技术的文案处理方法,可将文案的输入词组中所包含的文案来源标识词进行替换,并且在替换过程中避免输入词组中包含的常用词在文案中被替换,避免常用词被替换后文案信息不能被完全理解。

【技术实现步骤摘要】
一种文案处理方法及设备
本专利技术涉及数据处理技术,特别涉及一种文案处理方法及设备。
技术介绍
招标投标,是在市场经济条件下进行的大宗货物的买卖、工程建设项目有发包与承包,以及服务项目的采购与提供时,所采用的一种交易方式。在这种交易方式下,通常是由项目采购(包括货物的购买、工程的发包和服务的采购)的采购方作为招标方,通过发布招标公告或者向一定数量的特定供应商、承包商发出招标邀请等方式发出招标采购的信息,提出所需采购项目的性质及其数量、质量、技术要求,交货期、竣工期或提供服务的时间,以及其他供应商、承包商的资格要求等招标采购条件,表明将选择最能够满足采购要求的供应商、承包商与之签订采购合同的意向,由各有意提供采购所需货物、工程或服务的报价及其他响应招标要求的条件,参加投标竞争。经招标方对各投标者的报价及其他的条件进行审查比较后,从中择优选定中标者,并与其签订采购合同。建筑产品虽然牵涉到每一位民众,但它不像家电产品,民众可以自主行使购买和监督的权力,致使家电业必须以诚信经营为本,取信于民,才能获得市场份额。现实中建筑产品采购权集中在少数人手里(招标人、代理人、评标专家委员会)。由于建筑产品招投标的某些内容及过程需要保密,不便于社会监督,投标人易通过虚假信息而成功中标,公平性无法得到保障。因此招标人、代理人、评标专家委员会等在审核标书的过程中,需要持有公平公正的态度。一种保证公平公正的方式为将标书中显示表示其来源的信息信息替换。但标书中某些类型信息要被隐藏的同时,某些信息又要被公众可知,例如:如果要隐藏投标人信息,目前通常做法是输入投标人全称、简称,标书中所有投标人全称、简称对应字节被简单替换符同等替换,如一种替换方式为直接替换“A市张三混凝土有限公司”,则可以得到替换后的句子为“***…提供混凝土30吨给王五公司…在A市…张三公司在1月1日之前完成交付”其中透露公司名称的“张三公司”无法被替换掉。又如另一种替换方式为将“张三”进行替换,可以获得“A市***混凝土有限公司…提供混凝土30吨给王五公司…在A市…***公司在1月1日之前完成交付”,则“A市***混凝土有限公司”,可与另一经过替换处理的“A市***混凝土有限责任公司”或“A市***有限公司”形成区别,同样会暗示该公司的具体名称,因此都不可取。故要输入投标人标全称和简称等,才能完全隐藏投标人信息。
技术实现思路
本专利技术的目的一是提供一种文案处理方法,其具有将文案中的关键信息进行隐藏的优点。本专利技术的上述技术目的一是通过以下技术方案得以实现的:一种文案处理方法,所述方法包括:获得文案、以及包含文案来源标识词的输入词组;对所述输入词组进行分词处理,得到分词组;根据预置的常用词词库与所述分词组的比对结果,筛选出能完整组合成所述输入词组的常用词以及所述文案来源标识词;将所述文案中的所述文案来源标识词替换为预定符号。进一步的,所述对输入词组进行分词处理,获得分词组的方法为:统计输入词组的字数N,以输入词组的正序提取这一输入词组中字数大于等于2小于等于N的连续的词,组成所述分词组。进一步的,将所述分词组中的词判断为常用词的方法为:将分词组中的词与常用词词库中的词进行对比,若相同,则判断为常用词;所述分词组中除所述常用词以外的词为所述文案来源标识词。进一步的,在所述载入文案的过程中,将文案的名称替换为代号,并存储该文案的名称和其对应的代号。进一步的,在所述将文案中的文案来源标识词替换为预定符号后,根据存储的该文案的代号所对应的名称将代号重新替换为名称。本专利技术的目的二是提供一种文案处理方法,其具有将文案中的关键信息进行隐藏的优点。本专利技术的上述技术目的二是通过以下技术方案得以实现的:一种文案处理设备,包括:输入输出模组、存储器和处理器,所述输入输出模组用于获得文案、以及包含文案来源标识词的输入词组,所述处理器用于调取所述存储器中存储的指令集来进行如下处理:获得文案、以及包含文案来源标识词的输入词组;对所述输入词组进行分词处理,得到分词组;根据预置的常用词词库与所述分词组的比对结果,筛选出能完整组合成所述输入词组的常用词以及所述文案来源标识词;将所述文案中的所述文案来源标识词替换为预定符号。进一步的,所述处理器用于对输入词组进行分词处理,获得分词组,具体为:统计输入词组的字数N,以输入词组的正序提取这一输入词组中字数大于等于2小于等于N的连续的词,组成所述分词组。进一步的,所述存储器还用于存储常用词词库,所述处理器还用于将分词组中的词判断为常用词,具体为:将分词组中的词与存储器中存储的常用词词库中的词进行对比,若相同,则判断为常用词;所述分词组中除所述常用词以外的词为所述文案来源标识词。进一步的,所述处理器还用于:在输入输出模组载入文案的过程中,将文案的名称替换为代号,并存储该文案的名称和其对应的代号至存储器中。进一步的,所述处理器还用于:在处理器将文案中的文案来源标识词替换为预定符号后,根据存储器中的该文案的代号所对应的名称将代号重新替换为名称。综上所述,本专利技术具有以下有益效果:通过本专利技术的文案处理方法,可将文案的输入词组中所包含的文案来源标识词进行替换,并且在替换过程中避免输入词组中包含的常用词在文案中被替换,避免常用词被替换后文案信息不能被完全理解。附图说明图1是本专利技术实施例提供的一种文案处理方法的流程示意图;图2是本专利技术实施例提供的另一种文案处理方法的流程示意图;图3是本专利技术实施例提供的又一种文案处理方法的流程示意图;图4是本专利技术实施例提供的一种文案处理设备的架构示意图。附图标记:1、输入输出模组;2、存储器;3、处理器。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、设备、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。以下,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。文案,指具有文字、表格、图形等组成的电子文件,且文案具有名称。输入词组,指包含需要进行替换处理的分词的词句,在下文中,输入词组经过分词处理可获得分词组,分词组包括文案来源标识词和常用词。文案来源标识词,指在文案中需要被替换的词,以让阅读者不能获知文案的来源。常用词,指较为常用的词汇,可以是人为直接输入的词汇,这类词在文案中被替换,会导致读者无法本文档来自技高网
...

【技术保护点】
1.一种文案处理方法,其特征在于,所述方法包括:获得文案、以及包含文案来源标识词的输入词组;对所述输入词组进行分词处理,得到分词组;根据预置的常用词词库与所述分词组的比对结果,筛选出能完整组合成所述输入词组的常用词以及所述文案来源标识词;将所述文案中的所述文案来源标识词替换为预定符号。

【技术特征摘要】
1.一种文案处理方法,其特征在于,所述方法包括:获得文案、以及包含文案来源标识词的输入词组;对所述输入词组进行分词处理,得到分词组;根据预置的常用词词库与所述分词组的比对结果,筛选出能完整组合成所述输入词组的常用词以及所述文案来源标识词;将所述文案中的所述文案来源标识词替换为预定符号。2.根据权利要求1所述的一种文案处理方法,其特征在于,所述对输入词组进行分词处理,获得分词组的方法为:统计输入词组的字数N,以输入词组的正序提取这一输入词组中字数大于等于2小于等于N的连续的词,组成所述分词组。3.根据权利要求2所述的一种文案处理方法,其特征在于,将所述分词组中的词判断为常用词的方法为:将分词组中的词与常用词词库中的词进行对比,若相同,则判断为常用词;所述分词组中除所述常用词以外的词为所述文案来源标识词。4.根据权利要求1所述的一种文案处理方法,其特征在于,在所述载入文案的过程中,将文案的名称替换为代号,并存储该文案的名称和其对应的代号。5.根据权利要求4所述的一种文案处理方法,其特征在于,在所述将文案中的文案来源标识词替换为预定符号后,根据存储的该文案的代号所对应的名称将代号重新替换为名称。6.一种文案处理设备,包括:输入输出模组、存储器和处理器,所述输入输出模组用于获得文案、以及包含文案来源标识词的输入词组,所述处理器用于调取所述存储器中存储的...

【专利技术属性】
技术研发人员:欧芝平
申请(专利权)人:四川欧瑞建设集团有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1