电子缩略书生成方法、电子设备及计算机存储介质技术

技术编号:18115182 阅读:33 留言:0更新日期:2018-06-03 08:19
本发明专利技术公开了一种电子缩略书生成方法、电子设备及计算机存储介质。其中方法包括:确定电子书中包含的各词语,以及各词语的词性;依据用户操作确定目标缩略规则;采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书。实现了在不影响原文理解、原文信息量以及阅读通顺程度或影响甚微的情况下,通过自动对词语进行删减的缩略书生成方式,无需后期人工的介入,节省人工成本的投入,提高缩略书的生成效率;同时能够使不同的用户根据不同场景下的时间安排,细粒度的选择篇幅长度合适的缩略书,根据用于的选择随时随地的生成符合用户需求的电子缩略书供用户阅读,提高用户的阅读体验。

【技术实现步骤摘要】
电子缩略书生成方法、电子设备及计算机存储介质
本专利技术涉及计算机
,具体涉及一种电子缩略书生成方法、电子设备及计算机存储介质。
技术介绍
随着现代人生活节奏的加快,越来越多的人们无法花费大量时间对几十万字的电子书进行通读,而选择用较短的时间对书籍提炼后的有价值的信息进行阅读。目前,对于电子书内容的提炼包括两种方式:其一是,通过视频或音频录制的方式,由主讲人用较短的时间来讲完一本书中的内容,例如十分钟;其二为,通过文字的形式,将电子书浓缩成用户仅用半小时或一小时等不等的时间来完成阅读的缩略书籍,例如知乎的一小时阅读项目、芝士阅读和拿铁阅读等。然而,现有技术都是通过后期人为的方式去总结、概括和提炼书籍中的内容,导致书籍被提炼后的内容融合了提炼者的思想,主观性较强,影响用户本人对书籍内容的理解。此外,由于人工提炼的方式时间消耗较大,人工成本较高,因此通常对于一本书籍提炼后的缩略书只有一个版本,无法使不同的用户根据不同场景下的时间安排,细粒度的选择篇幅长度合适的缩略书进行阅读,降低了用户的阅读体验。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的电子缩略书生成方法、电子设备及计算机存储介质。根据本专利技术的一个方面,提供了一种电子缩略书生成方法,用于向用户提供符合用户需求的电子缩略书,该方法包括:确定电子书中包含的各词语,以及各词语的词性;依据用户操作确定目标缩略规则;采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书。根据本专利技术的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行以下操作:确定电子书中包含的各词语,以及各词语的词性;依据用户操作确定目标缩略规则;采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书。根据本专利技术的又一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行以下操作:确定电子书中包含的各词语,以及各词语的词性;依据用户操作确定目标缩略规则;采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书。根据本专利技术的电子缩略书生成方法、电子设备及计算机存储介质,提供了一种电子缩略书的自动生成方式,可以根据电子书中各词语及其词性,采用指定的目标缩略规则,自动地对电子书中包含的各词语作删减处理得到缩略书。实现了在不影响原文理解、原文信息量以及阅读通顺程度或影响甚微的情况下,通过自动对词语进行删减的缩略书生成方式,无需后期人工的介入,节省人工成本的投入,提高缩略书的生成效率;同时能够使不同的用户根据不同场景下的时间安排,细粒度的选择篇幅长度合适的缩略书,根据用于的选择随时随地的生成符合用户需求的电子缩略书供用户阅读,提高用户的阅读体验。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例一提供的电子缩略书生成方法的流程图;图2示出了本专利技术实施例二提供的电子缩略书生成方法的流程图;图3示出了本专利技术实施例三提供的确定目标缩略规则所适用的电子书内容的流程图;图4示出了根据本专利技术实施例五提供的一种电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。实施例一图1示出了本专利技术实施例一提供的电子缩略书生成方法的流程图,用于根据用户需求自动生成电子缩略书。如图1所示,该方法包括以下步骤:步骤S101,确定电子书中包含的各词语,以及各词语的词性。在本专利技术中,电子书是指从已植入或下载数字化文字、图片、声音、影像等讯息内容的集存储和显示终端于一体的阅读器中可以查阅到的将文字、图片、声音、影像等讯息内容数字化的出版物。在本实施例中,电子书主要是指以文字或图片的形式来显示某书籍对应的数字化的出版物。由于电子书是纸质书籍对应的数字化的出版物,以及网络出版或发布的数字化的书籍等文字表现形式,因此电子书主要由数以万计的词语组合而成。相应的,电子缩略书生成的首要步骤是对电子书中的内容进行分词处理,将完整的电子书内容拆分成数以万计的独立存在的词语,进而得到电子书中的所有词语,并对各个词语进行词性的分析。具体的,词性指以词的特点作为划分词类的根据。现代汉语的词可以分为两类14种词性。从组合和聚合关系来说,一个词类是指:在一个语言中,众多具有相同句法功能、能在同样的组合位置中出现的词,聚合在一起形成的范畴。现代汉语的词的词性分类包括两类,即实词和虚词。实词是指词语中含有实际意义的词,能够单独充当句子成分,即有词汇意义和语法意义的词。虚词泛指没有完整意义的词汇,但是是有语法意义或功能的词,且必须依附于实词或语句才可以表示语法意义,但不能单独成句和不能单独作语法成分。其中,实词进一步包括:名词、动词、形容词、区别词、代词、数词和量词共七种实词词性,虚词进一步包括:副词、介词、连词、助词、语气词、拟声词和叹词共七种虚词词性。而不同种类的词性又可能存在进一步的分类,例如副词是指在句子中表示行为或状态特征的词,用以修饰动词、形容词、其他副词或全句,表示时间、地点、程度、方式等概念,因此副词可分为:程度副词、范围副词、时间/频率副词、肯定副词、否定副词、情态/方式副词、语气副词、地点副词等。在本步骤中,可以采用词性标注的方法对电子书中的各个词语进行词性的识别和标注。词性标注,又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词的具体词性的过程。例如,可以采用隐马尔科夫模型来训练词性标注模型,实现自动识别并标注电子书中各个词语的词性。示例性的,对于一个完整的句子“教授正在教授自然语言处理课程”,确定其中的各词语以及各词语的词性。首先对该句子进行分词处理,可以得到分词结果为:“教授”、“正在”、“教授”、“自然语言”、“处理”和“课程”共六个词语。其次对分词结果进行词性标注,可以得到标注结果为:第一个“教授”一词为名词,“正在”一词为副词,第二个“教授”一词为动词,“自然语言”一词为名词,“处理”一词为名词,“课程”一词为名词。步骤S102,依据用户操作确定目标缩略规则。在本专利技术中,用户可以根据自己的时间安排以及篇幅喜好等需求对电子书界面进行操作,例如篇幅长度为原文的比例值、篇幅缩减级别、缩减范围、指定某部分内容的具体缩减程度以及指本文档来自技高网...
电子缩略书生成方法、电子设备及计算机存储介质

【技术保护点】
一种电子缩略书生成方法,包括:确定电子书中包含的各词语,以及各词语的词性;依据用户操作确定目标缩略规则;采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书。

【技术特征摘要】
1.一种电子缩略书生成方法,包括:确定电子书中包含的各词语,以及各词语的词性;依据用户操作确定目标缩略规则;采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书。2.根据权利要求1所述的方法,其中,确定电子书中包含的各词语,以及各词语的词性,包括:对所述电子书进行分词得到所述电子书中包含的各词语;依据预先基于隐马尔科夫模型训练生成的词性标注模型对所述电子书中包含的各词语进行词性标注。3.根据权利要求1所述的方法,其中,依据用户操作确定目标缩略规则,包括:依据用户操作确定目标缩略等级;依据预先确定的候选缩略等级与候选缩略规则之间的关联关系确定所述目标缩略等级所关联的目标缩略规则。4.根据权利要求3所述的方法,其中,依据预先确定的候选缩略等级与候选缩略规则之间的关联关系确定所述目标缩略等级所关联的目标缩略规则,包括:若所述目标缩略等级是第一候选缩略等级,则确定所述目标缩略规则是删除属于形容词的词语;若所述目标缩略等级是第二候选缩略等级,则确定所述目标缩略规则是删除属于形容词、数词、量词和代词的词语;若所述目标缩略等级是第三候选缩略等级,则确定所述目标缩略规则是删除属于形容词、数词、量词、代词、副词、介词、助词、叹词和拟声词的词语;若所述目标缩略等级是第四候选缩略等级,则针对所述电子书中的每一句子,删除该句子中除主谓宾语以外的其他词语。5.根据权利要求1所述的方法,其中,采用所述目标缩略规则,依据所述电子书中包含的各词语的词性,对所述电子书中包含的各词语作删减处理得到缩略书,包括:依据用户操作确定所述目标...

【专利技术属性】
技术研发人员:郑志伟车红茜张倩孔鹏杨喜娜索珊珊
申请(专利权)人:掌阅科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1