基于人工智能的电子图书检索方法及系统技术方案

技术编号:38750868 阅读:15 留言:0更新日期:2023-09-09 11:17
本发明专利技术是关于基于人工智能的电子图书检索方法及系统,在对电子书文本进行检索处理之前,能够利用完成调试的电子图书检索模型进行最少一个目标概要文本的捕捉窗口的确定,鉴于电子图书检索模型在处理时能够减少因为词频数据存在差异造成的目标概要文本的内容量的变化对语义挖掘造成的影响,进而提高鉴别电子书文本样例的关键内容(目标概要文本)和电子书文本样例的非关键内容(非目标概要文本)的精度,因此所确定出的捕捉窗口能够尽可能完整准确地涵盖对应的目标概要文本,这样能够快速、精准确确定出电子书文本所对应的检索概要语义特征,从而基于检索概要语义特征实现精准高效的检索处理。高效的检索处理。高效的检索处理。

【技术实现步骤摘要】
基于人工智能的电子图书检索方法及系统


[0001]本专利技术涉及人工智能
,具体而言,涉及一种基于人工智能的电子图书检索方法及系统。

技术介绍

[0002]电子图书与传统书籍拥有许多相同的特点:包含一定的信息量,比如有一定的文字量、彩页;其编排按照传统书籍的格式以适应读者的阅读习惯;通过被阅读而传递信息等。但是电子图书作为一种新形式的书籍,又拥有许多与传统书籍不同的或者是传统书籍不具备的特点:通过电子计算机设备读取并通过屏幕显示出来;具备图文声像结合的优点;可检索;可复制;有更高的性价比;有更大的信息含量;有更多样的发行渠道等。随着电子图书的不断普及,针对电子图书的高效准确检索是其中一个需求。

技术实现思路

[0003]第一方面,本专利技术实施例提供了一种基于人工智能的电子图书检索方法,应用于电子图书检索系统,所述方法包括:
[0004]获取待进行检索的电子书文本以及所述电子书文本对应的文本词频分布;
[0005]将所述电子书文本对应的文本词频分布和所述电子书文本输入完成调试的电子图书检索模型中,经所述电子图书检索模型处理得到所述电子书文本对应的全局文本语义关系网,以及所述全局文本语义关系网中的每一文本语义单元所对应的待进行检索的电子书文本中若干个候选概要文本集分别对应的目标概要文本的确定性指数;
[0006]依据所述全局文本语义关系网中的每一文本语义单元所对应的待进行检索的电子书文本中若干个候选概要文本集分别对应的待进行检索的电子书文本中目标概要文本的确定性指数、以及所述全局文本语义关系网中每一文本语义单元所对应的若干个候选概要文本集之间的内容牵涉权重,从所述若干个候选概要文本集中确定最少一个目标概要文本的待处理概要文本集,其中不同目标概要文本的待处理概要文本集之间的内容牵涉权重小于预设阈值;
[0007]通过确定出的最少一个目标概要文本的待处理概要文本集、以及所述电子书文本对应的全局文本语义关系网,确定所述最少一个目标概要文本的捕捉窗口;
[0008]利用所述捕捉窗口确定所述电子书文本的检索概要语义特征;通过所述检索概要语义特征对所述电子书文本进行检索处理。
[0009]如此设计,在对电子书文本进行检索处理之前,能够利用完成调试的电子图书检索模型进行最少一个目标概要文本的捕捉窗口的确定,鉴于电子图书检索模型在处理时能够减少因为词频数据存在差异造成的目标概要文本的内容量的变化对语义挖掘造成的影响,进而提高鉴别电子书文本样例的关键内容(目标概要文本)和电子书文本样例的非关键内容(非目标概要文本)的精度,因此所确定出的捕捉窗口能够尽可能完整准确地涵盖对应的目标概要文本,这样能够快速、精准确确定出电子书文本所对应的检索概要语义特征,从
而基于检索概要语义特征实现精准高效的检索处理。
[0010]在一些可能的设计思路下,所述电子图书检索模型的调试步骤包括:
[0011]通过待调试的电子图书检索模型对电子书文本样例对应的文本词频分布进行语义挖掘,得到最少一个全局词频语义关系网,所述电子书文本样例中包括目标概要文本的先验注释;
[0012]通过每个全局词频语义关系网,确定该全局词频语义关系网对应的文本语义可逆矩;
[0013]利用所述电子图书检索模型根据各个全局词频语义关系网对应的文本语义可逆矩对所述电子书文本样例进行语义挖掘,得到所述电子书文本样例对应的全局文本语义关系网样例;
[0014]根据所述电子书文本样例对应的全局文本语义关系网样例确定所述全局文本语义关系网样例中的每一文本语义单元所对应的电子书文本样例中的若干个候选概要文本集分别对应的目标概要文本的确定性指数;
[0015]依据所述电子书文本样例的目标概要文本的先验注释、所述全局文本语义关系网样例中的每一文本语义单元所对应的电子书文本样例中的若干个候选概要文本集分别对应的目标概要文本的确定性指数、以及所述全局文本语义关系网样例对应的语义描述变量,优化所述电子图书检索模型的模型配置参量。
[0016]如此设计,采用如上思路调试得到的电子图书检索模型,可以根据由文本词频分布得到的若干个全局词频语义关系网确定出若干个文本语义可逆矩,根据各个文本语义可逆矩对电子书文本样例进行语义挖掘,由于不同的文本语义可逆矩中包含了电子书文本样例中的目标概要文本的词频数据,基于此,根据各个文本语义可逆矩对电子书文本样例进行语义挖掘时会结合电子书文本样例中的目标概要文本的词频数据进行语义挖掘,以减少因为词频数据存在差异造成的目标概要文本的内容量的变化对语义挖掘造成的影响,进而提高鉴别电子书文本样例的关键内容(目标概要文本)和电子书文本样例的非关键内容(非目标概要文本)的精度,提升了目标概要文本的捕捉提炼准确性和可靠性,从而为之后的检索处理提供准确可靠的分析依据。
[0017]在一些可能的设计思路下,所述通过每个全局词频语义关系网,确定该全局词频语义关系网对应的文本语义可逆矩,包括:
[0018]针对设定的若干个语义调整向量集合中的每个语义调整向量集合,将该全局词频语义关系网的词频语义向量分别与该语义调整向量集合中的若干个语义调整向量求积,得到该全局词频语义关系网对应的若干个词频语义调整向量;其中,所述语义调整向量集合中的语义调整向量用于对该全局词频语义关系网进行调整处理,同一语义调整向量集合中的不同语义调整向量对应的调整处理的策略相异,不同语义调整向量集合对应的调整处理的调整权重不同;
[0019]通过若干个语义调整向量集合中,每个语义调整向量集合对应的所述若干个词频语义调整向量,确定该全局词频语义关系网对应的文本语义可逆矩。
[0020]在一些可能的设计思路下,所述通过若干个语义调整向量集合中,每个语义调整向量集合对应的所述若干个词频语义调整向量,确定该全局词频语义关系网对应的文本语义可逆矩,包括:
[0021]对于每个语义调整向量集合对应的所述若干个词频语义调整向量中的一个词频语义调整向量中的每个特征标签,确定所述若干个词频语义调整向量中在该特征标签处的语义描述变量的语义描述均值变量,将得到的语义描述均值变量作为该语义调整向量集合对应的过渡文本语义可逆矩在该特征标签处的语义描述变量;
[0022]将若干个语义调整向量集合分别对应的所述过渡文本语义可逆矩进行强化求和,得到所述文本语义可逆矩。
[0023]如此设计,通过语义调整向量集合中的语义调整向量更新全局文本语义关系网的词频语义向量调整的策略和调整权重,在将过渡文本语义可逆矩进行强化求和,得到文本语义可逆矩之后,可以理解为先更新可逆块的位置,然后再与电子书文本样例求积,从而实现对于电子书文本样例的语义挖掘,这样能够鉴别电子书文本样例中的关键内容(目标概要文本)和非关键内容(非目标概要文本);另外,通过语义调整向量更新全局文本语义关系网的词频语义向量的调整权重,可以实现对于可逆块大小的更新,由此调试得到的电子图书检索模型,能够匹配不同类型的电子书文本,自适应调整可逆块的大小。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的电子图书检索方法,其特征在于,应用于电子图书检索系统,所述方法包括:获取待进行检索的电子书文本以及所述电子书文本对应的文本词频分布;将所述电子书文本对应的文本词频分布和所述电子书文本输入完成调试的电子图书检索模型中,经所述电子图书检索模型处理得到所述电子书文本对应的全局文本语义关系网,以及所述全局文本语义关系网中的每一文本语义单元所对应的待进行检索的电子书文本中若干个候选概要文本集分别对应的目标概要文本的确定性指数;依据所述全局文本语义关系网中的每一文本语义单元所对应的待进行检索的电子书文本中若干个候选概要文本集分别对应的待进行检索的电子书文本中目标概要文本的确定性指数、以及所述全局文本语义关系网中每一文本语义单元所对应的若干个候选概要文本集之间的内容牵涉权重,从所述若干个候选概要文本集中确定最少一个目标概要文本的待处理概要文本集,其中不同目标概要文本的待处理概要文本集之间的内容牵涉权重小于预设阈值;通过确定出的最少一个目标概要文本的待处理概要文本集、以及所述电子书文本对应的全局文本语义关系网,确定所述最少一个目标概要文本的捕捉窗口;利用所述捕捉窗口确定所述电子书文本的检索概要语义特征;通过所述检索概要语义特征对所述电子书文本进行检索处理。2.根据权利要求1所述的方法,其特征在于,所述电子图书检索模型的调试步骤包括:通过待调试的电子图书检索模型对电子书文本样例对应的文本词频分布进行语义挖掘,得到最少一个全局词频语义关系网,所述电子书文本样例中包括目标概要文本的先验注释;通过每个全局词频语义关系网,确定该全局词频语义关系网对应的文本语义可逆矩;利用所述电子图书检索模型根据各个全局词频语义关系网对应的文本语义可逆矩对所述电子书文本样例进行语义挖掘,得到所述电子书文本样例对应的全局文本语义关系网样例;根据所述电子书文本样例对应的全局文本语义关系网样例确定所述全局文本语义关系网样例中的每一文本语义单元所对应的电子书文本样例中的若干个候选概要文本集分别对应的目标概要文本的确定性指数;依据所述电子书文本样例的目标概要文本的先验注释、所述全局文本语义关系网样例中的每一文本语义单元所对应的电子书文本样例中的若干个候选概要文本集分别对应的目标概要文本的确定性指数、以及所述全局文本语义关系网样例对应的语义描述变量,优化所述电子图书检索模型的模型配置参量。3.根据权利要求2所述的方法,其特征在于,所述通过每个全局词频语义关系网,确定该全局词频语义关系网对应的文本语义可逆矩,包括:针对设定的若干个语义调整向量集合中的每个语义调整向量集合,将该全局词频语义关系网的词频语义向量分别与该语义调整向量集合中的若干个语义调整向量求积,得到该全局词频语义关系网对应的若干个词频语义调整向量;其中,所述语义调整向量集合中的语义调整向量用于对该全局词频语义关系网进行调整处理,同一语义调整向量集合中的不同语义调整向量对应的调整处理的策略相异,不同语义调整向量集合对应的调整处理的调
整权重不同;通过若干个语义调整向量集合中,每个语义调整向量集合对应的所述若干个词频语义调整向量,确定该全局词频语义关系网对应的文本语义可逆矩。4.根据权利要求3所述的方法,其特征在于,所述通过若干个语义调整向量集合中,每个语义调整向量集合对应的所述若干个词频语义调整向量,确定该全局词频语义关系网对应的文本语义可逆矩,包括:对于每个语义调整向量集合对应的所述若干个词频语义调整向量中的一个词频语义调整向量中的每个特征标签,确定所述若干个词频语义调整向量中在该特征标签处的语义描述变量的语义描述均值变量,将得到的语义描述均值变量作为该语义调整向量集合对应的过渡文本语义可逆矩在该特征标签处的语义描述变量;将若干个语义调整向量集合分别对应的所述过渡文本语义可逆矩进行强化求和,得到所述文本语义可逆矩。5.根据权利要求2所述的方法,其特征在于,所述通过待调试的电子图书检索模型对电子书文本样例对应的文本词频分布进行语义挖掘,得到最少一个全局词频语义关系网,包括:利用所述电子图书检索模型对所述文本词频分布进行X阶可逆处理,得到所述文本词频分布的第X个全局词频语义关系网;X为不小于1的正整数;所述通过每个全局词频语义关系网,确定该全局词频语义关系网对应的文本语义可逆矩,包括:依据所述第X个全局词频语义关系网,确定所述第X个全局词频语义关系网对应的文本语义可逆矩;所述利用所述电子图书检索模型根据各个全局词频语义关系网对应的文本语义可逆矩对所述电子书文本样例进行语义挖掘,得到所述电子书文本样例对应的全局文本语义关系网样例,包括:利用所述电子图书检索模型对所述电子书文本样例进行可逆处理,得到所述电子书文本样例对应的原始全局文本语义关系网;依据所述第X个全局词频语义关系网对应的文本语义可逆矩,对所述电子书文本样例对应的第X个全局文本语义关系网样例进行语义挖掘,得到所述电子书文本样例对应的第X+1个全局文本语义关系网样例;其中,第X个全局文本语义关系网样例,为通过第X

1个全局词频语义关系网对应的文本语义可逆矩,对第X

1个全局文本语义关系网样例进行语...

【专利技术属性】
技术研发人员:李伟
申请(专利权)人:南通众览在线数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1