【技术实现步骤摘要】
基于人工智能的电子图书检索方法及系统
[0001]本专利技术涉及人工智能
,具体而言,涉及一种基于人工智能的电子图书检索方法及系统。
技术介绍
[0002]电子图书与传统书籍拥有许多相同的特点:包含一定的信息量,比如有一定的文字量、彩页;其编排按照传统书籍的格式以适应读者的阅读习惯;通过被阅读而传递信息等。但是电子图书作为一种新形式的书籍,又拥有许多与传统书籍不同的或者是传统书籍不具备的特点:通过电子计算机设备读取并通过屏幕显示出来;具备图文声像结合的优点;可检索;可复制;有更高的性价比;有更大的信息含量;有更多样的发行渠道等。随着电子图书的不断普及,针对电子图书的高效准确检索是其中一个需求。
技术实现思路
[0003]第一方面,本专利技术实施例提供了一种基于人工智能的电子图书检索方法,应用于电子图书检索系统,所述方法包括:
[0004]获取待进行检索的电子书文本以及所述电子书文本对应的文本词频分布;
[0005]将所述电子书文本对应的文本词频分布和所述电子书文本输入完成调试的电子图书检索模型中,经所述电子图书检索模型处理得到所述电子书文本对应的全局文本语义关系网,以及所述全局文本语义关系网中的每一文本语义单元所对应的待进行检索的电子书文本中若干个候选概要文本集分别对应的目标概要文本的确定性指数;
[0006]依据所述全局文本语义关系网中的每一文本语义单元所对应的待进行检索的电子书文本中若干个候选概要文本集分别对应的待进行检索的电子书文本中目标概要文本的确定性指数、以及所 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能的电子图书检索方法,其特征在于,应用于电子图书检索系统,所述方法包括:获取待进行检索的电子书文本以及所述电子书文本对应的文本词频分布;将所述电子书文本对应的文本词频分布和所述电子书文本输入完成调试的电子图书检索模型中,经所述电子图书检索模型处理得到所述电子书文本对应的全局文本语义关系网,以及所述全局文本语义关系网中的每一文本语义单元所对应的待进行检索的电子书文本中若干个候选概要文本集分别对应的目标概要文本的确定性指数;依据所述全局文本语义关系网中的每一文本语义单元所对应的待进行检索的电子书文本中若干个候选概要文本集分别对应的待进行检索的电子书文本中目标概要文本的确定性指数、以及所述全局文本语义关系网中每一文本语义单元所对应的若干个候选概要文本集之间的内容牵涉权重,从所述若干个候选概要文本集中确定最少一个目标概要文本的待处理概要文本集,其中不同目标概要文本的待处理概要文本集之间的内容牵涉权重小于预设阈值;通过确定出的最少一个目标概要文本的待处理概要文本集、以及所述电子书文本对应的全局文本语义关系网,确定所述最少一个目标概要文本的捕捉窗口;利用所述捕捉窗口确定所述电子书文本的检索概要语义特征;通过所述检索概要语义特征对所述电子书文本进行检索处理。2.根据权利要求1所述的方法,其特征在于,所述电子图书检索模型的调试步骤包括:通过待调试的电子图书检索模型对电子书文本样例对应的文本词频分布进行语义挖掘,得到最少一个全局词频语义关系网,所述电子书文本样例中包括目标概要文本的先验注释;通过每个全局词频语义关系网,确定该全局词频语义关系网对应的文本语义可逆矩;利用所述电子图书检索模型根据各个全局词频语义关系网对应的文本语义可逆矩对所述电子书文本样例进行语义挖掘,得到所述电子书文本样例对应的全局文本语义关系网样例;根据所述电子书文本样例对应的全局文本语义关系网样例确定所述全局文本语义关系网样例中的每一文本语义单元所对应的电子书文本样例中的若干个候选概要文本集分别对应的目标概要文本的确定性指数;依据所述电子书文本样例的目标概要文本的先验注释、所述全局文本语义关系网样例中的每一文本语义单元所对应的电子书文本样例中的若干个候选概要文本集分别对应的目标概要文本的确定性指数、以及所述全局文本语义关系网样例对应的语义描述变量,优化所述电子图书检索模型的模型配置参量。3.根据权利要求2所述的方法,其特征在于,所述通过每个全局词频语义关系网,确定该全局词频语义关系网对应的文本语义可逆矩,包括:针对设定的若干个语义调整向量集合中的每个语义调整向量集合,将该全局词频语义关系网的词频语义向量分别与该语义调整向量集合中的若干个语义调整向量求积,得到该全局词频语义关系网对应的若干个词频语义调整向量;其中,所述语义调整向量集合中的语义调整向量用于对该全局词频语义关系网进行调整处理,同一语义调整向量集合中的不同语义调整向量对应的调整处理的策略相异,不同语义调整向量集合对应的调整处理的调
整权重不同;通过若干个语义调整向量集合中,每个语义调整向量集合对应的所述若干个词频语义调整向量,确定该全局词频语义关系网对应的文本语义可逆矩。4.根据权利要求3所述的方法,其特征在于,所述通过若干个语义调整向量集合中,每个语义调整向量集合对应的所述若干个词频语义调整向量,确定该全局词频语义关系网对应的文本语义可逆矩,包括:对于每个语义调整向量集合对应的所述若干个词频语义调整向量中的一个词频语义调整向量中的每个特征标签,确定所述若干个词频语义调整向量中在该特征标签处的语义描述变量的语义描述均值变量,将得到的语义描述均值变量作为该语义调整向量集合对应的过渡文本语义可逆矩在该特征标签处的语义描述变量;将若干个语义调整向量集合分别对应的所述过渡文本语义可逆矩进行强化求和,得到所述文本语义可逆矩。5.根据权利要求2所述的方法,其特征在于,所述通过待调试的电子图书检索模型对电子书文本样例对应的文本词频分布进行语义挖掘,得到最少一个全局词频语义关系网,包括:利用所述电子图书检索模型对所述文本词频分布进行X阶可逆处理,得到所述文本词频分布的第X个全局词频语义关系网;X为不小于1的正整数;所述通过每个全局词频语义关系网,确定该全局词频语义关系网对应的文本语义可逆矩,包括:依据所述第X个全局词频语义关系网,确定所述第X个全局词频语义关系网对应的文本语义可逆矩;所述利用所述电子图书检索模型根据各个全局词频语义关系网对应的文本语义可逆矩对所述电子书文本样例进行语义挖掘,得到所述电子书文本样例对应的全局文本语义关系网样例,包括:利用所述电子图书检索模型对所述电子书文本样例进行可逆处理,得到所述电子书文本样例对应的原始全局文本语义关系网;依据所述第X个全局词频语义关系网对应的文本语义可逆矩,对所述电子书文本样例对应的第X个全局文本语义关系网样例进行语义挖掘,得到所述电子书文本样例对应的第X+1个全局文本语义关系网样例;其中,第X个全局文本语义关系网样例,为通过第X
‑
1个全局词频语义关系网对应的文本语义可逆矩,对第X
‑
1个全局文本语义关系网样例进行语...
【专利技术属性】
技术研发人员:李伟,
申请(专利权)人:南通众览在线数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。